抄録
人間のような深い言語理解能力を工学的に実現することを妨げている1つの原因として,計算機で利用可能な大量の常識的知識をいかに構築するかという問題がある.本論文では,常識的知識のうち,因果関係に関する知識に着目し,大規模な電子化文書集合から因果関係知識を自動的に獲得する方法について論じる.論文では,まず,因果関係に立つ2つの出来事がそれぞれ行為であるか事態であるかに基づき,cause, effect, precond (ition), meansの4つの因果関係を定義した.接続標識「ため」を合む複文からこれら4つの因果関係への自動分類実験を行い,cause, precond, meansの各関係について,80%の再現率で95%以上の分類精度を達成した.また,effect関係については,30%の再現率で90%の分類精度を達成した.さらに,新聞記事1年分の文書集合に本手法を適用することにより,およそ27,000件を超える因果知識が獲得できる見積りを得た.
This paper reports the present results of our approach to the automatic knowledge acquisition of causal relations. We created a new typology of the causal relation-cause, effect, precond (ition) and means-mainly based on volitionality. Fromour experiments using a Japanese resultative connective tame, we achieved 80% recall with over 95% precision for the cause, precond and means relations, and 30% recall with 90% precision for the effect relation. The results indicate that over 27,000 instances of causal relations can be acquired from one year of Japanese newspaper articles.