三段論法的パターンに着目した解釈容易な仮説の生成規則獲得と順位付け

Bibliographic Information

Other Title
  • Generating and Ranking Interpretable Hypotheses Based on Syllogistic Patterns

Search this article

Abstract

生物医学文献は日々増大しており,個人がすべての情報を把握・利用することは現実的には難しい.専門家の知識でさえも生物医学の特定分野に限定されていることから,疾病や遺伝子といった概念間の重要な関係が,複数の文献から暗示されながらも,大量の情報に埋もれている可能性がある.このような潜在的な関係を発見する研究は,仮説発見と呼ばれる.本稿では,学術文献から抽出した関係の閉じた連鎖に注目し,仮説発見を行う新しい枠組みについて述べる.具体的には,関係の連鎖を構成する述語を同定し,これらの組合せを仮説生成のための潜在的な規則と見なす.そして,これらの規則によって自動生成された仮説について,学術文献から抽出した知識と照合することでその妥当性を検証する.妥当性が確認された仮説は,仮説の信頼性を推定するための回帰モデルの正例として用いる.そして,得られた回帰モデルの出力に基づき,新たに生成した仮説の順位付けを行う.提案する仮説発見の枠組みの有効性を評価するため,現実の生物医学文献を用いた実験を行ったところ,自動生成された仮説に妥当な仮説が含まれていること,また,回帰モデルの利用によって妥当な仮説がより上位に順位付けられることが確認できた.

The ever-growing literature in biomedicine makes it virtually impossible for individuals to grasp all the information relevant to their interests. Since even experts' knowledge is limited, important associations among key biomedical concepts may remain unnoticed in the flood of information. Discovering those hidden associations is called hypothesis discovery. This paper reports our approach to this problem taking advantage of a triangular chain of relations extracted from published knowledge. We consider such chains of relations as implicit rules to generate potential hypotheses. The generated hypotheses are then compared with newer knowledge for assessing their validity and, if validated, they are served as positive examples for learning a regression model to rank hypotheses. This framework, called supervised hypothesis discovery, is tested on real-world knowledge from the biomedical literature to demonstrate its effectiveness.

Journal

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top