概念間距離の定式化と既存電子化辞書との比較 Construction of Associative Concept Dictionary with Distance Information, and Comparison with Electronic Concept Dictionary

この論文にアクセスする

この論文をさがす

著者

    • 岡本 潤 OKAMOTO JUN
    • 慶應義塾大学 政策・メディア研究科 Graduate School of Media and Governance, Keio University
    • 石崎 俊 ISHIZAKI SHUN
    • 慶應義塾大学 政策・メディア研究科 Graduate School of Media and Governance, Keio University

抄録

コンピュータで言語処理を行なうとき, 構文解析や意味解析だけでなく人間が持つ一般的な知識や当該分野の背景的知識などの情報が必要になる. 本研究では, 人間の持つ知識を調べるため連想実験を行ない連想概念辞書として構造化した. 連想実験では, 小学生の学習基本語彙中の名詞を刺激語とし, 刺激語と「上位概念, 下位概念, 部分・材料, 属性, 類義語, 動作, 環境」の7つの課題から連想語を収集する. 従来の電子化辞書は木構造で表現され, 概念間の距離は階層の枝の数を辿る回数をもとに計算するなど構造に依存したものであったが, 連想概念辞書では連想実験から得られるパラメータをもとに, 線形計画法によって刺激語と連想語の距離を定量化した. また距離情報を用い, 「果物」「野菜」「家具」などの日常頻出語を中心として3~4階層をなす刺激語の連想語 (上位/下位概念) のつながりを調べた. この連想概念辞書とEDR電子化辞書, Word Netの比較を, 上位/下位階層をなす概念問の距離を求めることで行なった. 連想概念辞書とWord Netは, ある程度近い概念構造を持っており, 一方EDRは他の2つとは異なる特徴の構造を持っていることがわかった.

Background knowledge concerning to the input text is necessary when a computer tries to understand the text as well as syntactic and semantic information about it. This paper presents a method to construct an associative concept dictionary using large-scale association experiments. The dictionary includes semantic and contextual information about the stimulus words. In the association experiments, 100 stimulus words from the textbook of Japanese language used in elementary schools are given to subjects. They are requested to make association from the stimulus words about 7 tasks for each word. The tasks, for example, are higher level concepts, lower level concepts, actions, situations and so on. Conventional concept dictionaries have tree structures to express its hierarchical ones. Distances between concepts are calculated using number of links between the concepts. This paper shows a way to formulate the distance between concepts by using a linear programming method. Its parameters, especially frequency of the associated word and associated order of the word, are found significant for the distance calculation. By comparing the associative concept dictionary with EDR concept dictionary and WordNet using the distance information, it is found that the dictionary is more similar to WordNet than EDR.

収録刊行物

  • 自然言語処理 = Journal of natural language processing  

    自然言語処理 = Journal of natural language processing 8(4), 37-54, 2001-10-10 

    一般社団法人 言語処理学会

参考文献:  18件

参考文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

被引用文献:  13件

被引用文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

各種コード

  • NII論文ID(NAID)
    10021991600
  • NII書誌ID(NCID)
    AN10472659
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    13407619
  • NDL 記事登録ID
    5941308
  • NDL 雑誌分類
    ZU8(書誌・図書館・一般年鑑--図書館・ドキュメンテーション・文書館)
  • NDL 請求記号
    Z21-B168
  • データ提供元
    CJP書誌  CJP引用  NDL  J-STAGE 
ページトップへ