完全N部グラフ構造を用いた単語の多義性獲得 Word Sense Discrimination based on complete N-partite graph

この論文をさがす

著者

抄録

本論文ではテキスコーパスを解析して,この中に含まれる多義性を持つ単語を発見するための方法を提案する.この方法ではまずコーパス中に含まれる単語同士の関係を形態素解析などによって抽出しておき,この関係の集合からN部グラフを構成する.次にこのグラフ中に含まれる極大完全N部グラフを抽出し,ある単語が複数の分類(語義に対応する)に属することを許容するようなクラスタリングを行う.これにより多義性を持つ単語であれば複数のクラスタに含まれるようになるため,その所属するクラスタの数に注目することで多義性を獲得可能になる.この効果を確認するために行った実験では,約30万の用例からグラフを構成し,約3万の単語を対象にクラスタリングを行った結果531の候補を得た.そのうち20語が実際に多義語であった.

This paper presents a method for discovering polysemic words. This method is based on extracting of maximal complete N-partite graphs from a N-partite graph corresponding to relations of words in a corpus. Those relations are obtained by the morphological analysis etc. And the extracted graphs as clusters of words are merged on some conditions. Consequently, a certain word that is polysemous belongs to two or more classifications. We experimented in order to check this clustering eifect. As a result of the this experiment, we obtained the 531 polysemy candidates from the graph which includes 30,000 nodes (words) - 20 words were actually polysemies among those.

収録刊行物

  • 電子情報通信学会技術研究報告. AI, 人工知能と知識処理

    電子情報通信学会技術研究報告. AI, 人工知能と知識処理 103(103), 7-12, 2003-05-29

    一般社団法人電子情報通信学会

参考文献:  3件中 1-3件 を表示

各種コード

  • NII論文ID(NAID)
    110003176886
  • NII書誌ID(NCID)
    AN10013061
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    09135685
  • NDL 記事登録ID
    6619685
  • NDL 雑誌分類
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL 請求記号
    Z16-940
  • データ提供元
    CJP書誌  NDL  NII-ELS 
ページトップへ