文脈依存的に単語間の意味距離を計算する一手法 A Context-sensitive Measurement of Semantic Word Distance

    • 小嶋 秀樹 KOZIMA HIDEKI
    • 郵政省通信総合研究所関西先端研究センター Kansai Advanced Research Center Communications Research Laboratory, MPT
    • 伊藤 昭 ITO AKIRA
    • 郵政省通信総合研究所関西先端研究センター Kansai Advanced Research Center Communications Research Laboratory, MPT

抄録

本論文では, 単語間の意味距離を文脈依存的に計算する手法を提案する. 各単言吾は, 英語辞書から抽出された多次元ベクトルとして, 意味空間と呼ばれるベクトル空間における点に写像される. 文脈から独立した意味距離は, このベクトル間の距離として計算すればよい. 文脈に依存した意味距離は「意味空間のスケール変換」によって計算する. 文脈の手がかりとして単語(キーワードなど)の集合が与えられると, この単語集合が均整のとれた分布を持つように, 意味空間の各次元のスケールを拡大・縮小する. このスケール変換によって, 意味空間における任意の2単語間の距離は与えられた単語集合の意味的な分布に依存した値となる. 先行テキストに基づく後続単語の予測によって本手法を評価した結果, 本手法が先行テキストの文脈をよくとらえていることを確かめた.

This paper proposes a computationally feasible method for measuring context-sensitive semantic distance between words. The distance is computed by adaptive scaling of a semantic space. In the semantic space, each word in the vocabulary is represented by a multidimensional vector which is extracted from an English dictionary. Given a word set C which specifies a context, each dimension of the semantic space is scaled up or down according to the distribution of C in the semantic space. In the semantic space thus transformed, distance between words becomes dependent on the semantic distribution of C. An evaluation through a word prediction task shows that the proposed measurement successfully extracts the context of a text.

収録刊行物

情報処理学会論文誌   [巻号一覧]

情報処理学会論文誌 38(3), 482-489, 1997-03-15  [この号の目次]

一般社団法人情報処理学会

参考文献:  14件

参考文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

被引用文献:  7件

被引用文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

プレビュー

プレビュー

各種コード

  • NII論文ID(NAID) :
    110002721500
  • NII書誌ID(NCID) :
    AN00116647
  • 本文言語コード :
    JPN
  • 資料種別 :
    REV
  • ISSN :
    03875806
  • NDL 記事登録ID :
    4159274
  • NDL 雑誌分類 :
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL 請求記号 :
    Z14-741
  • 収録DB :
    CJP書誌  CJP引用  NDL  NII-ELS