文脈依存的に単語間の意味距離を計算する一手法  [in Japanese] A Context-sensitive Measurement of Semantic Word Distance  [in Japanese]

    • 小嶋 秀樹 KOZIMA HIDEKI
    • 郵政省通信総合研究所関西先端研究センター Kansai Advanced Research Center Communications Research Laboratory, MPT
    • 伊藤 昭 ITO AKIRA
    • 郵政省通信総合研究所関西先端研究センター Kansai Advanced Research Center Communications Research Laboratory, MPT

Abstract

本論文では, 単語間の意味距離を文脈依存的に計算する手法を提案する. 各単言吾は, 英語辞書から抽出された多次元ベクトルとして, 意味空間と呼ばれるベクトル空間における点に写像される. 文脈から独立した意味距離は, このベクトル間の距離として計算すればよい. 文脈に依存した意味距離は「意味空間のスケール変換」によって計算する. 文脈の手がかりとして単語(キーワードなど)の集合が与えられると, この単語集合が均整のとれた分布を持つように, 意味空間の各次元のスケールを拡大・縮小する. このスケール変換によって, 意味空間における任意の2単語間の距離は与えられた単語集合の意味的な分布に依存した値となる. 先行テキストに基づく後続単語の予測によって本手法を評価した結果, 本手法が先行テキストの文脈をよくとらえていることを確かめた.

This paper proposes a computationally feasible method for measuring context-sensitive semantic distance between words. The distance is computed by adaptive scaling of a semantic space. In the semantic space, each word in the vocabulary is represented by a multidimensional vector which is extracted from an English dictionary. Given a word set C which specifies a context, each dimension of the semantic space is scaled up or down according to the distribution of C in the semantic space. In the semantic space thus transformed, distance between words becomes dependent on the semantic distribution of C. An evaluation through a word prediction task shows that the proposed measurement successfully extracts the context of a text.

Journal

Transactions of Information Processing Society of Japan   [List of Volumes]

Transactions of Information Processing Society of Japan 38(3), 482-489, 1997-03-15  [Table of Contents]

Information Processing Society of Japan (IPSJ)

References:  14

You must have a user ID to see the references.If you already have a user ID, please click "Login" to access the info.New users can click "Sign Up" to register for an user ID.

Cited by:  7

You must have a user ID to see the cited references.If you already have a user ID, please click "Login" to access the info.New users can click "Sign Up" to register for an user ID.

Preview

Preview

Codes

  • NII Article ID (NAID) :
    110002721500
  • NII NACSIS-CAT ID (NCID) :
    AN00116647
  • Text Lang :
    JPN
  • Article Type :
    Journal Article
  • ISSN :
    03875806
  • NDL Article ID :
    4159274
  • NDL Source Classification :
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL Call No. :
    Z14-741
  • Databases :
    CJP  CJPref  NDL  NII-ELS 

Export