Read/Search this Article
Abstract
本論文では, 単語間の意味距離を文脈依存的に計算する手法を提案する. 各単言吾は, 英語辞書から抽出された多次元ベクトルとして, 意味空間と呼ばれるベクトル空間における点に写像される. 文脈から独立した意味距離は, このベクトル間の距離として計算すればよい. 文脈に依存した意味距離は「意味空間のスケール変換」によって計算する. 文脈の手がかりとして単語(キーワードなど)の集合が与えられると, この単語集合が均整のとれた分布を持つように, 意味空間の各次元のスケールを拡大・縮小する. このスケール変換によって, 意味空間における任意の2単語間の距離は与えられた単語集合の意味的な分布に依存した値となる. 先行テキストに基づく後続単語の予測によって本手法を評価した結果, 本手法が先行テキストの文脈をよくとらえていることを確かめた.
This paper proposes a computationally feasible method for measuring context-sensitive semantic distance between words. The distance is computed by adaptive scaling of a semantic space. In the semantic space, each word in the vocabulary is represented by a multidimensional vector which is extracted from an English dictionary. Given a word set C which specifies a context, each dimension of the semantic space is scaled up or down according to the distribution of C in the semantic space. In the semantic space thus transformed, distance between words becomes dependent on the semantic distribution of C. An evaluation through a word prediction task shows that the proposed measurement successfully extracts the context of a text.
Journal
- Transactions of Information Processing Society of Japan [List of Volumes]
-
Transactions of Information Processing Society of Japan 38(3), 482-489, 1997-03-15 [Table of Contents]
Information Processing Society of Japan (IPSJ)