言語コーパスからの語の共起性の推定

書誌事項

タイトル別名
  • 自然言語 言語コーパスからの語の共起性の推定
  • シゼン ゲンゴ ゲンゴ コーパス カラ ノ ゴ ノ キョウキセイ ノ スイテイ
  • Estimation of Words' Cooccurrency from Corpus
  • 自然言語

この論文をさがす

抄録

語の共起性は自然言語処理における基本的な知識の1つであり,これを利用して,自然言語文の統語的曖昧さや多義語の語義の曖昧さを解消することができる.本論文では,構文解析済みの言語コーパスから得られる共起データを基にして,語の共起性を推定する手法を提案する.係る語を実ベクトル(ワードベクトル)に対応させ,これを説明変量とする重回帰モデルにより語の共起性を推定する.通常の重回帰分析と異なり,説明変量であるワードベクトルも同時に学習することが本手法の特徴である.

Words' Cooccurrency is one of the basic knowledge in Natural Language Processing, and it is used for syntactic disambiguation and word sense disambiguation. This paper proposes a new method for estimating words' cooccurrency with a syntactically analized corpus based on the multiple regression model. Independent variables of this model correspond to a satellite word (an independent word). Unlike the ordinary multiple regression analysis, the independent variables are also parameters of this model.

収録刊行物

参考文献 (12)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ