E-027 情報量基準に基づく形態素解析用辞書の自動獲得方式(自然言語・音声・音楽,一般論文)

書誌事項

タイトル別名
  • E-027 Knowledge Acquisition for Morphological Lexicons based on Information Criteria

この論文をさがす

抄録

一般的に用いられる形態素解析器では、単語境界や品詞の推定を行う際に形態素解析用辞書が必要である。新しい単語に対応するため、それらの単語を辞書に追加しなければならないが、この作業は人手によって行わなければならないため、コストがかかることが大きな問題となっている。本論文では、情報量基準に基づく形態素解析用辞書の自動獲得方式を提案する。提案内容では、情報量基準に基づくモデル検定によって、単語境界及び品詞を自動推定する。これにより、人手を借りずに形態素解析用辞書を自動的に更新可能となる。

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ