Forward-Backwardアルゴリズムに基づくテキストコーパスからの擬似単語抽出法

森 大毅, 阿曽 弘具, 牧野 正三

書誌事項

タイトル別名

Pseudo-word Extraction from Text Corpora Based on Forward-Backward Algorithm

抄録

文字認識・音声認識などの曖昧性を削減するために言語モデルの利用が有効であることは広く知られているが、特にn-gramなどの確率モデルは柔軟性に富む強力な言語モデルとして重要である。文字を単位としたn-gramの構成は簡単であるが、さらに強い制約を得るために単語などの文字列を単位としたモデルに拡張する際には、文字列の選択基準が問題となる。本論文では、n-gramモデルの構成に有用な文字列をテキストコーパスから抽出する問題を、HMM (隠れマルコフモデル) の学習に帰着させることにより解決できることを示す。

収録刊行物

電子情報通信学会総合大会講演論文集

電子情報通信学会総合大会講演論文集 1997 (1), 91-, 1997-03-06

一般社団法人電子情報通信学会

詳細情報詳細情報について

CRID: 1572543027276514560

NII論文ID: 110003260920

NII書誌ID: AN10471452

本文言語コード: ja

データソース種別

CiNii Articles

Forward-Backwardアルゴリズムに基づくテキストコーパスからの擬似単語抽出法

書誌事項

この論文をさがす

抄録

収録刊行物

詳細情報詳細情報について

書き出し

問題の指摘

Forward-Backwardアルゴリズムに基づくテキストコーパスからの擬似単語抽出法

書誌事項

この論文をさがす

抄録

収録刊行物

詳細情報 詳細情報について

書き出し

問題の指摘

参加プロジェクトリスト

詳細情報詳細情報について