Forward-Backwardアルゴリズムに基づくテキストコーパスからの擬似単語抽出法
書誌事項
- タイトル別名
-
- Pseudo-word Extraction from Text Corpora Based on Forward-Backward Algorithm
この論文をさがす
抄録
文字認識・音声認識などの曖昧性を削減するために言語モデルの利用が有効であることは広く知られているが、特にn-gramなどの確率モデルは柔軟性に富む強力な言語モデルとして重要である。文字を単位としたn-gramの構成は簡単であるが、さらに強い制約を得るために単語などの文字列を単位としたモデルに拡張する際には、文字列の選択基準が問題となる。本論文では、n-gramモデルの構成に有用な文字列をテキストコーパスから抽出する問題を、HMM (隠れマルコフモデル) の学習に帰着させることにより解決できることを示す。
収録刊行物
-
- 電子情報通信学会総合大会講演論文集
-
電子情報通信学会総合大会講演論文集 1997 (1), 91-, 1997-03-06
一般社団法人電子情報通信学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1572543027276514560
-
- NII論文ID
- 110003260920
-
- NII書誌ID
- AN10471452
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles