Forward-Backwardアルゴリズムに基づくテキストコーパスからの擬似単語抽出法

書誌事項

タイトル別名
  • Pseudo-word Extraction from Text Corpora Based on Forward-Backward Algorithm

この論文をさがす

抄録

文字認識・音声認識などの曖昧性を削減するために言語モデルの利用が有効であることは広く知られているが、特にn-gramなどの確率モデルは柔軟性に富む強力な言語モデルとして重要である。文字を単位としたn-gramの構成は簡単であるが、さらに強い制約を得るために単語などの文字列を単位としたモデルに拡張する際には、文字列の選択基準が問題となる。本論文では、n-gramモデルの構成に有用な文字列をテキストコーパスから抽出する問題を、HMM (隠れマルコフモデル) の学習に帰着させることにより解決できることを示す。

収録刊行物

詳細情報 詳細情報について

  • CRID
    1572543027276514560
  • NII論文ID
    110003260920
  • NII書誌ID
    AN10471452
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ