二項事後分布に基づく N-gram 言語モデルの Back-off 平滑化

書誌事項

タイトル別名
  • Back-off Method for N-gram Smoothing based on Binomial Posteriori Distribution

この論文をさがす

抄録

N-gram言語モデルは、自然音声言語を取り扱うための有力な手法の一つであるが信頼できるパラメータ推定のために、膨大な音声言語コーパスを必要とするという問題点があった。このため、疎(スパース)なデータからn-gram確率を推定する種々の手法が提案されている。Katzは学習コーパス中に出現しないn-gramの確率を(n-1)-gram確率から推定するback-off平滑の考え方を提案した。Katzの定式化はTuringの標本分布推定に基づくものであるが、状況によっては推定が不安定になることがある。本論文では、このback-off平滑法をKatzとは別の観点から理論的に再定式化することを試みる。二項事後確率分布の継承関係から導かれる新しいback-off平滑法は、より簡単な計算によって、希少標本からの安定な確率推定を実現する。

収録刊行物

被引用文献 (3)*注記

もっと見る

参考文献 (6)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1573950402206349440
  • NII論文ID
    110003278300
  • NII書誌ID
    AN10091225
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ