二項事後分布に基づく N-gram 言語モデルの Back-off 平滑化
書誌事項
- タイトル別名
-
- Back-off Method for N-gram Smoothing based on Binomial Posteriori Distribution
この論文をさがす
抄録
N-gram言語モデルは、自然音声言語を取り扱うための有力な手法の一つであるが信頼できるパラメータ推定のために、膨大な音声言語コーパスを必要とするという問題点があった。このため、疎(スパース)なデータからn-gram確率を推定する種々の手法が提案されている。Katzは学習コーパス中に出現しないn-gramの確率を(n-1)-gram確率から推定するback-off平滑の考え方を提案した。Katzの定式化はTuringの標本分布推定に基づくものであるが、状況によっては推定が不安定になることがある。本論文では、このback-off平滑法をKatzとは別の観点から理論的に再定式化することを試みる。二項事後確率分布の継承関係から導かれる新しいback-off平滑法は、より簡単な計算によって、希少標本からの安定な確率推定を実現する。
収録刊行物
-
- 情報処理学会研究報告. SLP, 音声言語情報処理
-
情報処理学会研究報告. SLP, 音声言語情報処理 9 87-92, 1995-12-14
一般社団法人情報処理学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1572824502050939648
-
- NII論文ID
- 110002917017
-
- NII書誌ID
- AN10442647
-
- ISSN
- 09196072
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles