文脈効果のモデル化とそれを用いたワードスポッティング

書誌事項

タイトル別名
  • ブンミャク コウカ ノ モデルカ ト ソレ オ モチイタ ワード スポッティン
  • Modeling of Contextual Effects and Its Application to Word Spotting

この論文をさがす

抄録

人間は聴覚の補正機構の働きにより, 調音結合のためになまけた音韻であっても正しく認識することができる. 本論文では, 聴覚の補正現象の一つとして考えられる文脈効果をモデル化し, モデルをワードスポッティングの前処理として用いる. モデルは近接したスペクトルピークの影響で人間の知覚するスペクトルが本来のスペクトルに比べ変化することを記述したものであり, 報告されている心理実験の結果をもとに, 最小分類誤り学習によりモデル化を行った. 次に, モデルの能力を検証するため, モデル適用によるホルマント軌跡の変化を調べた. その結果, モデルには調音結合のため連続音声中に現れる「なまけ」を回復する働きがあることがわかった. また, モデルを前処理として用いた母音認識実験を行い, その結果, モデルを用いることにより有意な認識率の向上が見られた. 更に, モデルを前処理として用いたワードスポッティング実験を行った. その結果, 単語検出率が1-6ポイント程度向上し, モデルが前処理として有効に機能することを示した.

identifier:https://dspace.jaist.ac.jp/dspace/handle/10119/4928

収録刊行物

被引用文献 (5)*注記

もっと見る

参考文献 (14)*注記

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ