音声対話システムにおける 簡略表現認識のための自動語彙拡張

書誌事項

タイトル別名
  • オンセイ タイワ システム ニ オケル カンリャク ヒョウゲン ニンシキ ノ タメ ノ ジドウゴイカクチョウ
  • Automatic Vocabulary Expansion for Abbreviation Recognition in Spoken Dialogue Systems

この論文をさがす

抄録

音声対話システムにおいて,ユーザはしばしば名称の一部を省略して「簡略表現」として発話する.その結果,音声認識誤りを招く.我々は,簡略表現を元の表現の単語列の一部の単語を省略した表現として定義し,簡略表現を確率とともに自動生成して音声認識辞書に自動追加する.簡略表現の取得には,日本語では複合語を分割する必要があるが,形態素解析器のみの分割では固有名詞は必ずしも正確に分割できない.さらに,多くの簡略表現を辞書に追加すると,語彙サイズの増加により音声認識精度が劣化する.我々は,これらの問題の解決方法として,単語分割や発音推定のシステムの自動分野適応と元の表現との平仮名編集距離で表した音韻的類似度に基づく簡略表現候補の取捨選択を提案する.提案手法によって生成した簡略表現候補を推定確率とともに語彙に自動追加した結果,既存辞書内の語のみを含む発話に対する文字正解精度と簡略表現を含む発話の文字正解精度の両方が向上した.この結果から,提案手法により人手による簡略表現の追加を上回る音声認識精度が実現できることを示した.

Users of spoken dialogue systems often abbreviate long expressions. This causeserrors in automatic speech recognition (ASR). To cope with this problem, we propose a method for generating abbreviation candidates with appropriateprobabilities and adding to the ASR dictionary. Two issues arise during thisvocabulary expansion. The first one is a low accuracy in word segmentation andpronunciation estimation for the expressions containing proper nouns. The secondis an ASR degradation caused by inappropriate abbreviation candidates added to thevocabulary. As an solution, we propose an automatic adaptation of a word segmenterand a pronunciation estimator and a filter for the candidates according to thephonetic distance to the original expressions. The experimental results showedthat our method improved the ASR accuracies for both the utterances containingabbreviated words and those containing words in the original expressions. Thisindicates that our method is capable of realizing a better ASR accuracy than amanual dictionary expansion.

収録刊行物

参考文献 (1)*注記

もっと見る

関連プロジェクト

もっと見る

詳細情報

問題の指摘

ページトップへ