音素長伸縮による対話音声認識性能の向上手法 A spontaneous speech recognition method by adjusting phoneme lengths

この論文にアクセスする

この論文をさがす

著者

抄録

大語彙自由発話音声認識においては,発話者の話速の変動が大きな問題となる.本研究ではこの問題に対して,入力となる音声信号の音素長を時間軸において伸縮処理をすることで話速のばらつきを抑え,変動による影響を軽減する手法を提案する.本手法は,音素アライメント情報から各音素の伸縮率を決定し,音声の時間軸での圧縮・伸長手法であるPICOLAを応用することで音素長を伸縮するものである.本手法を用いた結果,自由発話特有の言い淀みなどによって引き延ばされた母音の圧縮によって,遅い発話の認識率を,70.1%から83.3%と大きく改善できることが確認された.Variation in speech rate is one of the largest problems in large vocabulary spontaneous speech recognition. In order to reduce effects of speech rate variation, we apply a method of adjusting phoneme lengths of input speech by signal processing. Using phoneme alignment information, this method decides the rate of extension/compression of each phoneme, and adjusts phoneme lengths using PICOLA(Pointer Interval Controlled OverLap and Add)'s algorithm. Using this method, we improved the recognition rate from 70.1\% to 83.3\% for slow speech. The improvements included vowel sounds elongated by hesitation or searching for next words, characteristics of spontaneous speech.

Variation in speech rate is one of the largest problems in large vocabulary spontaneous speech recognition. In order to reduce effects of speech rate variation, we apply a method of adjusting phoneme lengths of input speech by signal processing. Using phoneme alignment information, this method decides the rate of extension/compression of each phoneme, and adjusts phoneme lengths using PICOLA(Pointer Interval Controlled OverLap and Add)'s algorithm. Using this method, we improved the recognition rate from 70.1% to 83.3% for slow speech. The improvements included vowel sounds elongated by hesitation or searching for next words, characteristics of spontaneous speech.

収録刊行物

  • 情報処理学会研究報告音声言語情報処理(SLP)

    情報処理学会研究報告音声言語情報処理(SLP) 2005(103(2005-SLP-058)), 1-6, 2005-10-21

    一般社団法人情報処理学会

参考文献:  11件中 1-11件 を表示

被引用文献:  2件中 1-2件 を表示

各種コード

  • NII論文ID(NAID)
    110002952927
  • NII書誌ID(NCID)
    AN10442647
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • ISSN
    09196072
  • NDL 記事登録ID
    7688487
  • NDL 雑誌分類
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL 請求記号
    Z14-1121
  • データ提供元
    CJP書誌  CJP引用  NDL  NII-ELS  IPSJ 
ページトップへ