早口合成音声の聴取実験によるテキスト音声合成の評価(視覚障害/聴覚障害/一般) Evaluation of text-to-speech synthesizers at fast speaking rates

この論文をさがす

著者

抄録

視覚障害者はスクリーンリーダなどの利用において, 速い話速でありながら聞き取りやすい合成音声を求めている.我々は, テキスト音声合成エンジンGalateaTalkと早口音声コーパスを用いて, 聞き取りやすい早口の合成音声を実現した.また, 4桁の乱数の読み上げ音声を聴取する実験を行い, 早口コーパスから学習した統計量を用いることで早口でかつ十分な音質の合成音声を得られること, 早口音声の聴取タスクにおいては短時間の訓練によって大きな学習効果が得られ, その効果は時間が経過しても持続すること, などの知見を得た.

The text-to-speech synthesizer that makes easy-to-listening voices at very fast speaking rates is expected to help visually impaired persons to acquire information effectively with screen reading softwares. We realized a fast and intelligible text-to-speech engine, using GalateaTalk synthesizer with the corpus with fast speaking rate. Our preliminary experiments of listening random 4 digits numbers showed that the statistical models trained with the fast speaking corpus was effective, and prominent learning effect was observed and the effect sustains for at least several days.

収録刊行物

  • 電子情報通信学会技術研究報告. WIT, 福祉情報工学

    電子情報通信学会技術研究報告. WIT, 福祉情報工学 105(66), 23-28, 2005-05-12

    一般社団法人電子情報通信学会

参考文献:  8件中 1-8件 を表示

被引用文献:  7件中 1-7件 を表示

各種コード

  • NII論文ID(NAID)
    10016435083
  • NII書誌ID(NCID)
    AA1155230X
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    09135685
  • NDL 記事登録ID
    7354777
  • NDL 雑誌分類
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL 請求記号
    Z16-940
  • データ提供元
    CJP書誌  CJP引用  NDL  NII-ELS 
ページトップへ