早口合成音声の聴取実験によるテキスト音声合成の評価(視覚障害/聴覚障害/一般)  [in Japanese] Evaluation of text-to-speech synthesizers at fast speaking rates  [in Japanese]

Search this Article

Author(s)

Abstract

視覚障害者はスクリーンリーダなどの利用において, 速い話速でありながら聞き取りやすい合成音声を求めている.我々は, テキスト音声合成エンジンGalateaTalkと早口音声コーパスを用いて, 聞き取りやすい早口の合成音声を実現した.また, 4桁の乱数の読み上げ音声を聴取する実験を行い, 早口コーパスから学習した統計量を用いることで早口でかつ十分な音質の合成音声を得られること, 早口音声の聴取タスクにおいては短時間の訓練によって大きな学習効果が得られ, その効果は時間が経過しても持続すること, などの知見を得た.

The text-to-speech synthesizer that makes easy-to-listening voices at very fast speaking rates is expected to help visually impaired persons to acquire information effectively with screen reading softwares. We realized a fast and intelligible text-to-speech engine, using GalateaTalk synthesizer with the corpus with fast speaking rate. Our preliminary experiments of listening random 4 digits numbers showed that the statistical models trained with the fast speaking corpus was effective, and prominent learning effect was observed and the effect sustains for at least several days.

Journal

  • IEICE technical report. Welfare Information technology

    IEICE technical report. Welfare Information technology 105(66), 23-28, 2005-05-12

    The Institute of Electronics, Information and Communication Engineers

References:  8

Cited by:  7

Codes

  • NII Article ID (NAID)
    10016435083
  • NII NACSIS-CAT ID (NCID)
    AA1155230X
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09135685
  • NDL Article ID
    7354777
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-940
  • Data Source
    CJP  CJPref  NDL  NII-ELS 
Page Top