素片接続型日本語テキスト音声合成における音素単位とダイフォン単位に基づく素片選択  [in Japanese] A Segment Selection Algorithm for Japanese Concatenative Speech Synthesis Based on Both Phoneme Unit and Diphone Unit  [in Japanese]

Access this Article

Search this Article

Author(s)

Abstract

本論文では,日本語テキスト音声合成(TTS: Text-To-Speech)における新たな素片選択法を提案する.日本語では,母音の無声化を除くとCV(C: 子音,V: 母音)とVから音節が構成されるため,合成単位としてCV単位がよく用いられる.しかし,波形接続型のTTSにおいてCV単位を用いて音声を合成すると,VからVへの接続によりしばしば不連続感が生じる.V-V接続を防ぐためにより長い単位(CV*単位や可変長単位)がこれまでに提案されているが,V-V接続の問題はまだ解決されていない.そこで,V-V接続により生じる不連続感を低減する手法として,音素単位とダイフォン単位に基づいた新たな素片選択法を提案する.提案法では,音素境界における接続だけでなく,母音中心における接続も考慮して素片選択が行われる.評価実験結果から,提案法は音素単位に基づいた従来法と比較し,より自然性の高い音声を合成できることが明らかになった.

Journal

  • The Transactions of the Institute of Electronics,Information and Communication Engineers.

    The Transactions of the Institute of Electronics,Information and Communication Engineers. 85(12), 1760-1770, 2002-12-01

    The Institute of Electronics, Information and Communication Engineers

References:  17

Cited by:  16

Codes

  • NII Article ID (NAID)
    110003207126
  • NII NACSIS-CAT ID (NCID)
    AA11340957
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09151923
  • NDL Article ID
    6373007
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-1853
  • Data Source
    CJP  CJPref  NDL  NII-ELS  IR 
Page Top