書誌事項
- タイトル別名
-
- Analysis of Cepstral Coefficient Variation Caused by F_0 Change and Its Application to Speech Processing
この論文をさがす
抄録
同一話者による同一母音音声内で観測される, F_0変化に伴うスペクトル変動の様子を, ケプストラムを媒介変数として分析・モデル化した。即ち, 各母音に対して, F_0変化前後のF_0値, 変化前後のデルタF_0 (F_0の時間方向の変化率) 及び, 変化前のケプストラム係数を用いて, 変化後のケプストラム係数の各次元を, 多重回帰分析により予測した。そして,「各パラメータ (説明変数) に対する回帰係数はゼロである」との仮説をたて, その棄却率により, 各変数の予測への貢献度を統計的に検定した。その結果,「変化後のF_0」に加えて,「変化後のデルタF_0」に対しても, その有効性が示された。次に, 本予測モデルの応用として, まず, ピッチ変換を伴う分析合成に対して本モデルを適用した。聴取実験の結果, ピッチを下げる場合において,「声が豊かになる」「声がより響く」などの効果が観測された。更にF_0変化に伴うケプストラム変動が音声認識に与える影響について, 母音認識の範疇で実験的に検証した。その結果, F_0変化に起因するケプストラム変動により認識率の低下が観測されたが, この認識誤りは, 本予測モデルを用いてF_0を正規化する (ケプストラムを補償する) ことで約90%低減され, 本予測モデルの有効性を示すことができた。
収録刊行物
-
- 電子情報通信学会技術研究報告. SP, 音声
-
電子情報通信学会技術研究報告. SP, 音声 97 (396), 57-63, 1997-11-21
一般社団法人電子情報通信学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1574231877083054208
-
- NII論文ID
- 110003296017
-
- NII書誌ID
- AN10013221
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles