スペクトル線形写像による帯域制限音声の広帯域化

書誌事項

タイトル別名
  • スペクトル センケイ シャゾウ ニ ヨル タイイキ セイゲン オンセイ ノ コウタイイキカ
  • Generation of Broadband Speech from Narrowband Speech Based on Linear Mapping

この論文をさがす

抄録

本論文では,スペクトル線形写像を用いて帯域制限された音声から広帯域音声を生成する方法について提案している.本方法はLPC分析合成を基本とし,まず入力音声から声道情報(スペクトル包絡)と音源情報(残差波形)を抽出し,声道情報は線形写像により,また音源情報は非線形処理を施すことで広域化する.最後に,この両者からLPC合成により広帯域化音声を作成している.線形写像によるスペクトル包絡の広帯域化は,スペクトル空間をいくつかの部分空間に分割し,各部分空間ごとの変換行列により狭帯域スペクトルから広帯域スペクトルへと変換する.変換行列は,変換後のスペクトルと目標となる広帯域スペクトルとの間に平均2乗誤差を最小化するように学習用音声を用いて推定される.実験では,本手法のほかにコードブック写像及びニューラルネットを用いる方法についてスペクトルひずみに関して比較した結果,線形写像による方法は他の2手法に劣らない性能が得られることが確認できた.また主観評価実験によっても,帯域感を付与する効果が確認できた.

収録刊行物

被引用文献 (1)*注記

もっと見る

参考文献 (15)*注記

もっと見る

詳細情報

問題の指摘

ページトップへ