書誌事項
- タイトル別名
-
- スペクトル センケイ シャゾウ ニ ヨル タイイキ セイゲン オンセイ ノ コウタイイキカ
- Generation of Broadband Speech from Narrowband Speech Based on Linear Mapping
この論文をさがす
抄録
本論文では,スペクトル線形写像を用いて帯域制限された音声から広帯域音声を生成する方法について提案している.本方法はLPC分析合成を基本とし,まず入力音声から声道情報(スペクトル包絡)と音源情報(残差波形)を抽出し,声道情報は線形写像により,また音源情報は非線形処理を施すことで広域化する.最後に,この両者からLPC合成により広帯域化音声を作成している.線形写像によるスペクトル包絡の広帯域化は,スペクトル空間をいくつかの部分空間に分割し,各部分空間ごとの変換行列により狭帯域スペクトルから広帯域スペクトルへと変換する.変換行列は,変換後のスペクトルと目標となる広帯域スペクトルとの間に平均2乗誤差を最小化するように学習用音声を用いて推定される.実験では,本手法のほかにコードブック写像及びニューラルネットを用いる方法についてスペクトルひずみに関して比較した結果,線形写像による方法は他の2手法に劣らない性能が得られることが確認できた.また主観評価実験によっても,帯域感を付与する効果が確認できた.
収録刊行物
-
- 電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理
-
電子情報通信学会論文誌. D-II, 情報・システム, II-パターン処理 83-D-2 (11), 2246-2254, 2000-11
電子情報通信学会
- Tweet
詳細情報
-
- CRID
- 1050287673805517696
-
- NII論文ID
- 110003183835
-
- NII書誌ID
- AA11340957
-
- HANDLE
- 10228/00008138
-
- NDL書誌ID
- 5642586
-
- ISSN
- 09151923
-
- 本文言語コード
- ja
-
- 資料種別
- journal article
-
- データソース種別
-
- IRDB
- NDL
- CiNii Articles