時間周波数表現による音信号混合法 ジカンシュウハスウヒョウゲンニヨルオトシンゴウコンゴウホウ

著者

    • 大脇, 渉
    • Wataru, Owaki

書誌事項

タイトル

時間周波数表現による音信号混合法

タイトル別名

ジカンシュウハスウヒョウゲンニヨルオトシンゴウコンゴウホウ

著者名

大脇, 渉

著者名

Wataru, Owaki

学位授与大学

電気通信大学

取得学位

博士(工学)

学位授与番号

甲第838号

学位授与年月日

2016-03-25

注記・抄録

本研究の目的は,第一に,音声とBGM(Background Music)を入力した時に音声を埋もれさせない音信号混合を実現することであり,第二に,音信号混合に時間周波数平面を用いることの有効性を示すことである.ここで,音声を埋もれさせない音信号混合を,第一に音声の内容の聴き取りを維持するものとし,第二に音声とBGMの音質を維持するものとする.本論文では,これらの目的を達成するために,時間周波数平面を用いた音信号混合法を3手法提案し,主観評価実験と時間周波数平面の観察により有効性を検討した.第2章で,音楽制作におけるミキシング処理についてまとめた.まず,ミキシング処理の目的が,音量,定位,音色のバランスを整え,主役をはっきりさせることにあるとまとめた.続いて,従来のミキシング処理として5例を例示し,従来のミキシング処理が時間領域処理と周波数領域処理の組み合わせによる時間周波数領域処理にとどまっていることを示した.その問題点として,時間領域処理と周波数領域処理の組み合わせでは実現できない時間周波数領域処理がある点を指摘した.第3章で,スマートミキサーについて述べた.スマートミキサーの定義は,時間周波数平面を用いた解析部をミキサーの内部に持ち,ミキシングを時間周波数平面上での重ね合わせとして実施する音信号のミキサーである.スマートミキサーとしての利点は,従来のミキシング処理では操作者に頼っていた聴感的な条件の判定をミキサー自体が担うことができ,さらに処理内容に反映できる点にある.また,スマートミキサーの実装について,ハードウェアとソフトウェアについて例示した.第4章で,調波構造に着目した手法を提案法Aとして提案した.この手法では,時間周波数平面上での調波構造のパターンを捉えるために,MPEG1Audioに含まれる聴覚心理モデルの純音判定を基準とした.この提案法Aについて,出力信号の時間周波数平面の観察と聴取実験による主観評価実験を行った.評価実験では,提案法Aの時間周波数平面上での処理量を時不変のイコライザとして近似する処理法を比較対象とした比較により,音声の聴き取りやすさについて,提案法Aの評価が上回る(ウィルコクソンの順位和検定の片側検定において,p=0.027)ことがわかった.第5章で,フォルマント構造に着目した手法を提案法Bとして提案した.この手法では,音声の母音の識別性を担うフォルマント構造を基準とした.フォルマント構造は調波構造と比較して時間周波数平面上での領域が狭いことから,聴きとりと音質を両立できると考えた.主観評価実験によって提案法Bの有効性を確かめるとともに,子音のうち特に歯擦音に聴き取りづらさが残ると考察した.第6章で,フォルマント構造と歯擦音に着目した手法を提案法Cとして提案した.この手法は,提案法Bによるフォルマント構造への処理を追加したものである.歯擦音への処理は,母音の周波数分布の特徴は3kHzよりも高い周波数帯域で顕著であることから,4kHzより高い周波数帯域において歯擦音のスペクトル遷移パターンを強調するものとした.同一女性話者による子音のみが異なる3種の音声信号を用いた実験により,提案法Cが適切に時間周波数平面上での歯擦音のパターンを強調できることを示した.第7章では,提案した3手法について比較と考察を行った.主観評価実験により,音声の聴きとりやすさと音質について提案法Cが最良であることがわかった.また,提案法Aの計算量が最小であり,提案法Cと同等の音声の聴きとりやすさの評価が得られることがわかった.一方,音声符号化形式を用いる場合では,提案法Bが有用である.第8章では,音信号混合法への時間周波数平面利用の有効性を確認した.提案法Aを周波数領域処理および時間領域処理として近似した手法を定義し,時間周波数平面での観察と客観的な数値指標で比較した.比較によって,音声の聴きとりやすさと音質の両方が提案法Aによってのみ達成できることを明らかにし,時間周波数領域での処理が有効であることを示した.以上より,本論文で提案する手法により,音声が埋もれない音信号混合を実現できることが示された.また,音信号混合に時間周波数平面を用いることの有効性も示された.

開始ページ : 1

終了ページ : 119

2015

26アクセス

各種コード

  • NII論文ID(NAID)
    500000971972
  • NII著者ID(NRID)
    • 8000001301949
    • 8000001301950
  • 本文言語コード
    • jpn
  • データ提供元
    • 機関リポジトリ
    • NDLデジタルコレクション
ページトップへ