ニューラルネットワークを用いた自動採譜への試み

書誌事項

タイトル別名
  • Extracting a Score form Polytone using Four-layerd Feedforward Neural Networks

この論文をさがす

抄録

本研究は4層ニューラルネット[5]を用いて2種類の楽器の単音の混成音から各楽器の単音を識別、分離し、音高を同定することを目的とする。では、ニューラルネットを用いた楽音識別の研究がなされている。ところが、音高の識別まで試みようとすると、そのままではネットワークの規模が大きくなり、多くの学習時間を要し、また、汎化できなくなる可能性がある。そこで、本研究ではニューラルネットの規模を縮小するため入力に対して主成分分析12,61を用いるアプローチをとり、以下の手続きでクラスター分割を容易にさせると同時に、入力情報を圧縮する。1.テンプレー卜のための音声データをメモリ上で合成し、一つの音声データに対し、10個の任意に定めた解析点から256点フーリェ変換する。2.一つの音声データを1行256列の行列に対応させると、(10×音声データ数)行256列の行列ができる。これに対し主成分分析を行ない、256行256列の固有ベクトルQ得る。また、Qを寄与率の高い順に並び変えたベクトルQ'を作っておく。3.一定の累積寄与率を定めておき、Q'のうちその累積寄与率を実現するまでに影響するQ'の行数nだけコピーしたn行256列の行列Q"を作る。4.Q"に1行256列の音声データの転置(256行1列の行列)を掛けると、1行n列の行列を得る。これは音声データ群を主成分分析し、(1-累積寄与率)×100%の誤差範囲内におさまる第n主成分までの座標である。5.こうして得られたn次元の座標を入力とし(入力素子は、素子)、ニューラルネットワークを組む。この結果、例えば2章に示すように、通常なら256入力のところを2入力に削減することができた。本稿では、第2章で単一楽器の単音から音高を識別する実験を示し、3章で2つの楽器の単音の混成音から楽器を分離、音高を識別する実験を示す。なお、類似した実験例では、阿部[1]らがニューラルネットを用いて単音からの楽器識別を行ない、片寄[3]はアコースティックアルゴリズムコンパイラを用いて音源分離および採譜を行なっている。また、田村ら[4]は4層ニューラルネットを用いて雑音抑制の解析を行なっている。本研究ではまず、実際の楽器音を用いず、メモリ上で合成した波形を用いて実行可能性を検討した。メモリ上での合成、各係数での解析、ニューラルネットワークのプログラムはすべてSun SPARC Station1上でC言語を用いて作成した。

収録刊行物

詳細情報 詳細情報について

問題の指摘

ページトップへ