正弦波トラジェクトリに基づく楽器音中の音声強調  [in Japanese] Enhancing method for speech mixed with musical instrument sounds based on sinusoidal trajectories  [in Japanese]

Abstract

本稿では,音響信号における正弦波トラジェクトリの時間的特徴を用いた1チャネル音の音声強調手法について述べる。定常妨害音に対する手法はよく知られているが,音声,楽器音など複雑な時間・周波数構造を持った非定常妨害音に対応する手法は未確立であった。そこで,正弦波トラジェクトリの時間的特徴による音カテゴリモデルに基づく手法と,その改善としてトラジェクトリの類似性に基づくクラスタリングも加えて利用した二つの強調手法を提案する。連続数字音声と楽器演奏音の混合音データセットにより評価したところ,明瞭性に関係する狭帯域包絡線が復元され,セグメンタルSNRにおいて,混合比0dBの混合音サンプルに対して平均でそれぞれ+12.38dBと+13.62dBの改善を実現した。同様に,同じ混合音に対して音声強調を行った上で音声認識を試みたところ,混合比0dBで47.2%の認識誤り率の削減を実現した。楽器音のような長時間的な特徴を持つ加法性の妨害音に対して,正弦波トラジェクトリを用いた提案手法を適用することで有用な音声強調を実現することができた。

Journal

The Journal of the Acoustical Society of Japan   [List of Volumes]

The Journal of the Acoustical Society of Japan 65(5), 251-261, 2009-05-01  [Table of Contents]

The Acoustical Society of Japan (ASJ)

References:  29

You must have a user ID to see the references.If you already have a user ID, please click "Login" to access the info.New users can click "Sign Up" to register for an user ID.

Preview

Preview

Codes

  • NII Article ID (NAID) :
    110007226460
  • NII NACSIS-CAT ID (NCID) :
    AN00186234
  • Text Lang :
    JPN
  • Article Type :
    ART
  • ISSN :
    03694232
  • NDL Article ID :
    10300142
  • NDL Source Classification :
    ZM35(科学技術--物理学)
  • NDL Call No. :
    Z15-15
  • Databases :
    CJP  NDL  NII-ELS 

Export