音声の構造的表象を用いた雑音環境下における日本語母音系列の自動認識  [in Japanese] Automatic recognition of Japanese vowel sequences in noise using structural representation of speech  [in Japanese]

Search this Article

Author(s)

    • 村上 隆夫 MURAKAMI T.
    • 東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, University of Tokyo
    • 丸山 和孝 MARUYAMA K.
    • 東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, University of Tokyo
    • 広瀬 啓吉 HIROSE K.
    • 東京大学大学院情報理工学系研究科 Graduate School of Information Science and Technology, University of Tokyo

Abstract

音声には話者の声道形状の特性, 音響機器の特性などの非言語的特徴が不可避的に混入するが, 近年, これらを表現する次元を原理的に保有しない音響的普遍構造が提案されている.これは, 音声事象の物理的実体を捨象し, 関係のみを捉えることによって得られる音声の構造的表象である.本稿では, まず雑音環境下での音響的普遍構造に関する分析実験を行なった.その結果, 加算性雑音によって音響的普遍構造の形状が歪むものの, スペクトル高域成分を均一化させることで, 話者性がさらに消失されることが示された.次に, 加算性雑音下での日本語母音系列の認識実験を行ない, 雑音下で学習した学習話者1名の提案手法が, SS (Spectral Subtraction)及びCMN (Cepstral Mean Normalization)を用いた学習話者4,130名の従来手法を上回る結果が得られた.

Non-linguistic features such as vocal tract shapes and acoustic devices are inevitably involved in speech. Recently, a new representation of speech without any dimensions indicating the non-linguistic features was proposed. It discards the absolute properties of speech events and captures only the interrelations among them. In this paper, first, analysis experiments of the representation in noise were conducted. The results showed that though additive noise distorts the representation, it can remove much of speaker individuality by modifying the upper-band spectrum to be uniform. In the next, recognition experiments of Japanese vowel sequences in noise were done. The results showed that the proposed method trained from a single speaker in the matched condition can outperform the conventional method trained from 4,130 speakers with SS and CMN.

Journal

  • IEICE technical report

    IEICE technical report 105(496), 115-120, 2005-12-22

    The Institute of Electronics, Information and Communication Engineers

References:  14

Cited by:  2

Codes

  • NII Article ID (NAID)
    110003486931
  • NII NACSIS-CAT ID (NCID)
    AN10013221
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09135685
  • NDL Article ID
    7777742
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-940
  • Data Source
    CJP  CJPref  NDL  NII-ELS 
Page Top