語彙制約なし音声認識へのアクセント句境界検出の統合  [in Japanese] Integration of Prosodic Word Boundary Detection to Unlimited-Vocabulary Speech Recognition  [in Japanese]

Search this Article

Author(s)

Abstract

日本語連続音声認識の性能向上を目的として, 語彙(い)制約なし音声認識にアクセント句境界情報を利用し, その精度を向上させることを考える.具体的には, 言語モデルにモーラbigramを利用したタイプライタ型認識器に, アクセント句境界検出システムを統合した認識システムを提案し, それによる語彙制約なし音声認識性能の改善について報告する.統合システム内にはタイプライタ型認識器を2段階用意し, 前段の認識部では句境界を考慮しないモーラbigramによって入力音声区間全体を認識する.この認識結果から得られるモーラ境界情報と基本周波数(F_0)パターンを利用してアクセント句境界を検出し, その後, 段階の認識部において, 句境界をまたがるようなモーラ遷移を除いたモーラbigramによって入力音声を句ごとに再認識する.後段のモーラbigramのパープレキシティが前段のものに比べ抑制されることから認識性能の改善につながる.男性話者2名分, それぞれの話者について学習用データ450文, 実験用データ50文を用意し, 特定話者・不特定話者実験によるモーラ認識率の向上を調べたところ, 最高で約2%の性能向上を確認した.

Journal

  • The Transactions of the Institute of Electronics,Information and Communication Engineers.

    The Transactions of the Institute of Electronics,Information and Communication Engineers. 00083(00010), 1977-1985, 2000-10-20

    The Institute of Electronics, Information and Communication Engineers

References:  16

Cited by:  2

Codes

  • NII Article ID (NAID)
    110003183929
  • NII NACSIS-CAT ID (NCID)
    AA11340957
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09151923
  • NDL Article ID
    5641555
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-1853
  • Data Source
    CJP  CJPref  NDL  NII-ELS 
Page Top