話題の連続/不連続変化を考慮したトピックモデルに基づく音声認識  [in Japanese] Speech Recognition by Topic Models with Continuous/Discontinuous Topic Changes  [in Japanese]

Search this Article

Author(s)

    • 佐古 淳 SAKO Atsushi
    • 神戸大学大学院自然科学研究科 Graduate School of Science and Technology, Kobe University
    • 渡部 晋治 WATANABE Shinji
    • 日本電信電話株式会社NTTコミュニケーション科学基礎研究所 NTT Communication Science Laboratories, NTT Corporation
    • 堀 貴明 HORI Takaaki
    • 日本電信電話株式会社NTTコミュニケーション科学基礎研究所 NTT Communication Science Laboratories, NTT Corporation

Abstract

本稿では,話題の連続/不連続変化を考慮したトピックモデルを提案し,MIT講義音声コーパスを用いて行った評価実験について述べる.実環境においては,話者交代や話し方,話題の変化などにより音響的・言語的特徴が時々刻々と変化する.このような変化に対応するため,発話単位で環境適応を行う逐次追従型音声認識が注目されている.本研究では,言語的な変化に着目し,話題の連続的な変化を考慮するモデルとしてOnline Topic Modelを用いた言語モデル適応,及び話題の不連続な変化を考慮するモデルとしてTopic HMMを用いた言語モデル適応を提案する.評価実験により,これらのトピックモデルを用いることで単語誤り率(WER)を改善出来ることを確認した.また,刻々と変化する話題を追跡することで,認識結果全体を用いた言語モデルのバッチ適応よりも良好な結果を得ることが出来た.

In this paper, we propose topic models with continuous/discontinuous topic changes, and describe experiments using MIT Open Course Ware corpus. In a real environment, acoustic and language features vary momentarily depending on speakers, speaking styles or topic changes. To accommodate these changes, speech recognition with incremental tracking of changing environments has attracted attention. We propose a language model adaptation technique by Online Topic Model for continuous topic changes, and a technique by Topic HMM for discontinuous topic changes. The experimental results showed the improvements of Word Error Rate with these topic models. Moreover, the proposed methods outperformed the batch adaptation of language model using whole speech recognition results by tracking temporal changes of topics.

Journal

  • IEICE technical report

    IEICE technical report 108(338), 55-60, 2008-12-02

    The Institute of Electronics, Information and Communication Engineers

References:  17

Codes

  • NII Article ID (NAID)
    110007123332
  • NII NACSIS-CAT ID (NCID)
    AN10013221
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    09135685
  • NDL Article ID
    9763670
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-940
  • Data Source
    CJP  NDL  NII-ELS 
Page Top