話者性と発話交代を考慮した複数話者対話音声の認識  [in Japanese] Dictaion of Multiparty Conversation Considering Speaker Individuality and Turn Taking  [in Japanese]

Search this Article

Author(s)

Abstract

複雑な発話の交代を含む複数話者の音声を認識するアルゴリズムについて検討した.複数話者の対話認識を扱う場合, 認識システムは従来のように何を話したかだけでなく, 誰がどこまで話したかを知る必要がある.本研究ではそのような問題の解決手法として, 連続音声認識システムにおける言語モデルに発話交代の生じやすさの表現を含めるとともに, 各話者の声質を統計的モデルにより与えることで, 発話者と発話内容を同時並行的に推定するアルゴリズムを二つ提案した.テレビのスポーツニュースにおける対話部分を対象とした認識実験の結果, 発話内容の認識と各話者の発話区間の認識を別個に行う方法に比べ, 提案手法は発話内容の認識で最大29.5%, 発話者の認識で93.0%の誤りを改善できることが明らかになった.

Journal

  • The Transactions of the Institute of Electronics,Information and Communication Engineers.

    The Transactions of the Institute of Electronics,Information and Communication Engineers. 00083(00011), 2465-2472, 2000-11-25

    The Institute of Electronics, Information and Communication Engineers

References:  13

Cited by:  13

Codes

  • NII Article ID (NAID)
    110003183858
  • NII NACSIS-CAT ID (NCID)
    AA11340957
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09151923
  • NDL Article ID
    5643664
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-1853
  • Data Source
    CJP  CJPref  NDL  NII-ELS 
Page Top