冗長語・言い直し等を含む発話のための未知語処理を用いた音声認識システムの比較評価  [in Japanese] Comparison of Continuous Speech Recognition Systems with Unknown Word Processing for Speech Disfluencies  [in Japanese]

Search this Article

Author(s)

Abstract

自然な発話の頑健な音声理解のために, サブワード系列照合に基づく未知語処理をone pass型または文節ラティスを介するラティスパージング型の連続音声認識システムに適用する手法を提案する. サブワード単位のモデルに基づく未知語処理法は, 文音声認識に適用した場合に処理量がかなり増加するが, 未知語照合を他の照合処理と独立に行うことによって効率的な処理を実現する. 本論文では, 文音声認識の評価実験に基づいて, 未知語処理の有効性の確認と解析法の違いによる比較評価を行っている. その結果, 音節系列の照合に基づく未知語処理は, 解析法の違いによらず間投詞や言い直しの区間の音響スコアの推定において有効であり, 音響モデルの精度が良い場合に特に顕著な効果が示された. また, 助詞誤り等を無視した文理解性能によって最適なパラメータを決定した結果として, 文節スポッティングベースの認識方式では, 言語制約の下での音響モデルの照合と探索を統合したone pass型の認識方式と同等以上の性能を得た. しかし, 助詞誤りなどを考慮した文節や文単位の認識精度においてはone pass型が最も高く, 処理時間においても優位な結果が示された. 結果的に, one Pass型とラティスパージング型の代表的なシステムにおいて文中の冗長語・言い直し等を未知語として処理した場合, 単語パープレキシティが約40の読み上げによる擬似的な自然な発話に対して約80%の文理解率を得た.

Journal

  • The Transactions of the Institute of Electronics,Information and Communication Engineers.

    The Transactions of the Institute of Electronics,Information and Communication Engineers. 00080(00010), pp.2615-2625, 1997-10-25

    The Institute of Electronics, Information and Communication Engineers

References:  26

Cited by:  33

Codes

  • NII Article ID (NAID)
    110003227120
  • NII NACSIS-CAT ID (NCID)
    AN1007132X
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09151923
  • NDL Article ID
    4323294
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-1853
  • Data Source
    CJP  CJPref  NDL  NII-ELS 
Page Top