複数の言語モデルと言語理解モデルによるラピッドプロトタイピング向け音声理解 Speech Understanding Method for Rapid Prototyping Using Multiple Language Models and Multiple Language Understanding Models

この論文にアクセスする

この論文をさがす

著者

    • 勝丸 真樹 KATSUMARU MASAKI
    • 京都大学大学院 情報学研究科 知能情報学専攻 Dept. of Intelligence Science and Technology, Graduate School of Informatics, Kyoto University
    • 駒谷 和範 KOMATANI KAZUNORI
    • 京都大学大学院 情報学研究科 知能情報学専攻 Dept. of Intelligence Science and Technology, Graduate School of Informatics, Kyoto University
    • 尾形 哲也 OGATA TETSUYA
    • 京都大学大学院 情報学研究科 知能情報学専攻 Dept. of Intelligence Science and Technology, Graduate School of Informatics, Kyoto University
    • 奥乃 博 OKUNO HIROSHI G.
    • 京都大学大学院 情報学研究科 知能情報学専攻 Dept. of Intelligence Science and Technology, Graduate School of Informatics, Kyoto University

抄録

本稿では,少量の学習データでも高精度な音声理解を実現する手法について述べる.学習データが少ない場合,単一の音声理解方式による精度は低い傾向にある.そこで本手法では,まず,複数の言語モデルと言語理解モデルを用いて複数の理解結果を得ることで,対処可能な発話を増やす.次に,得られた複数の理解結果に対して,ロジスティック回帰に基づき発話単位の信頼度を付与し,その信頼度が最も高い理解結果を選択する.ロジスティック回帰には,学習データ増加時の回帰係数の変化量に着目することで,必要最低限の学習データを割り当てる.評価実験では,学習データが少ない場合でも,単一の音声理解方式と比較して,本手法が高い音声理解精度を得られることを示す.We aim to improve a speech understanding module with a small amount of training data. High performance is not obtained by single speech understanding methods especially when the amount of available training data is small. We utilize multiple language models (LMs) and language understanding models (LUMs) to cover various user utterances. Then, the most appropriate speech understanding result is selected from several candidates on the basis of confidence measures calculated by logistic regressions. We determine necessary amount of training data for the regressions by focusing on changes in their coefficients when the training data increases. We evaluate our method for various amounts of training data and confirm that our method outperforms every single speech understanding method even when only a small amount of training data is available.

収録刊行物

  • 研究報告音声言語情報処理(SLP)

    研究報告音声言語情報処理(SLP) 2010-SLP-80(5), 1-6, 2010-02-05

    情報処理学会

参考文献:  14件中 1-14件 を表示

各種コード

  • NII論文ID(NAID)
    110007990679
  • NII書誌ID(NCID)
    AN10442647
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • ISSN
    09196072
  • NDL 記事登録ID
    025111802
  • NDL 請求記号
    YH267-101
  • データ提供元
    CJP書誌  NDL  NII-ELS  IPSJ 
ページトップへ