実環境におけるSNR別音響モデルの評価 Evaluation of an acoustic modeling based on an SNR criterion under real driving conditions

この論文をさがす

著者

抄録

車内大規模データベースを用いて, ASRシステムの性能改善を行う。車内大規模データベースは実環境での500人以上のドライバの発声を収集したもので, 実環境でのデータとしては最大規模のものである。大規模データベースをクロスバリデーションによって適切に評価するサブセットを作成する。そして, 認識実験の結果から, 音声認識率と発声文の特徴(SNR, エントロピー, 話速)との関係を示す。分析結果に基づき, 発声文長と帯域別SNRを用いて, モデル分割とモデル選択を行う。実環境マルチモデルを使うことによって最大16%の改善率が得られた。

In-car ASR performance improvement utilizing a large in-car speech corpus, which consists of the utterances of more than five hundreds drivers under real driving conditions is reported. A subset designing method for the efficient cross validations for a large scale speech recognition experiments is proposed. The factor analysis of the results of the recognition experiments show the relationship between word accuracy and utterance characteristics, i.e., SNR, entropy and speaking rates. Based on the factor analysis results, multi-model approach which uses the utterance duration and subband SNRs as the model selection measures for acoustic and language models, respectively is proposed. By the proposed multi-model approach, the 16% of relative improvement in speech recognition accuracy is obtained.

収録刊行物

  • 電子情報通信学会技術研究報告. SP, 音声

    電子情報通信学会技術研究報告. SP, 音声 104(631), 43-48, 2005-01-21

    一般社団法人電子情報通信学会

参考文献:  13件中 1-13件 を表示

各種コード

  • NII論文ID(NAID)
    110003298522
  • NII書誌ID(NCID)
    AN10013221
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    09135685
  • NDL 記事登録ID
    7253960
  • NDL 雑誌分類
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL 請求記号
    Z16-940
  • データ提供元
    CJP書誌  NDL  NII-ELS 
ページトップへ