雑談音声の常時認識による楽曲提案システム Music recommendation system based on chat speech recognition

この論文をさがす

著者

抄録

音声を連続音声認識システムにより常時認識することによって得られる認識単語列からその場の雰囲気に適切な音楽・楽曲を提案し,再生するシステムを構築した.楽曲を説明するテキストより構築された文書ベクトル空間と,楽曲の音響特徴量を表現する音響ベクトル空間の対応付けを利用することで,大語彙音声認識によって得られた音声認識単語列を音響ベクトル空間へとマッピングする.また,大語彙音声認識ではカバーできない固有名詞などのキーワードをワードスポッティングで認識する.本稿ではシステムの概要と基本的な性能評価の結果と実際の雑談音声への応用に向けた予備実験結果を示す.楽曲のレビューを読み上げた音声を認識した結果による楽曲検索結果と,レビューのテキストを用いた結果との比較により,テキストではMRR値1で検索できたものが,音声認識性能はWER70.55%,ワードスポッティング性能はF値31.58%でもMRR値0.83と比較的良い結果を得た.また,今後の雑談認識の応用の予備的実験を行い,雑談書き起こしからの例を示した.

We developed an ambient system that plays a music suitable for the mood of a human-human conversation using words obtained from a continuous speech recognition system. Using the correspondent between a document space based on the texts related to the musics and an acoustic space that express various audio features, the continuous speech recognition results are mapped to an acoustic space. Proper names, which are not coverd by the continuous speech recognizer, are recognized by a wordspotter. In this paper, we show the result of the perfomance evaluation for the system. For read music review texts, the system obtained in MRR of 0.83, which is not bad, with high WER of 70.55%, not low F measure of 31.58. We also show an example result for chat conversations.

収録刊行物

  • 電子情報通信学会技術研究報告. SP, 音声

    電子情報通信学会技術研究報告. SP, 音声 110(220), 59-64, 2010-10-01

    一般社団法人電子情報通信学会

参考文献:  11件中 1-11件 を表示

各種コード

  • NII論文ID(NAID)
    110008106329
  • NII書誌ID(NCID)
    AN10013221
  • 本文言語コード
    JPN
  • 資料種別
    ART
  • ISSN
    09135685
  • NDL 記事登録ID
    10881342
  • NDL 雑誌分類
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL 請求記号
    Z16-940
  • データ提供元
    CJP書誌  NDL  NII-ELS 
ページトップへ