PodCastle の実現 : Web 2.0 に基づく音声認識性能の向上について  [in Japanese] PodCastle : Techniques for Improving Speech Recognition Performance on the Basis of Web 2.0  [in Japanese]

Search this Article

Author(s)

Abstract

本稿では,ポッドキャストを検索できるWebサービス「PodCastle」を実現するための音声認識手法について述べる.ポッドキャストでは多様な内容が異なる環境で録音されており,多数の未知語を含む新たな話題も多いため,従来の音声認識システムで適切に認識するのは困難だった.この問題を解決するために,本研究では,Web 2.0によって得られる様々なデータを用いることによって,継続的に,音声認識システムを改善していく.具体的には,各ポッドキャストの内容に応じた言語モデルの話題適応,Web 2.0のサービスを通じた単語発音の自動獲得,PodCastle上でユーザが音声認識誤りを訂正した結果を用いた未知語の学習等を試みた,実際にポッドキャストを対象とした認識実験を行い,性能向上に有効であることを確認した.

This paper describes speech recognition techniques that enable a web service "PodCastle" for searching podcasts. Most previous speech recognizers had difficulties dealing with podcasts because they include various contents recorded in different conditions and new topics with many out-of-vocabulary words. To overcome such difficulties, we continuously improve speech recognizers by using information aggregated on the basis of Web 2.0. For example, the language model is adapted to a topic of the target podcast on the fly, the pronounciation of unknown words is obtained from a Web 2.0 service, and out-of-vocabulary words are automatically acquired by analyzing user corrections of speech recognition errors on PodCastle. The experiments we report in this paper show that our techniques produce promising results for podcasts.

Journal

  • 情報処理学会研究報告. HI,ヒューマンインタフェース研究会報告

    情報処理学会研究報告. HI,ヒューマンインタフェース研究会報告 122, 41-46, 2007-02-09

    Information Processing Society of Japan (IPSJ)

References:  13

Cited by:  1

Codes

  • NII Article ID (NAID)
    110006223683
  • NII NACSIS-CAT ID (NCID)
    AN10116111
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09196072
  • NDL Article ID
    8689611
  • NDL Source Classification
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL Call No.
    Z14-1121
  • Data Source
    CJP  CJPref  NDL  NII-ELS 
Page Top