ポッドキャスト音声認識の性能向上手法:集合知によって更新される Web キーワードを活用した言語モデリング Improvements of Podcast Transcription: Language Modeling Based on Web Keywords Maintained Through Wisdom of Crowds

この論文にアクセスする

この論文をさがす

著者

抄録

本稿では,ポッドキャスト音声認識の性能向上のための,言語モデリング手法について述べる.ポッドキャスト音声認識においては,あらゆるタスクが認識対象となること,常に最新の話題をカバーする必要があること,などから従来の言語モデルでは高精度な認識は望めないそこで,本研究では,集合知によって日々更新される Web 上の辞書サービス「Web キーワード」を活用した言語モデリングを行うことで,ポッドキャスト音声認識の性能向上をはかる.実際にポッドキャストを対象とした認識実験を行い,提案手法の評価を行ったところ,性能向上に有効であることを確認した.This paper describes language modeling techniques to improve automatic transcription of podcasts. Most previous language models had difficulties in transcribing podcasts because podcasts because podcasts include various kinds of tasks and cover recent topics that tend to have many out-of-vocabulary words. To overcome such difficulties, we improve our speech recognizer by using language modeling that utilizes "Web keywords" updated on a daily baais through wisdom of crowds. From our experimental results for actual podcast speech data, the effectiveness of the proposed language modeling was confirmed.

This paper describes language modeling techniques to improve automatic transcription of podcasts. Most previous language models had difficulties in transcribing podcasts because podcasts include various kinds of tasks and cover recent topics that tend to have many out-of-vocabulary words. To overcome such difficulties, we improve our speech recognizer by using language modeling that utilizes "Web keywords" updated on a daily basis through wisdom of crowds. From our experimental results for actual podcast speech data, the effectiveness of the proposed language modeling was confirmed.

収録刊行物

  • 情報処理学会研究報告自然言語処理(NL)  

    情報処理学会研究報告自然言語処理(NL) 2008(46(2008-NL-185)), 39-44, 2008-05-15 

    一般社団法人情報処理学会

参考文献:  14件

参考文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

被引用文献:  1件

被引用文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

各種コード

  • NII論文ID(NAID)
    110006793710
  • NII書誌ID(NCID)
    AN10115061
  • 本文言語コード
    JPN
  • 資料種別
    Technical Report
  • ISSN
    09196072
  • NDL 記事登録ID
    9524785
  • NDL 雑誌分類
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL 請求記号
    Z14-1121
  • データ提供元
    CJP書誌  CJP引用  NDL  IPSJ 
ページトップへ