単語を認識単位とした日本語ディクテーションシステム  [in Japanese] A Word-Based Japanese Dictation System  [in Japanese]

Search this Article

Author(s)

Abstract

単語を認識の単位とした日本語ディクテーションシステムについて検討した。欧米では既にいくつかのシステムが実用化されているが, 日本語においては, 単語の概念が明確でないため, N-gram等の言語モデルの導入が容易ではなく, 研究が遅れた。最近, 形態素を認識単位とした研究が盛んになってきているが, 離散単語発声も可能なシステムとなると, ほとんど検討されていない。本論文では, 日本人の考える, 単語の切出し方を統計的にモデル化する方法を提案する。この方法によって抽出された単語単位を認識および発声の単位として, 不特定話者日本語ディクテーションシステムを構築し, その性能を評価した。約4万語の辞書を用意したところ, 新聞記事に対しては95.5〜98%の単語カバレージが得られた。また, 男女各10名の離散単語発声による新聞記事の読み上げ文に対して認識実験を行ったところ, 単語誤り率は3.2%であった。

Journal

  • The Transactions of the Institute of Electronics,Information and Communication Engineers.

    The Transactions of the Institute of Electronics,Information and Communication Engineers. 00081(00001), 10-17, 1998-01-25

    The Institute of Electronics, Information and Communication Engineers

References:  16

Cited by:  24

Codes

  • NII Article ID (NAID)
    110003227694
  • NII NACSIS-CAT ID (NCID)
    AN1007132X
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09151923
  • NDL Article ID
    4392175
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-1853
  • Data Source
    CJP  CJPref  NDL  NII-ELS 
Page Top