「たけまるくん」実環境音声案内システムのデータベース整備と「キタちゃん」へのポータビリティーの検討  [in Japanese] The Speech-oriented Guidance System Takemaru and its Portability  [in Japanese]

Search this Article

Author(s)

Abstract

本稿では、「たけまるくん」の長期間運用に伴って構築してきた実環境音声データベースを用いて、音声案内システムの性能向上を時間軸でシミュレートする。収集期間と、データ数、出現している単語の数、評価データにおける言語モデルのパープレキシティーと未知語率、音声認識性能、応答正解率との関係を分析し、システム開発におけるそれぞれの構成要素の重要性に関して報告を行う。結果として、質問応答DBを始め、音響モデル、言語モデルの順番でシステム更新が効果的であることが判った。また、一年間の収集データに基づいて構築したシステムにおける性能はほぼ飽和し、より多くの収集データを学習に用いても、上昇は見られなかった。更に、「たけまるくん」の収集データで構築した地下鉄の駅に設置した「キタちゃん」のポータビリティーを検討する。より現実的な開発状況を想定するため、新環境で収集した20日間のデータのみをシステムの適応に用いる。音声認識性能に関して、性能改善が比較的に低く、たけまるの音声認識部の頑健性は高い。応答正解率は6割程度であり、主に質問応答データベースからなる応答生成部の開発が今後の最も重要な課題である。

The development of the speech-oriented guidance system Takemaru is simulated using the data collected during the first two-years of regular operation. The relationship between the period of data collection, the number of speech inputs, number of words, language model perplexity, OOV rate, speech recognition performance and response accuracy is investigated. Based on this analysis, the relative importance of developing each system component can be assessed. Most important are efforts regarding the Q&A database followed by the acoustic and the language model. Moreover, a maximum in system performance seems to be reached after one year of data collection and overall improvement has the tendency to stagnate even if more data becomes available. Apart from that, the portability of the Takemaru system regarding a different environment, the Kitachan system installed at a local subway station, is investigated. Assuming a more realistic setting, only the data collected during twenty days is employed for system development. While the Takemaru ASR component shows a high portability, more efforts regarding the question and answer database have to be carried out in the future.

Journal

  • IPSJ SIG Notes

    IPSJ SIG Notes 64, 173-178, 2006-12-21

    Information Processing Society of Japan (IPSJ)

References:  6

Cited by:  4

Codes

  • NII Article ID (NAID)
    110006248338
  • NII NACSIS-CAT ID (NCID)
    AN10442647
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09196072
  • NDL Article ID
    8600850
  • NDL Source Classification
    ZM13(科学技術--科学技術一般--データ処理・計算機)
  • NDL Call No.
    Z14-1121
  • Data Source
    CJP  CJPref  NDL  NII-ELS 
Page Top