FSA言語モデルの自動構築と動的代替パスサーチによる音声認識  [in Japanese] Automatic Construction of a FSA Language Model and Speech Recognition on it with Dynamic Alternative Path Search  [in Japanese]

Search this Article

Author(s)

Abstract

語彙規模が小または中程度(〜1,000語)の音声認識では,FSA言語モデルが広く用いられている.しかしそのモデルを人手で定義するのはかなり大変である.我々はすでに学習コーパスからFSA言語モデルを自動的に構築する方法を提案した.生成された言語モデルは,クローズド・データに対しては極めて高い音声認識性能を達成できる.しかしオープン・データに対しては満足できるような性能は達成できなかった.その主な理由は,生成されたFSAモデルにおいて,必要なパスが途中で切れてしまうためである.そこでこの問題に対処するため,認識途中において,ある単語の認識に失敗したと判断される場合は代替パスを動的にサーチし,代替パスがみつかればそのパスで認識を継続するようなサーチ方法を提案する.また実験結果によりその有効性をしめす.

For a small- or middle-size (around 1,000 words) vocabulary speech recognition, a Finite State Automaton (FSA) language model is widely used. However, defining a FSA model with sufficient coverage and consistency requires much human effort. We already proposed a method to automatically construct a FSA language model from learning corpus by use of FSA DP matching algorithm. Experiment results show that this model attains quite high recognition correct rate for closed data, but only low rate for open data. This is mainly because an necessary path does not appear in a generated FSA. To cope with this problem, we propose a new search algorithm that allows to jump dynamically to an alternative path when speech recognition of some words seems to fail. Experiment results shows the effectiveness of the algorithm.

Journal

  • IPSJ SIG Notes

    IPSJ SIG Notes 73, 13-18, 2008-10-17

    Information Processing Society of Japan (IPSJ)

References:  9

Codes

  • NII Article ID (NAID)
    110007086924
  • NII NACSIS-CAT ID (NCID)
    AN10442647
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    09196072
  • NDL Article ID
    9701319
  • NDL Call No.
    Z14-1121
  • Data Source
    CJP  NDL  NII-ELS 
Page Top