この論文を読む/探す
抄録
本報告では、コーパスから自動的に学習した翻訳言語モデルを用いて、音声認識結果である自然言語をシステムを駆動する意味言語に変換する音声理解の方法について述べる。翻訳言語モデルの学習では、まず、自然言語/意味言語における単語を、出現する文脈の類似度を尺度とした統計的なクラスタリングによりグループ化する。次に、自然言語、意味言語をそれぞれネットワーク文法で表現し、自然言語の文法ネットワーク中の状態遷移と、対応する意味言語の文法ネットワーク中の状態遷移間の共起確率を、自然言語と意味言語が一対となったコーパスを用いて推定する。この共起確率を翻訳言語モデルとして、自然言語から意味言語への変換を行う。単語のクラスタリングによりネットワーク中の状態数が削減されているため、スパースデータからの推定の問題を回避し、頑健な翻訳言語モデルを推定することができる。米国ARPAの音声理解評価タスクである航空旅行情報システム(Air Travel Information System:ATIS)を対象として評価を行い、提案法の有効性を示す。
This paper describes a speech understanding method that uses a translation language model estimated automatically from a text corpus. The translation language model translates the natural language output by a speech recognition system into semantic language. For training the translation language model, words in natural and semantic languages are first clustered using a measure of word contextual similality. Natural and semantic languages are then modeled using grammar networks with the word clusters as nodes in the networks. Co-ocurrence probabilities of transitions in natural-language and semantic-language grammar networks are estimated as parameters of the translation language model. This method was shown to be very effective by experiments using the ARPA ATIS speech understanding evaluation task.