Read/Search this Article
Abstract
近年,音声認識誤りの検出訂正には,誤り傾向を示すn-gramを学習する「誤り傾向学習」という手法が注目されている.この手法には,出現頻度の低いn-gramに対しては適切に学習を行うことができないという問題があると考えられる.また,周辺の単語との意味的類似度をスコア化し,内容語の認識誤りを検出する手法が提案されている.本稿では,特に後者の意味スコアについて検討し,これらの情報を統合した音声認識誤りの検出法を提案する.日本語話し言葉コーパスによる評価実験の結果,「誤り傾向学習」で用いる素性に意味スコアを追加することで,特に内容語において誤り検出性能の改善が得られた.また,単語重みと組み合わせることで意味スコアを有効に活用することができた.
Recently, a learning method of n-gram showing error tendency is focused on. In this method, it is difficult to learn low frequency n-gram appropriately. On the other hand, error detection method for content words was proposed that uses semantic similarity in neighboring recognition result. In this paper, we especially examine semantic score and propose a method for speech recognition error detection that integrates these information. As a result of evaluation experiment using the Corpus of Spontaneous Japanese, error detecting performance was improved for content words in particular. Moreover, semantic score is effectively used by combining with term-weight.
Journal
- IEICE technical report. Speech [List of Volumes]
-
IEICE technical report. Speech 108(422), 7-12, 2009-01-22 [Table of Contents]
The Institute of Electronics, Information and Communication Engineers