日本語の未知語に対する発音付与のための多対多アライメント  [in Japanese] Many-to-many Alignment Algorithm for Automatic Pronunciation Annotation on Japanese Unknown Words  [in Japanese]

Access this Article

Abstract

音声ドキュメント検索や音声検索のような固有名詞や新語を扱うアプリケーションの発達とともに,未知語に対する頑健な自動発音付与の必要性は増加している.未知語への自動発音付与手法として統計的アプローチやWebテキストマイニングによるアプローチがある.これらには単語の表記と発音を単語(形態素)よりも小さい単位で対応付けたデータが不可欠である.本論文では日本語の未知語に対する発音付与の性能向上を目的として,表記と発音の対応付けの精度を劣化させずに,未知語を表現する能力が高い小さい単位での対応付けを求めるアライメントアルゴリズムを提案する.また,Webテキストマイニングを用いた日本語の未知語に対する自動発音付与により提案手法の評価を行った.評価実験の結果,提案手法は従来手法が持つ精度をほとんど劣化させずに,未知語に対する汎化能力を表す再現率を約3.9ポイント改善した.

The need for robust pronunciation annotation on unknown words has been increasing with the development of an application that deals with proper nouns and brand-new words, such as Spoken Document Retrieval and Voice Search. In robust pronunciation annotation on unknown words, the alignment between graphemes and phonemes is vital data. In this paper, for the purpose of the improving pronunciation annotation on Japanese unknown words, we propose the alignment algorithm that requires a mapping with small unit having high expression ability on unknown words while avoiding degradation of the accuracy of a mapping between graphemes and phonemes. An evaluation experiment of a many-to-many alignment by automatic pronunciation annotation using Web text mining is also performed. That experimental result shows that the proposed many-to-many alignment obtains 3.9 point improvement on recall rate that represents the generalization ability for unknown words while avoiding degradation of the accuracy of the pronunciation annotation compared with the conventional approach.

Journal

  • 2013-02-15

Codes

  • NII Article ID (NAID)
    120005716842
  • Text Lang
    JPN
  • Article Type
    journal article
  • ISSN
    0387-5806
  • Data Source
    IR 
Page Top