日本語音声コーパスの比較・選択の方法

書誌事項

タイトル別名
  • Several Methods for Comparing and Selecting Suitable Japanese Speech Corpus

この論文をさがす

抄録

音声認識や音声合成に代表される音声研究には、大量の音声データが必要とされ、音声研究の分野で音声コーパスの重要性は常識となりつつある。しかし, 日本語音声コーパスは未だ不足しており、より多様なコーパスの構築が望まれている。音声コーパスを設計する際に、収録する音声テキスト選択の具体的な指針となるようなものはまだ存在しない。また、音声コーパスを利用する場合には、コーパスの適切な選択方法が必要である。音声コーパスの性質や内容を定量的に評価することができれば、大規模な音声コーパスから目的にかなったコーパスを簡単に選択することができ、今後音声コーパスを設計・選択する際の重要な指針ともなり得るであろう。本稿では、音声コーパスの設計の指針を与えるための準備段階として、音声コーパスの選択方法を定量的に示すことを試みる。具体的には、音声コーーパスの書き起こしテキストに注目し、コーパス中に出現するN個組単位の頻度調査を行うことによって、音声コーパスの選択に有用であると思われる情報を抽出する。その結果をもとにコーパス間の比較を行い、目的にかなったコーパスを選択する方法を提案する。

収録刊行物

参考文献 (13)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1571417127316846208
  • NII論文ID
    110003296905
  • NII書誌ID
    AN10013221
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ