日本語読み上げ文の係り受け解析における韻律的特徴量の有効性 Effectiveness of Prosodic Features in Dependency Analysis of Read Japanese Sentences

この論文にアクセスする

この論文をさがす

著者

抄録

韻律には発話が文字化されると失われてしまう情報が含まれているが, そのような情報は発話文の構文解析に有効である可能性がある. 我々のグループでは, 以前の研究で12種類の韻律的特徴量を取り上げ, それらと係り受け距離の関係を表現する統計モデルを構成した. そして, そのモデルを組み込んだ係り受け解析器を用い, 韻律情報が実際に読み上げ文の係り受け解析に有効であることを示した. 本研究では新たな特徴量を加えて24種類の韻律的特徴量を取り上げ, 有効な特徴量を広い範囲で探索した. また, 統計モデルを特徴量の現実の分布によりよく当てはまるように修正した. その結果, ATR503文データベースを用いたオープン実験において, 韻律的特徴量を用いることにより, 係り受け解析の文正解率が21.2%向上した. これは, 我々のグループの以前の実験における向上率より4.0ポイント高い. 特徴量の中でポーズ長はクローズド実験においてもオープン実験においても非常に有効であったが, これと併用したときの, ピッチやパワー, 話速等に関連する他の特徴量の有効性はオープン実験においてはあまり明らかでなかった.

Prosody contains information that is lost when utterances are transcribed into letters or characters. Such information may be useful for syntactic analysis of spoken sentences. In our previous work, we took up 12 prosodic features, and made a statistical model to represent the relationship between those features and dependency distances. Then, using a dependency analyzer that incorporates the model, we have shown that prosodic information is in fact effective for dependency analysis of read Japanese sentences. In the present work, we employed 24 features including new ones, and conducted an extensive search for effective ones. Also, the statistical model was modified to better fit the actual distributions of the feature values. As a result, in open experiments using the ATR 503-sentence database, the correct parsing rate was improved by 21.2% with the use of the prosodic features. This figure is 4.0 points higher than the improvement in the previous experiment of our group. Among the features, the duration of pause was definitely effective in both the open and the closed experiments, while the effectiveness of other features related to the pitch, the power, and the speaking rate, when used together with the duration of pause, was not clear in the open experiments.

収録刊行物

  • 自然言語処理 = Journal of natural language processing  

    自然言語処理 = Journal of natural language processing 8(4), 71-89, 2001-10-10 

    一般社団法人 言語処理学会

参考文献:  23件

参考文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

被引用文献:  3件

被引用文献を見るにはログインが必要です。ユーザIDをお持ちでない方は新規登録してください。

各種コード

  • NII論文ID(NAID)
    10021991649
  • NII書誌ID(NCID)
    AN10472659
  • 本文言語コード
    JPN
  • 資料種別
    NOT
  • ISSN
    13407619
  • NDL 記事登録ID
    5941327
  • NDL 雑誌分類
    ZU8(書誌・図書館・一般年鑑--図書館・ドキュメンテーション・文書館)
  • NDL 請求記号
    Z21-B168
  • データ提供元
    CJP書誌  CJP引用  NDL  J-STAGE 
ページトップへ