リカレントネットワークを用いた連続音声認識

書誌事項

タイトル別名
  • Continuous Speech Recognition Using Recurrent Neural Network.

この論文をさがす

抄録

連続音声認識を行うためには、連続音声を音素などの認識の基本単位にセグメンテーションをしなければならない。現在、用いられている方法は任意のフレームを音素間の業界の候補であるとし、各候補点ごとにHMMと照合を行うため、処理時間がかかり、実時間処理が難しい。本報告ではリカレントニューラルネットワーク(RNN)を用いた連続音声認識の実現法を提案し、実験と検討を行った。本手法は音素単位での認識を行うようにRNNの学習を行うが、RNNが音素を認識する際、スペクトル包絡やホルマント周波数の遷移といった音響的特徴を利用するので、音素間の境界が自動的に決定され、ほぼ実時間で音素スポッティングが行える。また、ネットワークの内部を解析したところ、特定周波数成分の時間変化に反応するAMニューロンや、ホルマント周波数の遷移に強く反応するFMニューロンが形成されるなど、生体の聴覚と比較しても興味深い結果を得た。

収録刊行物

  • 信学技報

    信学技報 55-62, 1993

    一般社団法人電子情報通信学会

被引用文献 (4)*注記

もっと見る

詳細情報 詳細情報について

  • CRID
    1570572702386557952
  • NII論文ID
    110003296749
  • NII書誌ID
    AN10060797
  • 本文言語コード
    ja
  • データソース種別
    • CiNii Articles

問題の指摘

ページトップへ