大語彙連続音声認識エンジン Julius ver. 4  [in Japanese] Large Vocabulary Continuous Speech Recognition Engine Julius ver. 4  [in Japanese]

Search this Article

Author(s)

    • 李 晃伸 LEE Akinobu
    • 名古屋工業大学大学院工学研究科 Faculty of Engineering, Nagoya Institute of Technology

Abstract

大語彙連続音声認識エンジンJuliusは2007年12月にバージョンver.4がリリースされた.7年ぶりのメジャーバージョン更新となるver.4では,内部構造のモジュール化およびソースの全面的な再構成が行われ,可搬性と柔軟性が大幅に向上された.その結果,エンジン本体がライブラリ化された他のアプリケーションに組み込めるようになったほか,コールバック・プラグイン等の外部との連携の仕組みが整備され,機能の拡弾や構成の変更が容易に行えるようになった.言語モデルも単語N-gramおよび文法を単一バイナリで同等に扱えるようになりJulianはJuliusに統一された.さらに,複数の言語モデルと音響モデルを任意に組み合わせて,1エンジンで並列認識を行うマルチデコーディングも可能となった.また,基本性能についても拡張と強化が行われた.言語モデルとして孤立単語認識が新たに追加されたほか,4-gram以上の任意長N-gramへの対応、ユーザ関数による外部言語制約の組込み、GMM-based VADおよびデコーダベースVAD、confusion networkの生成など大幅な機能強化が行われた。性能は従来バージョンと同等を維持しており、かつメモリ量の削減も行われている。

The new version 4.0 of large vocabulary continuous speech recognition engine "Julius" has been released at December 2007, as a major version up from version 3.0. An anatomical analysis and data stcuture re-organization has been accomplished for the whole codes to improve its modularity and flexibility. Its improved structure now enables Julius to be compiled as a external library to be incorpolated into various user applications. A simple callback API and plugin facilities are newly built to be controlled directly and lively from outer applications, which enables easy but tight integration with other applications. Also, grammar-based recognizer Julian has been incorpolated into Julius and the N-gram and grammar can be treated at the same executable. Furthermodre, It supports fully multi-decoding using multiple LMs, AMs and their arbitral combinations. It now supports long N-gram (N unlimited),user-defined LM function, GMM-based and a newly proposed decoder-based VAD, confusion network generation, and many other new functions. The memory requirement has also been improved, while keeping the same accuracy.

Journal

  • IEICE technical report

    IEICE technical report 107(405), 307-312, 2007-12-13

    The Institute of Electronics, Information and Communication Engineers

References:  4

Keywords

Codes

  • NII Article ID (NAID)
    110006595716
  • NII NACSIS-CAT ID (NCID)
    AN10091225
  • Text Lang
    JPN
  • Article Type
    ART
  • ISSN
    09135685
  • NDL Article ID
    9330030
  • NDL Source Classification
    ZN33(科学技術--電気工学・電気機械工業--電子工学・電気通信)
  • NDL Call No.
    Z16-940
  • Data Source
    CJP  NDL  NII-ELS 
Page Top