類似音節バイグラムリストを用いた音声中の検出語検出
書誌事項
- タイトル別名
-
- Spoken Term Detection Using Similar Syllable Bigrams
この論文をさがす
抄録
音声中の検索語検出方式における未知語の検索語の高速な検索のために,我々は既に音節バイグラム事前検索結果を用いた高速検索方式を提案した.音節バイグラム事前方式ではインデックスの空間計算量が大きくこれの削減を図るため,本稿では類似音節バイグラムリストを用いた事前検索方式を提案する.類似音節バイグラムリストと各音節バイグラムに一致した音節バイグラムを有する区間から事前検索結果を再構成する.さらに音節バイグラム間照合による類似音節バイグラムリストを構築する方式を提案する.評価実験の結果,提案方式では事前検索方式と比べ,コア 177 講演を検索対象とした場合,検索精度の低下無しで検索時間を 0.95sec から 0.24sec(3.96 倍) の高速化を実現し,インデックスの空間計算量を 1.2GB から 29.7MB と約 1/41 に削減できた.また全 2702 講演検索を検索対象とした場合,検索精度の低下無しで 18.22sec から 2.75sec (6.63 倍) に,インデックスの空間計算量を 3.1GB から 120.8MB と約 1/26 に削減できた.音節バイグラム間照合で構築した類似音節バイグラムリストを用いることで,コア 177 講演,全 2702 講演ともに事前検索方式および事前検索結果から類似音節バイグラムリストを構成する方式と同等の検索性能が得られることを確認でき,音節バイグラム間照合により類似音節バイグラムリストが構築できることを示した.
収録刊行物
-
- 情報処理学会研究報告. 自然言語処理研究会報告
-
情報処理学会研究報告. 自然言語処理研究会報告 2014 (13), 1-6, 2014-05-15
一般社団法人情報処理学会
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1572824502693842816
-
- NII論文ID
- 110009770569
-
- NII書誌ID
- AN10115061
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles