西光 雅弘 SAIKOU Masahiro

Articles:  1-6 of 6

  • Clause and Sentence Boundary Detection for Spontaneous Speech Using Local Syntactic Dependency Information  [in Japanese]

    西光 雅弘 , 秋田 祐哉 , 高梨 克也 , 尾嶋 憲治 , 河原 達也

    講演などの話し言葉音声における節·文境界推定のために,局所的な係り受け情報を用いた段階的チャンキング手法を提案する.節·文境界推定を行ううえで係り受け情報は有効な特徴と考えられるが,話し言葉の文は必ずしも文法的ではなく,またフィラーやいいよどみなどの非流暢現象が含まれている.さらに音声認識器の出力には必然的に認識誤りが含まれており,このようなテキストにおける自動的な係り …

    情報処理学会論文誌 50(2), 544-552, 2009-02-15

    IPSJ 

  • A Evaluation of a Cascaded Chunking Method of Spontaneous Japanese using Local Bunsetsu Dependency  [in Japanese]

    SAIKOU Masahiro , KAWAHARA Tatsuya , TAKANASHI Katsuya

    会議録作成支援や字幕付与などの音声言語処理を指向して、話し言葉を"適当な"単位に区分化することを考える。従来、話し言葉音声では、ポーズに基づいて発話単位を設定することが多いが、ポーズが文や節の境界と対応しない場合が多く、均質な言語的まとまりにならない。一方、話し言葉の節や文の境界を機械学習に基づいて検出する方法も研究されているが、音声認識結果に対してはF値が70%台であり、誤検出箇所に関して意味づ …

    IPSJ SIG Notes 61, 19-24, 2006-05-11

    References (8) Cited by (8)

  • Cascaded Chunking of Spontaneous Japanese using Bunsetsu Dependency and Pause Information  [in Japanese]

    SAIKO Masahiro , TAKANASHI Katsuya , KAWAHARA Tatsuya

    従来の音声言語処理においては, ポーズにより処理単位を設定することが大半である.しかし話し言葉では, ポーズにより認定した単位は文や節と必ずしも一致せず, 均質な言語的まとまりになっているとは限らない.本研究では, 話し言葉音声を対象として, 頑健に抽出できる特徴として係り受けとポーズ・フィラーの情報に着目し, それらを段階的に用いることによりチャンキングを行う手法を提案する.まず, 隣接文節間の …

    IEICE technical report 105(494), 157-162, 2005-12-22

    References (10)

  • Cascaded Chunking of Spontaneous Japanese using Bunsetsu Dependency and Pause Information  [in Japanese]

    SAIKO Masahiro , TAKANASHI Katsuya , KAWAHARA Tatsuya

    従来の音声言語処理においては, ポーズにより処理単位を設定することが大半である.しかし話し言葉では, ポーズにより認定した単位は文や節と必ずしも一致せず, 均質な言語的まとまりになっているとは限らない.本研究では, 話し言葉音声を対象として, 頑健に抽出できる特徴として係り受けとポーズ・フィラーの情報に着目し, それらを段階的に用いることによりチャンキングを行う手法を提案する.まず, 隣接文節間の …

    IEICE technical report 105(496), 157-162, 2005-12-22

    References (10) Cited by (3)

  • Cascaded Chunking of Spontaneous Japanese using Bunsetsu Dependency and Pause Information  [in Japanese]

    SAIKO Masahiro , TAKANASHI Katsuya , KAWAHARA Tatsuya

    従来の音声言語処理においては, ポーズにより処理単位を設定することが大半である.しかし話し言葉では, ポーズにより認定した単位は文や節と必ずしも一致せず, 均質な言語的まとまりになっているとは限らない.本研究では, 話し言葉音声を対象として, 頑健に抽出できる特徴として係り受けとポーズ・フィラーの情報に着目し, それらを段階的に用いることによりチャンキングを行う手法を提案する.まず, 隣接文節間の …

    IPSJ SIG Notes 59, 247-252, 2005-12-21

    References (10) Cited by (1)

  • Real-time Captioning of Rakugo using Large Vocabulary Continuous Speech Recognition  [in Japanese]

    SAIKOU Masahiro , AKITA Yuya , KAWAHARA Tatsuya

    本稿では落語を対象に劇場内においてリアルタイムで字幕を付与する方法を検討する.落語は演目ごとに基本的なシナリオ(台本)が決まっており, 同一演者・演目の音声データとその書き起こしの収集が可能であることから, これを用いて当該演目専用の音響モデルと言語モデルを構築する.特に, 台本からの逸脱への頑健性を保持しながら, 言語的制約を強力に反映させるために, 言語モデルの単位として文節を採用する.実際の …

    IPSJ SIG Notes 57, 25-30, 2005-07-15

    References (10)

Page Top