検索結果を絞り込む

本文・本体へのリンク

検索結果 158 件

  • 1 / 1

  • 話者クラスタリングに基づく短時間発話音声認識

    関 博史, 榎並 大介, 朱 発強, 山本 一公, 中川 聖一 電子情報通信学会論文誌D 情報・システム J100-D (1), 81-92, 2017-01-01

    音声認識システムにおいて話者の多様性は認識精度を低下させる大きな要因となるため,システムを対象話者に適応させる話者適応に関する研究がこれまで活発に行われてきた.しかし,提案されている多くの話者適応手法は数十秒から数分程度の適応データを想定しており,短時間発話に対する適応は考慮されていない.そこで本研究では,短時間発話を対象とした話者適応技術の提案を行う.そのために,学習データのクラスタリングを基…

    DOI

  • 複数の対話エージェントを用いた雑談指向の音声対話システム

    藤堂 祐樹, 西村 良太, 山本 一公, 中川 聖一 電子情報通信学会論文誌D 情報・システム J99-D (2), 188-200, 2016-02-01

    音声対話システムとの対話において,現在は,ユーザ一人とシステムエージェント一体による二者対話(1対1の対話)が主流である.我々はこれまでに1対1の雑談向け音声対話システムの開発を行ってきた.このシステムを応用し,本論文ではシステム側のエージェントを二体にした三者対話システムを提案し,開発・評価を行った.雑談に用いた対話ドメインは,「うどんとラーメンのどちらが好きか」といったような,だれでも話しや…

    DOI

  • 音声中の検索語検出のためのテストコレクションの構築と分析

    伊藤, 慶明, 西崎, 博光, 中川, 聖一, 秋葉, 友良, 河原, 達也, 胡新輝, 南條浩輝, 松井, 知子, 山下, 洋一, 相川, 清明 情報処理学会論文誌 54 (2), 471-483, 2013-02-15

    TRECにおいてSpoken Document Retrieval(SDR:音声ドキュメント検索)のTrackが1996年~2000年に設定され,2006年には米国国立標準技術研究所(NIST)を中心に音声中の検索語検出(Spoken Term Detection:STD)タスクが設定され,以降海外ではさかんにSDR,STDに関する研究が行われるようになった.情報処理学会音声言語情報処理研究会(…

    情報処理学会 Web Site

  • 距離つき音節n-gram索引による音声検索語検出の距離尺度の厳密化

    岩見, 圭祐, 坂本, 渚, 中川, 聖一 情報処理学会論文誌 54 (2), 495-505, 2013-02-15

    ニュースや新聞記事のようにテキスト情報を含むものであれば既存のテキスト検索エンジンを用いることで,欲しい情報を高速に検索することができる.しかし,現在のところ音声ドキュメントに対しての有効な検索手法は確立されていない.その理由としてあげられるのが,未知語や認識誤りといった音声ドキュメント特有の問題である.我々は今までにサブワード単位の認識結果を用いた高速な音声検索語検出(STD)手法を提案してき…

    情報処理学会 Web Site

  • 言語的・音響的コンテキストが音声の聴取および認識に及ぼす影響の考察

    榎並大介, 山本一公, 北岡教英, 中川聖一 第74回全国大会講演論文集 2012 (1), 617-618, 2012-03-06

    大語彙連続音声認識(Large Vocabulary Continuous Speech Recognition; LVCSR) は読み上げ音声に関しては十分な性能を持つようになってきており,ディクテーションや字幕放送システムとして実用化されてきている.一方,対話や講演音声など自由発話の認識も期待されているものの,その性能はいまだに十分とはいえない.本稿では,人間の音響的知覚能力と,局所的なコン…

    情報処理学会

  • 言語的・音響的コンテキストが音声の聴取および認識に及ぼす影響の考察

    榎並大介, 山本一公, 北岡教英, 中川聖一 第74回全国大会講演論文集 2012 (1), 617-618, 2012-03-06

    大語彙連続音声認識(Large Vocabulary Continuous Speech Recognition; LVCSR) は読み上げ音声に関しては十分な性能を持つようになってきており,ディクテーションや字幕放送システムとして実用化されてきている.一方,対話や講演音声など自由発話の認識も期待されているものの,その性能はいまだに十分とはいえない.本稿では,人間の音響的知覚能力と,局所的なコン…

    情報処理学会

  • ポーズを考慮した話し言葉言語モデルの構築

    太田, 健吾, 土屋, 雅稔, 中川, 聖一 情報処理学会論文誌 53 (2), 889-900, 2012-02-15

    本論文では,話し言葉の音声認識タスクで問題となる,入力音声中のポーズと言語モデルの学習コーパス中の句読点との不一致に対処する方法を提案する.自発的に発声される話し言葉の音声では,言語的な区切りとは無関係な位置に多数のポーズが出現するため,言語モデルを学習する際に,コーパス中の句読点をポーズと見なして学習を行うことは適切でない.この問題に対処する最も簡単な方法は,ポーズの情報を含むコーパスから,実…

    情報処理学会 Web Site

  • 重要文抽出に基づく講義音声の自動要約

    藤井, 康寿, 山本, 一公, 北岡, 教英, 中川, 聖一 情報処理学会論文誌 51 (3), 1094-1106, 2010-03-15

    本論文では,大学院における講義音声を対象とした,重要文抽出に基づく自動要約手法を述べる.本論文ではまず,音声要約においてよく使われているMaximal Marginal Relevance(MMR)と識別器にSupport Vector Machine(SVM)を用いたfeature-basedを比較し,feature-basedの方が優れた結果を与えることを示す.次に,feature-base…

    情報処理学会 被引用文献1件

  • 日本語講義音声コンテンツコーパスの作成と分析

    土屋, 雅稔, 小暮, 悟, 西崎, 博光, 太田, 健吾, 山本, 一公, 中川, 聖一 情報処理学会論文誌 50 (2), 448-459, 2009-02-15

    近年,様々な教育機関において,多数のe-Learningコンテンツが作成·利用されている.これらのコンテンツを効果的に活用して学習するには,音声データの検索および要約機能を備えた高機能なコンテンツ閲覧システムが必要である.我々が作成した日本語講義音声コンテンツコーパス(<i>Corpus of Japanese classroom Lecture speech …

    情報処理学会 被引用文献1件

  • フィラー予測モデルに基づく話し言葉言語モデルの構築

    太田, 健吾, 土屋, 雅稔, 中川, 聖一 情報処理学会論文誌 50 (2), 477-487, 2009-02-15

    本論文では,フィラーを含まないコーパスから,フィラー予測モデルに基づいてフィラー付きの話し言葉言語モデルを構築する方法を提案する.本手法では,音声認識対象とは異なるドメインのコーパスからフィラー予測モデルを学習し,認識対象のドメインのフィラーを含まないコーパスに対してフィラーの挿入を行って,フィラーに対応した言語モデルを構築する.日本語話し言葉コーパスを対象とした実験の結果,本提案手法は,フィラ…

    情報処理学会 Web Site 被引用文献2件

  • 自動車内情報システムインタフェース制御のための運転過負荷状態の検出

    北岡, 教英, 高木, 俊一, 中川, 聖一 情報処理学会論文誌 49 (12), 4088-4092, 2008-12-15

    カーナビなど複雑な情報機器が自動車内に導入され,その操作の複雑さが問題になっている.ユーザの認知的負荷を考慮せず,危険なタイミングで情報を提供したり要求したりすることにより,危険が増す.そこで,事故になる危険性が高いような状況では情報を提示しないなどの対処が考えらる.そのため,運転による認知的負荷の高い状態,すなわち過負荷状態の検出を試みた.アクセル踏圧力やブレーキ踏圧力,ハンドル操舵角などの運…

    情報処理学会

  • E-063 Context Dependent Class Language Model Based on LSA

    / 土屋, 雅稔, 中川, 聖一 情報科学技術フォーラム一般講演論文集 6 (2), 291-294, 2007-08-22

    We propose an alternative method in language model, called context dependent class language model (CDC), to solve data sparseness problem which is suffered by n-gram language model. The proposing …

    情報処理学会

  • 機械学習を用いた日本語機能表現のチャンキング

    土屋 雅稔, 注連 隆夫, 高木 俊宏, 内元 清貴, 松吉 俊, 宇津呂 武仁, 佐藤 理史, 中川 聖一 自然言語処理 14 (1), 111-138, 2007

    The Japanese language has many compound functional expressions which consist of more than one word including both content words and functional words. They are very important for recognizing the …

    DOI Web Site

  • 日本語複合辞用例データベースの作成と分析

    土屋, 雅稔, 宇津呂, 武仁, 松吉, 俊, 佐藤理史, 中川, 聖一 情報処理学会論文誌 47 (6), 1728-1741, 2006-06-15

    日本語には,複数の形態素がひとかたまりとなって,1 つの機能語相当語として働く表現が多数存在する.このような表現は一般に複合辞と呼ばれ,日本語文の構造を理解するために非常に重要である.特に,複合辞と同一の形態素列が本来の意味で構成的に用いられている場合と,非構成的に複合辞として用いられている場合とがあり,これらの用法を適切に識別できることが不可欠である.しかし,既存の解析系においては,多くの場合…

    情報処理学会 Web Site 被引用文献8件 参考文献28件

  • 日本語複合辞用例データベースの作成と分析(自然言語,<特集>情報処理技術のフロンティア)

    土屋, 雅稔, TSUCHIYA, MASATOSHI, 宇津呂, 武仁, UTSURO, TAKEHITO, 松吉, 俊, MATSUYOSHI, SUGURU, 佐藤, 理史, SATO, SATOSHI, 中川, 聖一, NAKAGAWA, SEIICHI 情報処理学会論文誌 47 (6), 1728-1741, 2006

    日本語には,複数の形態素がひとかたまりとなって,1つの機能語相当語として働く表現が多数存在する.このような表現は一般に複合辞と呼ばれ,日本語文の構造を理解するために非常に重要である.特に,複合辞と同一の形態素列が本来の意味で構成的に用いられている場合と,非構成的に複合辞として用いられている場合とがあり,これらの用法を適切に識別できることが不可欠である.しかし,既存の解析系においては,多くの場合に…

    機関リポジトリ HANDLE

  • フォーム型Web情報検索サービスのための音声ユーザインタフェースシステムと操作性の評価

    甲斐, 充彦, 盛, 浩和, 中野, 崇広, 中川, 聖一 情報処理学会論文誌 46 (5), 1318-1329, 2005-05-15

    現在,インターネットにおいてWebブラウザで利用できる情報検索サービスが数多く提供されているが,それらはほとんどWebブラウザのGUI(Graphical User Interface)環境での利用を想定している.最近では,音声インタフェースによるWebへのアクセスも検討されているが,既存のWebページへの汎用的なアクセスを提供するものではない.本研究では,Webページ内の選択メニュー型フォーム…

    情報処理学会 Web Site 被引用文献5件 参考文献28件

  • 日英関連報道記事を用いた訳語対応推定

    宇津呂 武仁, 日野 浩平, 堀内 貴司, 中川 聖一 自然言語処理 12 (5), 43-69, 2005

    This paper focuses on bilingual news articles on WWW news sites as a source for translation knowledge acquisition.We take an approach of acquiring translation knowledge of domain specific named …

    DOI Web Site 被引用文献1件

  • データベース検索用音声対話システムにおける移植性の高い意味理解部・検索部の構築と評価

    小暮, 悟, 中川, 聖一 情報処理学会論文誌 43 (3), 714-733, 2002-03-15

    音声対話システムを実現するための要素技術である音声認識技術や言語処理技術の研究開発においては,近年,各種の重要な手法が確立しつつある.しかし,実際に音声対話システムを実用化することを考えた場合,今までのような使いやすさ,頑健性などに関する技術だけでは不十分であり,拡張性や移植性なども十分考慮する必要がある.本論文では,音声対話システムの移植性,特に意味理解部と検索部の移植性に焦点を当て,システム…

    情報処理学会 Web Site 被引用文献3件 参考文献19件

  • 音源情報の特徴量を用いた音声認識

    山田 大輔, 北岡 教英, 中川 聖一 電気学会論文誌C(電子・情報・システム部門誌) 122 (12), 2028-2034, 2002

    We discussed the adoption of the features based on the glottal sound source for speaker independent speech recognition. It has been thought that such features cannot contribute to the speaker …

    DOI Web Site

  • 音声キーワードによるニュース音声データベース検索手法

    西崎, 博光, 中川, 聖一 情報処理学会論文誌 42 (12), 3173-3184, 2001-12-15

    近年,多くのニュース番組が放映されており,過去のニュース番組から興味のある記事を見つけたいという欲求が高まっている.数多くのニュース番組の中から,必要なニュースを見つける場合,各ニュースに対してインデックスが付けられている場合はそれを使って検索することができる.しかし,インデックスが付与されていないニュース音声データからの検索に対する需要もあり,この場合は放送されたすべてのニュースをあらかじめ文…

    情報処理学会 Web Site 被引用文献8件 参考文献35件

  • 係り受け関係を用いた重複表現削除

    石〓 友子, 片岡 明, 増山 繁, 山本 和英, 中川 聖一 自然言語処理 7 (4), 119-142, 2000

    Informative summaries are used as substitutions for original texts.It is necessary for those for captions of newscasting, in particular, to keep the original information as much as possible. This …

    DOI Web Site Web Site 参考文献14件

  • 単語N - gram言語モデルを用いた音声認識システムにおける未知語・冗長語の処理

    甲斐, 充彦, 廣瀬, 良文, 中川, 聖一 情報処理学会論文誌 40 (4), 1383-1394, 1999-04-15

    対話音声認識システムや大語彙のディクテーションシステムにおいては システムの辞書に登録されていない未知語や 間投詞・言い直し・言い淀みなどのユーザの要求に関係のない冗長語の扱いが重要である. このような問題に対処するために 本研究では単語N-gram言語モデルを用いた連続音声認識アルゴリズムにおいて 未知語処理を導入してその効果を調べた. 未知語処理法として …

    情報処理学会 Web Site 被引用文献33件 参考文献29件

  • 間投詞の働きの分析とシステム応答生成における間投詞の利用と評価

    伊藤 敏彦, 峯松 信明, 中川 聖一 日本音響学会誌 55 (5), 333-342, 1999

    本研究では, 独話や対話に存在する間投詞に着目し「発話中の間投詞は聞き手に対してどのような働きを持つのか」「協調的なシステムの応答文生成において間投詞は有効・必要なのか」という観点から, 聴取実験による検討を行った。その結果, 間投詞に関する幾つかの知見を得ることができた。これらの知見に基づき, …

    DOI Web Site 被引用文献4件 参考文献20件

  • 音声単語の同定におけるアクセント核の働きに関する知覚的検討

    峯松 信明, 中川 聖一 日本音響学会誌 56 (1), 39-46, 1999

    本論文では,音声単語に対する心的辞書検索過程において,アクセント核が果たす役割を知覚実験を通して検討した。ここでは,単語アクセントの他に単語親密度も要因として取り上げ,音声単語の同定に必要な語頭からの最短提示長を求めた(gating paradigm)。そして,上記した2種類の要因がもたらす単語同定加速効果を個別に測定すると共に,両者による効果についても定量的に検討した。なお,単語親密度は各単語…

    DOI Web Site 被引用文献1件 参考文献22件

  • F_0変化に伴うスペクトル変動に対する分析とモデル化

    峯松 信明, 中川 聖一 日本音響学会誌 55 (3), 165-174, 1999

    本論文では, まず, 同一母音内の2フレーム間におけるF_0変化とスペクトル変動(ケプストラム距離)の関係を実験的に算出し, 5母音空間におけるVQ歪との比較を通して, その変動の大きさを評価する。次に, 多重回帰分析に基づいてケプストラム係数変動の予測モデルを構築する。本モデルを使用することで, スペクトル変動を精度よく予測できることを示す。また, 統計的検定に基づき, …

    DOI Web Site 被引用文献10件 参考文献17件

  • 協調的応答を備えた音声対話システムとその評価

    伊藤, 敏彦, 小暮, 悟, 中川, 聖一 情報処理学会論文誌 39 (5), 1248-1257, 1998-05-15

    自然言語による音声対話システムにおいては,システムがユーザと協調的に対話を進めていくことは重要である.この考えを基に我々は音声対話システムにおける協調的応答生成システムを開発した.応答生成システムは対話制御部,問題解決器,知識データベース,応答文生成部から構成され,対話システムの意味理解システムによって生成された意味表現を受け取り,可能なかぎり協調的応答をする.たとえば,ユーザの質問文に検索に必…

    情報処理学会 Web Site 被引用文献23件 参考文献20件

  • Bigramの使用による話し言葉用確率文脈自由文法の自動学習

    中川, 聖一, 大谷, 耕嗣 情報処理学会論文誌 39 (3), 575-584, 1998-03-15

    本論文では文のカバー率を改善するための文法規則の自動学習について述べる.この方法は文法規則が登録されていないために解析できない文を解析することを可能にする.システムに入力された文が文法規則が不備なために受理できないとき,システムがこの入力文を使って規則の学習をすることにより文のカバー率を改善する.文法の学習の3つの方法を比較検討する.1つは,文脈自由文法(CFG)の規則の追加学習法,2つめは単語…

    情報処理学会 Web Site 被引用文献14件 参考文献18件

  • マルチモーダル観光案内対話システム

    中川 聖一, 傳田 明弘, 伊藤 敏彦 人工知能 13 (2), 241-251, 1998-03-01

    <p>Recent improvements of speech recognition and natural language processing enable dialogue systems to deal with spontaneous speech. With the aim of supporting these systems, multi-modal …

    DOI Web Site 被引用文献12件 参考文献26件

  • 任意語彙の追加登録可能な単語音声認識システム

    中川 聖一, 鳥居 美和子, 甲斐 充彦, 中西 宏文 電気学会論文誌C(電子・情報・システム部門誌) 118 (6), 865-872, 1998

    In this paper, we describe a new word registration method on a speech recognition system which can treat user's specific words for a speech input based application. Since the speech application can …

    DOI Web Site Web Site 被引用文献2件 参考文献12件

  • 対話音声聴取時における間投詞の働き

    伊藤, 敏彦, 峯松, 信明, 中川, 聖一 全国大会講演論文集 第55回 (人工知能と認知科学), 27-28, 1997-09-24

    本研究では協調的な問題解決の対話音声中に存在する間投詞に着目し「発話中の間投詞は聞き手に対してどのような働きを持つか。」, 「協調的な応答文生成において間投詞は有効又必要なのか。」という観点から, 知覚実験による検討を行なった。実験は対話音声より, 間投詞部分を1) 抜き出して切り詰めた音声試料, 2) 同一時間長の無音置換を施した音声試料, 3) 異なる箇所で発声された同一種類の間投詞, …

    情報処理学会 被引用文献1件

  • パソコン用連続音声認識クライアント・サーバシステムの実装

    伊藤, 敏彦, 甲斐, 充彦, 山本, 一公, 中川, 聖一 全国大会講演論文集 第55回 (人工知能と認知科学), 33-34, 1997-09-24

    近年, バーソナルコンピューター(PC)の性能が向上し, 音声・動画といった計算パワーが必要なマルチメディア関係のアブリケーションも多く見られるようになってきた。そのため, アプリケーションの入力インターフェイスとしてもキーボード・マウスだけでなく, これまでは計算量の問題から実現が難しかったソフトウェアによる音声認識も使用可能となってきた。パソコン上でソフトウェアのみで動作する音声認識システム…

    情報処理学会 被引用文献2件

  • ニュース音声認識システムの検討

    小林 彰夫, 今井 亨, 安藤 彰男, 宮坂 栄一, 赤松 裕隆, 中川 聖一, 小黒 玲, 尾関 和彦, 古井 貞熙, 鈴木 順子, 白井 克彦 日本音響学会研究発表会講演論文集 1997 (2), 103-104, 1997-09-01

    機関リポジトリ 被引用文献14件 参考文献8件

  • 音声認識技術を利用した英会話CAIシステム

    中川, 聖一, AllanA.Reyes, 鈴木, 英之, 谷口, 泰広 情報処理学会論文誌 38 (8), 1649-1658, 1997-08-15

    本論文では,音声認識技術を利用した英会話CAIシステムについて述べる.これは,システムが,学習者の発話を自動音声認識により理解し,待ち時間なしで適切な応答を音声で出力し,対話を進めることにより,スピーキングとヒアリングの能力を高めるものである.まず,日本人の発声した英語の音声認識を行うためには日本人の英語発音モデルを用いる必要があることを示す.次に,評価実験として4人の日本人男性にこの英会話CA…

    情報処理学会 Web Site 被引用文献20件 参考文献16件

  • 音声対話システムの協調的応答に関する一評価

    伊藤, 敏彦, 中川, 聖一 全国大会講演論文集 第54回 (人工知能と認知科学), 235-236, 1997-03-12

    自然言語による対話システムにおいては、システムがユーザと協調的に対話を進めていくことは重要である。データベース検索における協調的応答生成に関しては質問の答以外に付加的な情報を与えたり、失敗した質問に対する理由や代案を提示するものが多い。例えば、ユーザの質問文に検索に必要な情報が含まれていなかったり、検索結果の数が多い場合などはユーザへの質問を行なったり、ユーザの望む検索結果が得られなかった場合、…

    情報処理学会

  • 音声対話システムにおける焦点の抽出と協調的応答

    伊藤, 敏彦, 中川, 聖一 全国大会講演論文集 第53回 (人工知能と認知科学), 353-354, 1996-09-04

    自然言語による対話システムにおいては、システムがユーザと協調的に対話を進めていくことは重要である。発話内容を決定する方法としては、談話の結束性に注目し、修飾構造、談話の焦点などの情報を利用し発話内容を決定するアプローチや、談話をある目的のためのプランとして考え、システムがユーザの質問意図として談話ゴールを推論し、そのゴールの達成に必要な内容を協調的発話として生成するアプローチがある。データベース…

    情報処理学会

  • 人間の理解手法を用いたロバストな音声対話システム

    山本, 幹雄, 伊藤, 敏彦, 肥田野, 勝, 中川, 聖一 情報処理学会論文誌 37 (4), 471-482, 1996-04-15

    現在の音声認識技術では 音声対話システムの品質を向上させるためには 間投詞 助詞落ち 言い直し 倒置等を含む文の理解はもちろん 誤認識文からの発話文の復元も必要不可欠である. そこで復元ストラテジー開発のため 人間は誤認識された音声認識結果をどのようにして またどのくらい原文と意味的に正しい文に訂正できるかという実験を行った. 単語数241 パープレキシティ74の文法で …

    情報処理学会 被引用文献19件 参考文献13件

  • メニューによりガイドされた文節単位発声による音声対話システム

    山本, 幹雄, 高木, 三功, 中川, 聖一 情報処理学会論文誌 37 (4), 461-470, 1996-04-15

    自然言語音声認識システムを利用したインタフェースにおける最も大きな問題の1つは システムの受理できる文を多くすると認識率が低下し 受理できる文を少なくすると認識率は良くなるが ユーザがシステムの受理できる文だけを発話することが困難になることである. 本論文では メニューに基づく自然言語理解技術を音声入力のためのガイドとして応用し 上記の問題を解決する手法を提案し 評価を行った. …

    情報処理学会 被引用文献2件 参考文献8件

  • 日本語音声による観光案内システムのマルチモーダルインターフェイス化

    傳田, 明弘, 中川, 聖一 全国大会講演論文集 第52回 (メディア情報処理), 167-168, 1996-03-06

    音声認識技術、及び、これを支援する自然言語処理技術の向上により、ユーザがより自然な言い回しで対話を行える音声対話システムが実現されてきている。また、音声対話システムの対話を支援する目的で、「音声入出力」以外に「ポインティングジェスチャ入力」等の複数の入出力「手段」(モダリティ)を同時に用いるマルチモーダルインターフェイスの斫究も近年盛んに行われるようになってきている。我々研究室で開発を行ってきた…

    情報処理学会 被引用文献3件

  • 音声対話システムにおけるN-best文認識結果の一利用法

    肥田野, 勝, 中川, 聖一 全国大会講演論文集 第52回 (メディア情報処理), 165-166, 1996-03-06

    音声対話システムにおける自然発話の認識・理解は、間投詞・助詞落ち・助詞誤り・言い直し・未知語などの言語現象により、誤認識や曖昧性を伴うものとなる。本研究では音声認識部において上述の言語現象を考慮しつつ、発話文を認識した結果をN-bestで出力し、言語処理部においては、N-best候補の有効な利用法を検討し、従来の我々のシステムにこの手法を適用し、良好な結果を得たので報告する。

    情報処理学会

  • 単語対制約の追加による話し言葉用文法の自動修正法

    大谷, 耕嗣, 中川, 聖一 全国大会講演論文集 第51回 (人工知能と認知科学), 67-68, 1995-09-20

    これまで、我々の研究室では音声による対話理解の研究として富士山の観光案内をタスクとするシステムの開発を行なってきた。このシステムはユーザが話した文を認識するためにユーザが話すであろう文を文脈自由文法(CFG)で記述している。しかし、システムの文法で受理されない文をユーザが発話した時には、当然システムは、ユーザが話した言葉を認識・理解することはできない。これが、システムの認識間違いの原因の一つとな…

    情報処理学会 被引用文献5件

  • 確率モデルによる日本語の大語彙連続音声認識

    周, 〓, 中川, 聖一 全国大会講演論文集 第51回 (メディア情報処理), 119-120, 1995-09-20

    自然言語処理や音声認識の研究分野では言語モデルの研究が重要な役割を荷なっている。従来、文節文法や文脈自由文法を用いるものが代表的であった。しかし、多量のテキスト入力文や自然な発話文に対してはこのような文法の構築は難しく、これらに確率を導入したり、単語対文法、bigram,trigramを用いることが欧米では盛んに研究されている。現実的には、確率文脈自由文法(SCFG)とtrigram(bigra…

    情報処理学会 被引用文献1件

  • 例文からの話し言葉用文法の半自動修正法

    大谷, 耕嗣, 山本, 幹雄, 中川, 聖一 全国大会講演論文集 第50回 (人工知能及び認知科学), 59-60, 1995-03-15

    自然言語理解システムの研究の1つの目的は、人間とコンピューターの間の使用言語の相違に基づくセマンチィック・ギャップを解消し、人間とコンピューターとの間に新しいインターフェースを確立しようとするものである。我々の研究室での自然言語理解の研究もこの方針に基づき、富士山の観光案内をタスクとする対話システムを開発している。対話システムは、ユーザーが発話するであろう文を文法として持っており、これによりユー…

    情報処理学会 被引用文献5件

  • 音声認識技術を利用した英会話CAIシステム

    Reyes, Allan A., 中川, 聖一 全国大会講演論文集 第50回 (データ処理), 469-470, 1995-03-15

    近年、多くの日本人が海外に出かけるようになり、また、外国人の来日も増え、国際交流が盛んになるにつれ、日本では会話の技術を中心とする英語に対する学習意欲が年々高まってきている。このニーズにこたえるために多くの機関で様々な英会話を学習するためのCAIシステムが開発されている。しかし、これらのシステムの多くは、入力手段としてキーボードやマウスのみを用いており、会話の技術を身に付けるために欠かせない音声…

    情報処理学会 被引用文献1件

  • 音声対話システムにおける自然発話の頑健な一理解法

    肥田野, 勝, 伊藤, 敏彦, 山本, 幹雄, 中川, 聖一 全国大会講演論文集 第50回 (データ処理), 467-468, 1995-03-15

    音声対話システムにおいて自然な発話における間投詞、助詞落ち、言い直し、倒置などを含む文の理解、あるいは誤認識文からの発話文の復元は対話システム品質を向上させるために必要不可欠である。本稿では人間がいかにして文の復元を行なっているかを被験者実験を通して調べ、それを参考にして復元ストラテジーを考案し、ロバストな意味理解システムを構築した。

    情報処理学会 被引用文献2件

  • メニューに基づく音声対話手法を用いた語学CAI

    小池, 武, 山本, 幹雄, 中川, 聖一 全国大会講演論文集 第50回 (情報科学一般), 29-30, 1995-03-15

    近年、インタラクティブな語学教育の重要性の認識に伴い、語学CAIに関する様々な研究が行なわれている。今回、我々はメニューに基づく音声言語処理技術を用いた語学(日本語)CAIシステムを試作した。本システムは、ある程度の日本語の能力を持った外国人留学生の日本語文法、及び発話をより洗練させることを目的としてる。

    情報処理学会 被引用文献1件

  • 自然な音声対話における間投詞・ポーズ・言い直しの出現パターンと音響的性質

    中川 聖一, 小林 聡 日本音響学会誌 51 (3), 202-210, 1995

    人間の自然な発話には間投詞や言い直しが含まれる。特に、間投詞に関しては、1文に1個以上の割合で出現し、また言い直しに関しても10文に1〜2回程度の頻度で出現している。更に言い直しは、1文が長くなるほど現れ易い傾向がある。そのため、自然な発話を扱おうとすると、間投詞や言い直しに対処する必要がある。本論文では、まず間投詞語彙の出現位置と出現頻度及び音響的性質を調べ、その統計情報に基づく音声認識法を述…

    DOI Web Site 被引用文献47件 参考文献15件

  • 音声による対話システムの評価法における一考察

    山本, 誠治, 山本, 幹雄, 中川, 聖一 全国大会講演論文集 第49回 (人工知能及び認知科学), 61-62, 1994-09-20

    近年様々なタスクを扱った多くの音声対話システムが試作されている。しかしそれらのシステムの評価方法はシステム構成やタスクに依存したものが多く、異なる機関で設計されたシステムに対して公平な評価が行なえるような明確な方法はまだ確立されていない。本報告では、これらの音声対話システムの一般的な評価方法についての一考察を述べる。更に"Wizard of …

    情報処理学会 被引用文献1件

  • 音声と直指操作によるロボット制御のシミュレーションシステム

    張, 建新, 中川, 聖一 全国大会講演論文集 第48回 (システム), 165-166, 1994-03-07

    近年、音声応用インタフエースのひとつとして、複数の情報入力手段を利用したユーザインタフェースであるマルチモーダル入カインターフェースの研究が進められている。本稿で、音声と直指操作による2つの入力手段を用いたロボット制御のシミュレーションシステムを作成し、このシステムに対して、実験者の反応や入力時間の評価および入力が暖昧な場合において、従来の入力方法(音声だけあるいは直指操作だけ)との比較実験を行…

    情報処理学会

  • 画像情報と音声情報からの概念と文法の獲得

    升方, 幹雄, 中川, 聖一 全国大会講演論文集 第48回 (人工知能及び認知科学), 33-34, 1994-03-07

    人間はいくつかの感覚器を通して外部の刺激を受け、その情報が脳に伝えられ様々な概念を獲得していると考えられる。特に、視覚と聴覚の刺激が概念の獲得に重要な役割を果たしていると考えられる。そこで、我々は初期知識を持たない状態から、入力の音声と画像より概念と文法を獲得するシステムを開発している。システムには図形に関する画像とそれに対応する音声が入力され、システムは獲得されている概念とその入力の情報を比較…

    情報処理学会

  • パターン認識における有意差検定と音声認識システムの評価法

    中川 聖一, 高木 英行 日本音響学会誌 50 (10), 849-854, 1994

    1.はじめに / 2.有意差検定方法1 (2 項分布の平均の差の検定) / 3.有意差検定方法2 (符号検定,sign test) / 4.有意差検定方法3 (整合対検定, Matched −Pair test) / 5.評価法の適用と音声認識研究の現状分析 / 6.音声認識システ厶の評価法と研究指針 / 7.まとめ

    DOI HANDLE Web Site 被引用文献38件 参考文献7件

  • 音声と直指操作による入力インターフェース

    中川 聖一, 張 建新 電気学会論文誌C(電子・情報・システム部門誌) 114 (10), 1009-1017, 1994

    There has been an increase in interest in the development of human-interface system that incorporates multimodal input-methods.<br>In this study, an Automaton-Controlled One Pass Viterbi program was …

    DOI Web Site Web Site 被引用文献4件

  • メニューに基づく音声自然言語入力システム

    山本, 幹雄, 中川, 聖一 全国大会講演論文集 第47回 (人工知能及び認知科学), 167-168, 1993-09-27

    自然言語によるマン・マシンインターフェスは自然言語によりシステムへさまざまな命令(例えば観光案内システムや計算機のOSに対する命令)を行うものである。さらに音声を使うことにより、多くの人が容易に複雑なシステムを利用可能になることが期待されている。しかし、現実にはユーザが入力するすべての文を理解するシステムを構築するのは困難であり、またユーザがシステムに適応化することも困難であるため、非常に限定さ…

    情報処理学会

  • 視聴覚情報の統合化に基づく概念の獲得

    中川 聖一, 中西 宏文, 古部 好計, 板橋 光義 人工知能 8 (4), 499-508, 1993-07-01

    <p>There have been many works to embed the learning capability into computers. But these researches have not yet arrived at the goal. Traditional artificial intelligence systems have been responded …

    DOI 被引用文献8件 参考文献21件

  • 対話行為に関する信念と意図の推論システム

    森岡, 靖太, 山本, 幹雄, 中川, 聖一 全国大会講演論文集 第46回 (人工知能及び認知科学), 203-204, 1993-03-01

    対話時の人間の行動を理解することは、人間の理解のみならず、人工知能やマンマシンインターフエースの向上に不可欠のことと思われる。対話および対話で見られる現象を説明するには、発話内容ばかりでなく、対話時の周囲の環境や、対話参加者の心理状態や能力、お互いに対する知識、信念など、多くの要因を考慮する必要がある。本報告では、信念と意図の概念を用いて対話行為を定義し、協調的な対話参加者が行うある対話状況下で…

    情報処理学会

  • 音声対話システムにおけるユーザ発話の単語・構文予測

    森屋, 裕治, 阿部野, 尚, 山本, 幹雄, 中川, 聖一 全国大会講演論文集 第46回 (人工知能及び認知科学), 233-234, 1993-03-01

    連続音声による機械との対話システムにおいては、対話領域(タスク)を限定してもユーザは様々な種類の発話を行う可能性があり、処理量が膨大になり、認識率も劣化する。そこで、ユーザの発話に対しなんらかの予測を行うことにより、音声認識の効率(認識率、処理時間)向上をはかることができると考えられる。ユーザとシステムが協調的対話を行うならば、対話は話題の中で進行するので、話題に対応する単語の予測を行うことがで…

    情報処理学会

  • 最大事後確率推定法を用いた連続出力分布型HMMの適応化

    中川 聖一, 越川 忠 日本音響学会誌 49 (10), 721-728, 1993

    目視による音節切り出しが不要な"シーケンシャル連結学習"により、文発話データとその音節ラベル系列だけで連続出力型の単一及び混合分布の音節HMMを話者適応化する手法について報告する。 シーケンシャル連結学習は、最大事後確率推定法(MAP推定)を用い、1文の適応化サンプルが与えられるたびに最適なパラメータを推定する。平均ベクトルの適応化は切り出された音節による従来法とほぼ同じ結果を与え、共分散行列ま…

    DOI Web Site 被引用文献43件 参考文献15件

  • 音声対話文における助詞落ち・倒置の分析と解析手法

    山本, 幹雄, 小林, 聡, 中川, 聖一 情報処理学会論文誌 33 (11), 1322-1330, 1992-11-15

    音声対話における発話文は 言い淀み 言い直し 間投詞 助詞の省略 倒置などの話し言葉特有の特徴を持つため これまでの書き言葉に対する自然言語の解析手法をそのまま適用するには問題がある・本論文では解析において まず問題と通る名詞文節の助詞落ちと倒置について 実際の音声対話文約1 800文を分析し その結果をもとに解析手法を提案する.音声対話文では …

    情報処理学会 被引用文献20件 参考文献11件

  • 信念様相論理の効率的な部分系

    山木, 幹雄, 森岡, 靖太, 中川, 聖一 情報処理学会論文誌 33 (10), 1193-1202, 1992-10-15

    複数の人間の信念を表現し 推論する論理として様相論理の1つであるKD45(m)がある.しかし この公理系は充足決定問題の計算量がP領域完全であるという問題点を持っている理由はこの論理の意味論である可能世界モデルの可能世界の数が入力に対して指数関数的に増大するためである可能世界の数を減らすような制限によって計算量を減らすことができる.本論文ではこのような2つの制限を提案し考察する1つ目の制限はKD…

    情報処理学会 被引用文献2件 参考文献10件

  • 曖昧さに関する質問機能を持つ音声対話システム

    森屋, 裕治, 山本, 幹雄, 中川, 聖一 全国大会講演論文集 第45回 (人工知能及び認知科学), 143-144, 1992-09-28

    対話システムにおいて確実な対話を行うために、ユーザの発話に曖昧さが生じた場合、ユーザの協力を得てその曖昧さを解消するという方法が考えられる。そこで、システムがユーザの発話文を理解する際に不明確な、負を発見した場合、それを明確にするためのユーザに対する質問(これを「確認・明白化の質問」と呼ぶことにする)をする機能を持つ音声対話システムを提案する。実験システムとして、観光案内を対象にした音声対話シス…

    情報処理学会

  • 確率文脈自由文法による音声言語のモデル化

    周, 旻, 中川, 聖一 全国大会講演論文集 第44回 (人工知能及び認知科学), 145-146, 1992-02-24

    言語情報の利用によって音声認識を向上させることができることはよく知られている。そのための研究の一つとして、我々は確率文脈自由文法(SCFG)で言語をモデル化する試みを行っている。本報告では、与えられたタスクの文集合を確率文脈自由文法で表現する場合、必要となる訓練用の文集合の大きさと文法の推定精度について検討した。

    情報処理学会

  • 隠れマルコフモデルによる自然言語のモデル化と多言語間の識別

    上田, 佳央, 中川, 聖一 全国大会講演論文集 第44回 (人工知能及び認知科学), 161-162, 1992-02-24

    自然言語の音声を、マルコフモデルを基礎とするHMM(Hidden Markov Model,隠れマルコフモデル)を用いてモデル化を行なった.言語音声のモデル化や識別の研究は,これもで多くの研究者によってなされている.次に,このモデルを用いて,与えられた音声がどの国の言語であるかを自動的に識別することを目的として実験を行なった.識別する言語として,中国語,英語,インドネシア語に,日本語の4カ国語を…

    情報処理学会

  • 音声対話とキーボード対話における発話文の統語的特徴の比較

    小林, 聡, 山本, 幹雄, 中川, 聖一 全国大会講演論文集 第44回 (人工知能及び認知科学), 149-150, 1992-02-24

    これまでに研究されてきた対話システムでは、主にキーボードによる入力を用いている。しかし、話し言葉と書き言葉は異なるため、これまで蓄積されてきた書き言葉に対する技術を音声対話システムにそのまま応用することはできない。音声対話システムを構築するには音声入力とキーボード入力のそれぞれの入力文の統語的特徴を文析・理解しておかなければならない。最近、音声対話とキーボード対話との違いや、音声対話そのものに関…

    情報処理学会

  • 音声と画像の対応付けに基づく概念獲得アルゴリズム

    古部, 好計, 中川, 聖一, 中西, 宏文 全国大会講演論文集 第44回 (人工知能及び認知科学), 27-28, 1992-02-24

    近年になって、言語学習の研究において、言語入力と非言語入力を同時に与えることにより、効率的に言語、および,その意味的な内容を学習するシステムがSiskindらによって提案されてきた。しかし、これらは非言語入力が一段述語論理の形式であり、実際に非言語的な情報を入力として与えているわけではない。本研究では、実際に音声と画像を与えることにより、その音声が意味する画像の内容を概念として獲得するシステムを…

    情報処理学会

  • 多重様相論理TMS

    山本 幹雄, 中川 聖一 人工知能 6 (3), 397-406, 1991-05-01

    <p>Modal logics are primarily concerned with necessity and possibility, but they can also provide a framework for belief, knowledge, time and so on. Although, in general, only one type of modality …

    DOI 被引用文献1件

  • 連続出力分布型HMMの話者適応化による日本語音韻・音節認識

    中川 聖一, 平田 好充 日本音響学会誌 47 (7), 459-467, 1991

    多次元正規分布を仮定した連続出力分布型HMMの話者適応化を、分布の平均ベクトルを適応化することで実現した。教師なし話者適応化手法は、全カテゴリの平均ベクトルの集合をコードブックと見なし、未知話者の適応化したデータをベクトル量子化する際の量子化誤差ベクトルを利用するものである。100単語を学習データとして適応化した結果の日本語23音韻認識率は、二人の未知話者に対して適応化前に比べて教師なし適応化で…

    DOI Web Site 被引用文献8件

  • プランの実行モデルによる発話意図の解析

    山本, 幹雄, 中川, 聖一 全国大会講演論文集 第40回 (人工知能及び認知科学), 434-435, 1990-03-14

    発話の意図の推論あるいは発話間の関係の解析法は現在盛んに研究されており、特にプラン認識による方法が成功している。この方法では人間の行動モデルであるプランニングを対話行為を説明するために導入し、プラン認識の手法を使ってユーザのプランを認識する。認識されたプランの階層はそのまま意図の階層にもなっている。しかし、この方法は現実の対話に比べると非常に限定された種類の対話しか解析できない。この原因の1つは…

    情報処理学会

  • 連続出力分布型HMMによる日本語音韻認識

    中川 聖一, 平田 好充, 橋本 泰秀 日本音響学会誌 46 (6), 486-496, 1990

    量子化誤差のない連続出力分布型HMMを用いて日本語の23音韻を対象にして認識を行った。まず、比較的難しいタスクとされている有声破裂音 /b/,/d/,/g/ の認識を、種々のモデル構造を使って検討した。その結果、混合連続出力分布HMMを用いた場合で3人話者の平均で97.8%の認識率が得られた。更に、そのモデルに線形回帰係数をパラメータとして付加することにより、98.4%まで認識率を上げることがで…

    DOI Web Site 被引用文献26件

  • 連続音声認識・理解システムのための構文解析法の比較・検討

    中川, 聖一, 大黒, 慶久 情報処理学会論文誌 30 (8), 932-943, 1989-08-15

    音声理解システムにおいて 単語ラティスから最適単語列の解釈を見つけるアルゴリズムとしていくつかの方法が提案されている.本論文では文脈自由文法を用いた文音声認識アルゴリズムとして left-to-right & top-down型構文解析法とisland-driven & bottom-up構文解析法とを種々の観点から比較検討した.両者の差異を明らかにするために 単語ラティスの質 音素認識率 …

    情報処理学会

  • ボルツマンマシンによる文節ラティスの係り受け解析

    村瀬, 功, 中川, 聖一 全国大会講演論文集 第38回 (人工知能及び認知科学), 378-379, 1989-03-15

    文節単位に発声された音声でも、その認識は非常に難しく、通常は複数候補を出力し、言語処理によつて最適な候補列を求める方法をとる。そのための構文解析アルゴリズムが種々提案されている。 本稿では、上述の構文解析の問題を一種の最適化問題とみなし、ボルツマンマシンを適用した結果について述べる。

    情報処理学会

  • タスク・オリエンティッドな対話の意図構造とプランの関係

    山本, 幹雄, 中川, 聖一 全国大会講演論文集 第38回 (人工知能及び認知科学), 253-254, 1989-03-15

    1つの文を処理するシステムが文の中の構造(文法)を重要な情報源としたように、対話システム・談話理解システムを構築する場合には、対話あるいは談話の構造が重要な役割を果たす。そこで、いくつかの談話理論が提案されているが、中でもGROSZ&SIDNER〔1986〕によって提案された談話構造の理論はそれまでの理論を統合した理論であり注目されている。その理論中で、談話構造は3つの部分に分解される。それぞれ…

    情報処理学会

  • 自然言語の文法と意味解析規則の帰納的学習システム

    中川, 聖一, 山本, 幹雄, 若原, 一彰 情報処理学会論文誌 30 (1), 72-80, 1989-01-15

    自然言語処理は 1970年代から盛んに研究されているが 実用化するためには多くの問題点がある.その中の一つに 自然言語処理に必要な知識量が膨大であるという問題点がある.ここで もし必要な知識データをある程度自動的に獲得できれば データを作る負担が軽減できる.そこで 本研究では 自然言語の文法と意味解析規則を 文とその意味の例から帰納的に学習するシステムを開発した.本システムは …

    情報処理学会 被引用文献2件

  • 日本語交通規則文に関するQ-Aシステムの意味解析部

    竹本, 信治, 中川, 聖一 全国大会講演論文集 第37回 (自然言語処理), 1068-1069, 1988-09-12

    本Q-Aシステムは運転免許の学科試験で出題される交通規則の問題文を自然言語で入力し、その文を論理表現に変換して問題の真偽を判定するものである。山本システムは、構文解析部・意味解析部・推論部・学習部の4つの処理系と、内部データとしての見出し辞書・日本語辞書・知識データベースから構成されている(図1)。意味解析部は構文解析部と推論部の橋渡しの役目を担う部分であり、係り受け処理により解析された文のtr…

    情報処理学会

  • 語中VCV音節を用いた予備選択法と大語彙単語音声認識法

    沢井 秀文, 高橋 一徳, 米山 正秀, 中川 聖一 日本音響学会誌 44 (6), 407-418, 1988

    単語中から半自動的に抽出した609種のVCV音節パターンの評価を行い、これらを連結して大語彙の単語標準パターンを作成する。次に、単語中のVCV音節を用いた予備選択法と、ベクトル量子化法とユークリッド距離による特定話者の単語認識法について述べる。また、音韻ごとのマハラノビスの汎距離によるマルチスピーカの単語認識法について述べる。1,005個の単語辞書を用いた100都市名の単語認識において、1/30…

    DOI Web Site

  • 音声による対話システムにおける発話の確認方法

    浮田, 輝彦, 石川, 憲洋, 中川, 聖一, 坂井, 利之 情報処理学会論文誌 22 (6), 589-595, 1981-11-15

    文音声の機械による自動認識は重要なテーマである.本論文では 音声による対話システムを開発する際に問題となる発話の確認方法について述べる.まず 利用者にとって自然な確認方法を調べるために 雑音のある環境下での人間同士の対話実験を行う.それにより 人が利用している発話の確認方法として 1)再発話の要求 2)文全体の確認 3)キーワードによる確認などがあることが示される.次に …

    情報処理学会

  • 音韻認識能力と単語認識率との関係

    中川, 聖一 情報処理学会論文誌 22 (5), 488-496, 1981-09-15

    大規模語其や不特定話者の単語音声の認識では 単語単位のパターンマッチングよりも 一旦音韻91位で認識した後 単語を認識する2段階方式の方が有望だと 思われる.本論文では 単語音声自動認識システムにおける音韻認識部をシミュレートすることによって 音韻識別率 脱落確率 挿入確率等と単語認識率との関係を調べた.その結果 挿入誤りよりも脱落誤りが単語認識率に与える影響が大きいこと …

    情報処理学会 被引用文献9件

  • 音声自動認識に関する情報工学的諸考察

    中川, 聖一, 坂井, 利之 情報処理学会論文誌 21 (5), 407-417, 1980-09-15

    本論文は 音声自動認識についてのさまざまな問題点を列挙し それらに対する諸考察を実験結果を基に述べている.それらは 一貫して音声自動認識をシステム的にとらえたもので より本質的な能率のよい効果的な認識方法を見い出すことに主眼をおいている.主な研究結果として 音韻識別へのグルービング手法の導入 音韻識別部の能力が単語識別率に与える影響評価 …

    情報処理学会

  • 1 / 1
ページトップへ