牧野 正三 MAKINO Shozo

ID:1000000089806

東北大学|現在,東北文化学園大学 Tohoku University | Presently with Tohoku Bunka Gakuen University (2012年 CiNii収録論文より)

同姓同名の著者を検索

論文一覧:  296件中 1-20 を表示

  • アマチュア歌唱エンタテインメントのための熱唱度評価システムSEES

    大道 竜之介 , 伊藤 仁 , 牧野 正三 , 伊藤 彰則

    本研究の目標は,歌唱の熱唱度を自動的に評価するシステムを開発することである.カラオケの採点システムに代表されるように,歌唱音声の自動評価によってアマチュア歌唱エンタテインメントに付加価値をもたらそうとする研究が盛んに行われてきた.しかしほとんどの研究において,その評価しようとする側面は歌唱のうまさである.本研究では歌唱のうまさではなく熱唱度に着目し,その知覚に関する基本的な特性を明らかにするととも …

    研究報告音楽情報科学(MUS) 2012-MUS-94(2), 1-7, 2012-01-27

    情報処理学会 情報処理学会

  • 監視マイクロホンのための多段GMMを用いた異常音検出手法

    伊藤 彰則 , 相場 亮人 , 伊藤 仁 [他] , 牧野 正三

    筆者らは,マイクロホンで観測した環境音中から異常な音を自動検出する手法として,複数のGMMを併用することで出現頻度の少ない正常音を学習する「多段GMM」をこれまで提案してきた.本稿では,多段GMMを用いたときの異常音検出性能と,監視環境での背景音の関係について検討した.その結果,高騒音下では検出性能が低下し,検出性能は背景音と異常音のSN比に依存することが明らかとなった.また,提案法では複数のしき …

    電子情報通信学会技術研究報告. PRMU, パターン認識・メディア理解 110(219), 1-6, 2010-10-01

    参考文献19件

  • 監視マイクロホンのための多段GMMを用いた異常音検出手法

    伊藤 彰則 , 相場 亮人 , 伊藤 仁 [他] , 牧野 正三

    筆者らは,マイクロホンで観測した環境音中から異常な音を自動検出する手法として,複数のGMMを併用することで出現頻度の少ない正常音を学習する「多段GMM」をこれまで提案してきた.本稿では,多段GMMを用いたときの異常音検出性能と,監視環境での背景音の関係について検討した.その結果,高騒音下では検出性能が低下し,検出性能は背景音と異常音のSN比に依存することが明らかとなった.また,提案法では複数のしき …

    電子情報通信学会技術研究報告. SP, 音声 110(220), 1-6, 2010-10-01

    参考文献19件

  • 監視マイクロホンのための多段GMMを用いた異常音検出手法

    伊藤 彰則 , 相場 亮人 , 伊藤 仁 [他] , 牧野 正三

    筆者らは,マイクロホンで観測した環境音中から異常な音を自動検出する手法として,複数のGMMを併用することで出現頻度の少ない正常音を学習する「多段GMM」をこれまで提案してきた.本稿では,多段GMMを用いたときの異常音検出性能と,監視環境での背景音の関係について検討した.その結果,高騒音下では検出性能が低下し,検出性能は背景音と異常音のSN比に依存することが明らかとなった.また,提案法では複数のしき …

    電子情報通信学会技術研究報告. WIT, 福祉情報工学 110(221), 1-6, 2010-10-01

    参考文献19件

  • Quinphone HM-Net を用いた単語グラフ統合に基づく講演音声認識

    加藤 正治 , 小坂 哲夫 , 伊藤 彰則 [他] , 牧野 正三

    書き言葉においては高い認識精度が達成されているが,話し言葉では言い淀み,フィラー,不明瞭な発声などなどさまざまな問題があり,未だ十分な性能は達成されていない.特に調音結合など音響的な変動が大きく問題となっている.この問題を解決するためにtriphoneやquinphoneなど環境依存モデルが提案されている.しかし,話し言葉においてはこの調音結合の程度も変動する.このため本研究では単語グラフ統合を用 …

    電子情報通信学会技術研究報告. SP, 音声 110(81), 37-42, 2010-06-10

    参考文献9件

  • 歌唱の「熱唱度」評価の検討

    大道 竜之介 , 伊藤 仁 , 伊藤 彰則 [他] , 牧野 正三

    歌唱音声の新たな評価指標として 「熱唱度」 の導入を提案する.聴取実験の結果から,歌唱音声中のビブラートおよび呼吸音が,熱唱の知覚に関与することがわかった.本稿では, 歌唱音声におけるビブラート,有声呼吸音,声門破裂の 3 つの特徴を挙げ,これらを定量化する音響特徴量について検討する.34 名の歌唱音声に対する聴取実験から得た,熱唱度の聴取実験スコアと,複数の音響特徴量との重回帰分析を行い,それら …

    研究報告音楽情報科学(MUS) 2010-MUS-85(10), 1-6, 2010-05-20

    情報処理学会 参考文献10件

  • 複数F0候補を用いた音楽音響信号からのハミング楽曲検索

    小杉 優 , 伊藤 彰則 , 伊藤 仁 [他] , 牧野 正三

    本稿では,音響信号しか存在しない音楽データに対するハミング楽曲検索手法を提案する.ほとんどのハミング楽曲検索方式では,楽曲のデータベースとして楽譜情報や MIDI のように記号化されたメロディ情報を想定しているが,実際には録音楽曲しか存在しない場合も多い.我々のシステムでは,多くの楽器音が含まれるモノラル音楽音響信号からデータベースを作成することを想定している.音響信号から,フレーム毎に基本周波数 …

    研究報告音楽情報科学(MUS) 2010-MUS-85(8), 1-6, 2010-05-20

    情報処理学会 参考文献6件

  • 時間冗長性圧縮によるボコーダ型音声符号化の低ビットレート化

    木幡 稔 , 鈴木 基之 , 伊藤 彰則 [他] , 牧野 正三

    これまでに筆者らは,連続情報源に含まれる時間的な冗長性を圧縮符号化する方式として,新しいセグメント量子化法であるLempel-Ziv Segment Quantization(LZSQ)を提案した.これは,離散情報源用の圧縮法であるLZ符号化を連続情報源に適用できるように修正したものである.本論文ではLZSQをボコーダ型の低ビット音声符号化方式に適用し,時間冗長性を圧縮することにより,更なるビット …

    電子情報通信学会論文誌. D, 情報・システム = The IEICE transactions on information and systems (Japanese edition) 93(5), 588-597, 2010-05-01

    参考文献19件

  • マルチタスク型音声対話システムの対話制御のための発話識別 (言語理解とコミュニケーション)

    粟野 健太郎 , 伊藤 仁 , 伊藤 彰則 [他] , 牧野 正三

    電子情報通信学会技術研究報告 109(355), 37-42, 2009-12-21

    CiNii PDF - オープンアクセス 

  • WWWを利用したトピック関連語推定に基づく言語モデル教師なし適応の性能評価

    増村 亮 , 伊藤 仁 , 伊藤 彰則 [他] , 牧野 正三

    大語彙連続音声認識の高精度化のために,WWW 上から認識対象のトピックに関連したテキストを収集し,言語モデル適応を行う.我々は,認識対象の音声認識結果から全自動で検索クエリを生成する教師なしの方法に焦点を当てる.本稿では,WWW を利用して単語の関連性を表す特徴ベクトルを抽出することで,適切にトピック関連語およびサブトピックを推定する方法を提案した.そして,音声認識実験を行うことで提案法の有効性を …

    音声言語情報処理(SLP) 2009-SLP-79(32), 1-6, 2009-12-14

    情報処理学会 参考文献11件

  • マルチタスク型音声対話システムの対話制御のための発話識別

    粟野 健太郎 , 伊藤 仁 , 伊藤 彰則 [他] , 牧野 正三

    本稿では容易に設計できるマルチタスク型音声対話システムを目的とし,そのシステムにおける対話制御と対話制御に必要な発話識別の方法を検討した.システム内では,確認応答型システムと一問一答型システムをサブシステムとして用いた.対話制御は発話識別部分と個々のサブシステムの対話制御部分で構成される.発話識別は話者の最初の発話に対する識別と,2 回目の発話に対する識別の 2 種類がある.音声認識結果とテキスト …

    音声言語情報処理(SLP) 2009-SLP-79(7), 1-6, 2009-12-14

    情報処理学会 参考文献13件

  • 時間冗長性圧縮によるボコーダ型音声符号化の低ビット化

    木幡 稔 , 鈴木 基之 , 伊藤 彰則 [他] , 牧野 正三

    これまでに筆者らは,連続情報源に含まれる時間的な冗長性を圧縮符号化する方式として,新しいセグメント量子化法であるLempel-Ziv Segment Quantization(LZSQ)を提案した.これは,離散情報源用の圧縮法であるLZ符号化を連続情報源に適用できるように修正したものである.本稿ではLZSQをボコーダ型の低ビット音声符号化方式に適用し,時間冗長性を圧縮することにより,さらなるビット …

    電子情報通信学会技術研究報告. SP, 音声 109(308), 7-12, 2009-11-19

    参考文献13件

  • MP3パケットロス隠蔽における音質の客観評価に関する検討

    今野 清志 , 伊藤 仁 , 伊藤 彰則 [他] , 牧野 正三

    本稿では,パケットロス隠蔽を適用したMP3音楽に対して有効な客観評価法について検討を行う.広帯域音楽信号の音質を客観的に評価する従来法としてはITU-R BS.1387で勧告されているPEAQがある.しかしながら,PEAQは主な劣化要因としてオーディオ圧縮コーデックによる劣化を対象にしており,パケットロス隠蔽音楽に対する評価性能は十分でない.そこで,PEAQにおける部分評価値であるMOVに対して重 …

    電子情報通信学会技術研究報告. EA, 応用音響 109(166), 37-42, 2009-07-27

    参考文献9件

  • 多段GMMおよびセグメントモデルを用いた異常音検出の検討

    相場 亮人 , 伊藤 仁 , 伊藤 彰則 [他] , 牧野 正三

    本研究では,監視マイクロフォンのための異常音検出システムを提案する.提案システムは実際に監視場所で発生した日常音を学習したモデルを用いて,学習されていない音を異常音として検出する.これによって,検出対象を特定のイベントに限定しない,あらゆる異常に対応可能なシステムとなる.ここでは実環境の音を用いて実験を行い,提案システムの検出性能を評価した.発生率が小さい日常音をモデル化するために多段GMMの手法 …

    電子情報通信学会技術研究報告. EA, 応用音響 109(166), 71-75, 2009-07-27

    参考文献7件 被引用文献3件

  • 複数の音声対話システム併用のための発話識別

    粟野 健太郎 , 伊藤 仁 , 伊藤 彰則 , 牧野 正三

    情報処理学会研究報告. SLP, 音声言語情報処理 76, O1-O6, 2009-05-21

    参考文献4件

  • 複数の音声対話システム併用のための発話識別

    粟野 健太郎 , 伊藤 仁 , 伊藤 彰則 [他] , 牧野 正三

    本稿では複数の音声対話システムを併用することを目的とし,そのために必要な発話識別の方法を検討した.併用するシステムとして,確認応答型システムと一問一答型システムを用いた.識別の特徴量として発話の各タスクらしさを表すスコアと音声認識結果の尤度を用いた.発話識別は特徴量の大小比較とニューラルネットで行った.音声認識結果が1-best時とN-best時の両方で識別実験を行ったところ,80%以上の正解率を …

    研究報告自然言語処理(NL) 2009-NL-191(15), 1-6, 2009-05-14

    情報処理学会 参考文献4件

  • WWW を利用した言語モデル適応のための検索クエリ構成の検討

    増村 亮 , 伊藤 仁 , 伊藤 彰則 [他] , 牧野 正三

    大語彙連続音声認識において,高精度な認識を実現する有効な手段として,認識対象にマッチしたテキストを収集し,認識対象に適応した言語モデルを作成する方法がある.この言語モデル適応のために,WWW (World Wide Web) から自動的に認識対象にマッチしたテキストの収集を行う.WWW からテキストを得るには,検索のためのクエリを構成する必要がある.本研究では,認識対象の未知語を獲得するような検索 …

    研究報告自然言語処理(NL) 2009-NL-191(10), 1-8, 2009-05-14

    情報処理学会 参考文献11件 被引用文献1件

  • 複数 F0 候補データベースによる歌声楽曲検索の検討

    小杉 優 , 伊藤 仁 , 伊藤 彰則 [他] , 牧野 正三

    本稿では,複数 F0 候補を持つデータベースを用いた歌声楽曲検索について検討する.ここでは,CD 等の音響信号から自動的にメロディーラインの基本周波数 (F0) 候補を複数選択し,データベースとして保持する.上記データベースに対し,楽曲検索を行う手法について検討した.その結果,F0 候補を複数個使用することによって,単独 F0 を用いた場合の 1 位正解率を,29.2% から 41.7%,10 位 …

    研究報告音楽情報科学(MUS) 2009-MUS-80(6), 1-6, 2009-05-14

    情報処理学会 参考文献6件

  • 複数の音声対話システム併用のための発話識別

    粟野 健太郎 , 伊藤 仁 , 伊藤 彰則 [他] , 牧野 正三

    本稿では複数の音声対話システムを併用することを目的とし,そのために必要な発話識別の方法を検討した.併用するシステムとして,確認応答型システムと一問一答型システムを用いた.識別の特徴量として発話の各タスクらしさを表すスコアと音声認識結果の尤度を用いた.発話識別は特徴量の大小比較とニューラルネットで行った.音声認識結果が1-best時とN-best時の両方で識別実験を行ったところ,80%以上の正解率を …

    研究報告音声言語情報処理(SLP) 2009-SLP-76(15), 1-6, 2009-05-14

    情報処理学会

  • WWW を利用した言語モデル適応のための検索クエリ構成の検討

    増村 亮 , 伊藤 仁 , 伊藤 彰則 [他] , 牧野 正三

    大語彙連続音声認識において,高精度な認識を実現する有効な手段として,認識対象にマッチしたテキストを収集し,認識対象に適応した言語モデルを作成する方法がある.この言語モデル適応のために,WWW (World Wide Web) から自動的に認識対象にマッチしたテキストの収集を行う.WWW からテキストを得るには,検索のためのクエリを構成する必要がある.本研究では,認識対象の未知語を獲得するような検索 …

    研究報告音声言語情報処理(SLP) 2009-SLP-76(10), 1-8, 2009-05-14

    情報処理学会 参考文献11件

ページトップへ