滝口 哲也 TAKIGUCHI Tetsuya

ID:1000040397815

神戸大学自然科学系先端融合研究環 Organization of Advanced Science and Technology, Kobe University (2014年 CiNii収録論文より)

Search authors sharing the same name

Articles:  1-20 of 162

  • Voice Conversion Using Speaker Adaptive Restricted Boltzmann Machine  [in Japanese]

    NAKASHIKA Toru , TAKIGUCHI Tetsuya , ARIKI Yasuo

    声質変換は,入力した音声を音韻情報などを保ったまま,話者性に関する特定の情報のみを変換する技術であり,話者変換や感情変換,発話支援など様々なタスクへの応用が期待されている.従来の多くの声質変換手法は,同一発話内容の入出力音声対(パラレルデータ)を学習時に必要とするが,予め発話内容を決めておく必要がある,音声間のアライメントを取る必要があるなど,学習データを慎重に用意しなければならないという問題があ …

    IEICE technical report. Speech 114(365), 165-170, 2014-12-15

  • Multimodal Voice Conversion using Weighted Features in Noisy Environments  [in Japanese]

    MASAKA Kenta , AIHARA Ryo , TAKIGUCHI Tetsuya , ARIKI Yasuo

    声質変換は,入力した音声を音韻情報などは保ったまま,話者性のような特定の情報のみを変換する技術であり,話者変換や感情変換,発話支援など様々なタスクへの応用が期待されている.従来の代表的な手法であるGMMを用いた統計的なアプローチ等は,あくまでクリーン音声を用いた評価を行っており,雑音環境下を考慮した定式化はされていない.本研究では,雑音環境下での声質変換など,これまでになかったタスクに対応可能な非 …

    IEICE technical report. Speech 114(365), 87-92, 2014-12-15

  • Many-to-one Voice Conversion using Multiple Non-negative Matrix Factorization  [in Japanese]

    AIHARA Ryo , TAKIGUCHI Tetsuya , ARIKI Yasuo

    本報告では,非負値行列因子分解(NMF)を拡張したMultiple Non-negative Matrix Factorization(Multi-NMF)を提案し,任意話者の発話を特定話者の発話へと変換する多対一声質変換を行う.従来,声質変換は入力話者の声質を出力話者のものへ変換する話者変換を目的として広く研究されてきた.声質変換において最も一般的な手法は混合正規分布モデル(GMM)を用いた統計 …

    IEICE technical report. Speech 114(365), 75-80, 2014-12-15

  • Individuality-preserving Voice Conversion for Articulation Disorders Using Sparse Dictionary Learning  [in Japanese]

    AIHARA Ryo , TAKIGUCHI Tetsuya , ARIKI Yasuo

    本研究では,アテトーゼ型脳性麻痺による構音障害者を対象とし,筋肉の不随意運動を原因とする障害者の不安定な発話を聞き取りやすく変換することを目指す.「自分らしい声で話したい」という障害者のニーズに応えるため,本研究では従来の統計的モデルによる声質変換とは異なる非負値行列因子分解(NMF)を用いたExemplar-based声質変換を用いて,話者性を維持しつつ聞き取りやすい音声に変換する.NMF声質変 …

    IEICE technical report. Speech 114(91), 39-44, 2014-06-19

  • Speaker-dependent conditional restricted Boltzmann machine for voice conversion  [in Japanese]

    NAKASHIKA Toru , TAKIGUCHI Tetsuya , ARIKI Yasuo

    本研究では,元の音響特徴量空間よりも音韻性や時間変化性を抑え,話者性を強調させることによって,より入力話者音声の声質を出力話者のものへと変換しやすい話者依存空間を形成することを目的として,話者ごとにconditional restricted Boltzmann machine(CRBM)を用いた声質変換法を提案する.提案手法ではまず初めに,話者ごとに用意した学習データ(パラレルデータである必要は …

    IEICE technical report. Speech 113(366), 83-88, 2013-12-19

  • Voice Conversion based on Non-negative Matrix Factorization with Segment Features in Noisy Environments  [in Japanese]

    FUJII Takao , AIHARA Ryo , TAKIGUCHI Tetsuya , ARIKI Yasuo

    本報告では,雑音環境下に強いNMFによる声質変換の手法を提案する.ここでは入力話者と出力話者それそれの同一発話内容の音声特徴量をサンプルとするパラレル辞書を構築する.更に,入力音声の発話前後の非音声区間から雑音辞書を構築し,入力として与えられる雑音重畳音声を入力音声辞書と雑音辞書の線形結合で表現する.この入力音声と辞書から推定される重み行列のうち,音声辞書に関する重みのみを取り出し,出力話者の音声 …

    IEICE technical report. Speech 113(366), 77-82, 2013-12-19

  • Classification of Children with Autism Spectrum and Typically Developing Children Using Pitch Features  [in Japanese]

    KAKIHARA Yasuhiro , TAKIGUCHI Tetsuya , ARIKI Yasuo , NAKAI Yasushi , TAKADA Satoshi

    近年,自閉症スペクトラム障害の発生頻度の増加が注目されている.自閉症スペクトラム障害とは,自閉性障害,アスペルガー障害,特定不能の広汎性発達障害の総体である.これらの障害は多様な原因に基づいて発症するため根本的な治療は困難とされているが,この障害に特化した支援による早期療育の効果が報告されている.本研究では,自閉症スペクトラム障害の早期発見を音響的な側面から目指し,ピッチ特徴量をSVMの入力として …

    IEICE technical report. Speech 113(366), 35-40, 2013-12-19

  • Voice Conversion for Articulation Disorders Using Dictionary Selective Non-negative Matrix Factorization  [in Japanese]

    Ryo Aihara , Tetsuya Takiguchi , Yasuo Ariki

    本研究では,アテトーゼ型脳性麻痒による構音障害者を対象とし,筋肉の不随意運動を原因とする障害者の不安定な発話を聞き取りやすく変換することを目指す.従来の声質変換手法で最も一般的なのは,混合正規分布モデル (GMM) を用いた統計的手法であった.この手法は主に話者変換を目的として研究されてきたため,GMM 声質変換を構音障害者の発話音声に適用し健常者の音声に変換した場合,障害者の話者性は別人のものに …

    IPSJ SIG Notes 113(366), 71-76, 2013-12-19

  • Voice Conversion based on Non-negative Matrix Factorization with Segment Features in Noisy Environments  [in Japanese]

    Takao Fujii , Ryo Aihara , Tetsuya Takiguchi , Yasuo Ariki

    本報告では,雑音環境下に強い NMF による声質変換の手法を提案する.ここでは入力話者と出力話者それぞれの同一発話内容の音声特徴量をサンプルとするパラレル辞書を構築する.更に,入力音声の発話前後の非音声区間から雑音辞書を構築し,入力として与えられる雑音重畳音声を入力音声辞書と雑音辞書の線形結合で表現する.この入力音声と辞書から推定される重み行列のうち,音声辞書に関する重みのみを取り出し,出力話者の …

    IPSJ SIG Notes 2013-SLP-99(13), 1-6, 2013-12-12

  • Classification of Children with Autism Spectrum and Typically Developing Children Using Pitch Features  [in Japanese]

    Yasuhiro Kakihara , Tetsuya Takiguchi , Yasuo Ariki , Yasushi Nakai , Satoshi Takada

    近年,自閉症スペクトラム障害の発生頻度の増加が注目されている.自閉症スペクトラム障害とは,自閉性障害,アスペルガー障害,特定不能の広汎性発達障害の総体である.これらの障害は多様な原因に基づいて発症するため根本的な治療は困難とされているが,この障害に特化した支援による早期療育の効果が報告されている.本研究では,自閉症スペクトラム障害の早期発見を音響的な側面から目指し,ピッチ特徴量を SVM の入力と …

    IPSJ SIG Notes 2013-SLP-99(6), 1-6, 2013-12-12

  • On doubling measures  [in Japanese]

    キルペライネン テロ , コスケラ ペッカ , 正岡 弘照

    d次元ユークリッド空間R^d上の測度の全体Mは加法および正のスカラー倍に関して,閉じていることはよく知られている.M上では結びと交わりが定義でき,それらに関して,Mは閉じている.d次元ユークリッド空間上のdoubling測度の全体M2は,加法,正のスカラー倍および結びに関して,閉じているが,交わりに関して,閉じていない.

    京都産業大学論集. 自然科学系列 (42), 53-61, 2013-03

    IR 

  • On doubling measures  [in Japanese]

    KILPELA¨ INEN Tero , KOSKELA Pekka , MASAOKA Hiroaki

    Acta humanistica et scientifica universitatis Sangio Kyotiensis. Natural science series (42), 53-61, 2013-03

  • RGB-D Based 3D-Object Recognition by LLC Using Depth Spatial Pyramid  [in Japanese]

    HORI Takahiro , TAKIGUCHI Tetsuya , ARIKI Yasuo

    近年、高精度なRGB-Dカメラの登場により、高品質な3次元情報(色、奥行き情報)が容易に測定可能となった、これを用いた従来の物体認識手法は、奥行き情報を局所的特徴の抽出にしか使用していない。つまり、奥行き情報を取得することで物体の全体的な形状を把握することが可能であるにも関わらず、部分的な利用に留まっている。そこで、提案手法では、奥行き情報に基づく距離空間ピラミッドによって、全体的な物体形状を表現 …

    Technical report of IEICE. PRMU 112(441), 43-48, 2013-02-21

  • Two-step Correction of the Speech Recognition Result based on Syntax and Semantics  [in Japanese]

    NAKATANI Ryohei , TAKIGUCHI Tetsuya , ARIKI Yasuo

    本稿では,単語ごとに長距離文脈スコアを付与することで素性とし,Confusion Network上での音声認識自動誤り訂正手法を提案する.従来,単語ごとの長距離文脈情報を素性に音声認識誤り訂正を行う手法は提案されているが,単語ごとにそれを付与する場合,周辺の認識精度に大きく依存してしまうという問題がある.そのため,認識誤りを多く含む認識結果に対して長距離文脈情報を付与するのは,あまり好ましくない. …

    IEICE technical report. Speech 112(369), 149-154, 2012-12-20

  • Sparse Coding-Based Voice Conversion from Lip Information  [in Japanese]

    AIHARA Ryo , TAKASHIMA Ryoichi , TAKIGUCHI Tetsuya , ARIKI Yasuo

    唇の動きから発話内容を読み取る技術はリップリーディング(読唇)と呼ばれ,聴覚・言語障害者のコミュニケーション手段の一つとして用いられている.本研究では,Sparse Coding を用いて,唇動画像から対応する発話音声へテキスト情報なしで変換を行う.事前に音声を含んだ発話映像から唇情報と音声情報を抽出し,それぞれを基底の集合である辞書として学習する.このとき,二つの辞書行列は同一時系列であり,パラ …

    IEICE technical report. Speech 112(369), 119-124, 2012-12-20

  • Interpolation of unlearned position based on local regression for single-channel talk localization using acoustic transfer function  [in Japanese]

    TAKASHIMA Ryoichi , TAKIGUCHI Tetsuya , ARIKI Yasuo

    我々はこれまで,観測音声の音響伝達特性が話者の位置に依存するという点に着目し,音響伝達特性を識別することにより,単一マイクロホンで音源位置推定を行う手法を提案してきた.しかしこの手法は,事前に想定される音源位置毎に音響伝達特性を学習させる必要があり,学習していない位置の推定が困難であった.そこで本稿では,限られた位置の音響伝達特性を用いて,音響伝達特性から位置への回帰モデルを学習し,その回帰モデル …

    IEICE technical report. Speech 112(369), 75-80, 2012-12-20

  • Error Correction Using CRF for Mis-Recognition around OOV Words on Speech Recognition Result  [in Japanese]

    NAKATANI Ryohei , IWAHASHI Naoto , NAKANO Mikio , TAKIGUCHI Tetsuya , ARIKI Yasuo

    本稿では,未知語モデリングを用いた,Confusion Network上での音声認識自動誤り訂正手法を提案する.従来の音声認識には,音声認識器が未知語とその周辺単語を誤認識してしまうという問題がある.そこで,未知語認識を可能にし,同時にその周辺単語の認識誤りを軽減するために,hybrid word/syllable recognitionを行う.そして,音響特徴や言語特徴など,様々な素性を用いて, …

    IEICE technical report. Speech 111(365), 139-144, 2011-12-19

  • Error Correction Using CRF for Mis-Recognition around OOV Words on Speech Recognition Result  [in Japanese]

    NAKATANI Ryohei , IWAHASHI Naoto , NAKANO Mikio , TAKIGUCHI Tetsuya , ARIKI Yasuo

    本稿では,未知語モデリングを用いた,Confusion Network上での音声認識自動誤り訂正手法を提案する.従来の音声認識には,音声認識器が未知語とその周辺単語を誤認識してしまうという問題がある.そこで,未知語認識を可能にし,同時にその周辺単語の認識誤りを軽減するために,hybrid word/syllable recognitionを行う.そして,音響特徴や言語特徴など,様々な素性を用いて, …

    IEICE technical report. Natural language understanding and models of communication 111(364), 139-144, 2011-12-12

    References (15)

  • Error Correction Using CRF for Mis-Recognition around OOV Words on Speech Recognition Result  [in Japanese]

    NAKATANI Ryohei , IWAHASHI Naoto , NAKANO Mikio , TAKIGUCHI Tetsuya , ARIKI Yasuo

    電子情報通信学会技術研究報告. SP, 音声 111(365), 139-144, 2011-12-12

    References (15)

  • Generic Object Recognition by Graph Structural Expression  [in Japanese]

    HORI Takahiro , TAKIGUCHI Tetsuya , ARIKI Yasuo

    コンピュータによる一般物体認識は,近年,ロボットビジョンや画像検索といった分野で,実現が強く求められている.従来研究には,画像から局所的特徴であるSIFT (Scale-Invariant Feature Transform)を抽出し,クラスタリングにより出現頻度ヒストグラム表現に変換するBag of Featuresがあるが,画像全体を対象とするために位置情報や特徴点間の関係性が失われるという問 …

    Technical report of IEICE. PRMU 111(353), 19-24, 2011-12-08

    References (15)

Page Top