板倉 文忠 Itakura Fumitada

ID:9000004666177

名古屋大学大学院工学研究科電子情報学専攻 Department of Information Electronics, Graduate School of Engineering, Nagoya University (2000年 CiNii収録論文より)

Search authors sharing the same name

Articles:  1-19 of 19

  • Symmetry between Linear Predictive Coding and Composite Sinusoidal Modeling  [in Japanese]

    SAGAYAMA Shigeki , ITAKURA Fumitada

    線形予測符号化(LPC)分析と複合正弦波モデル化(CSM)分析の間にあるエレガントな関係(ここではこれを対称性と呼ぶ)について述べる.目的は, LPC, PARCOR, CSM, 線スペクトル対(LSP)などの音声スペクトルモデル化の理論に統合的な視点を与えることにある.これらの分析法はいずれもモデルの自由度に等しい個数の低次の自己相関関数を与えられたとき, モデルのパラメータを求める問題となって …

    The Transactions of the Institute of Electronics,Information and Communication Engineers. A 00083(00011), 1244-1255, 2000-11-25

    References (26) Cited by (3)

  • Speech Enhancement by Quadrature Comb-filtering  [in Japanese]

    IKEDA Mikio , TAKEDA Kazuya , ITAKURA Fumitada

    本研究では直交フィルタを導入し, 多チャネル化した櫛形フィルタによる雑音抑圧法を提案する. 雑音は直交フィルタのいくつものチャネルにまたがって均等に分布するのに対して, 音声は特定の成分に集中するので, 各チャネルの出力に雑音の振幅の推定値を用いて重みをつけて再構成することによって, 雑音抑圧が可能となる. 本方法は定常白色雑音か加わった音声に対しては信号対雑音比か最大6.5dB改善され, より一 …

    Technical report of IEICE. DSP 96(238), 23-30, 1996-09-12

    References (4) Cited by (3)

  • Theory of Comples Function and z Transform.  [in Japanese]

    ITAKURA Fumitada

    The Journal of the Institute of Electronics,Information and Communication Engineers 00079(00007), 696-699, 1996-07-25

    References (2)

  • Investigation of Hearing Discrimination for Human Voices and Other Sounds  [in Japanese]

    KOBAYASHI Daisuke , ITAKURA Fumitada

    人間の聴覚において音声と他の音とを聞き分けることは難しいことではない。我々はこの点に着目し、聴覚における音声・非音声の弁別について調査している。単語や文章では音声・非音声の判定時に文脈情報による影響が現れる可能性があるため、本報告ではコンテキストによる情報を含まない音素レベルでの音声・非音声の弁別について調べることとし、母音から切り出した音素片、及び楽器音等から切り出した非音声音素片について最小可 …

    Technical report of IEICE. EA 95(70), 15-20, 1995-05-26

    References (8)

  • A Study on the Spectral Characteristics of Lombard Speech  [in Japanese]

    WAKAO Atsushi , ITAKURA Fumitada

    本研究では、雑音環境下での発声変動(Lombard効果)に関し、1)雑音のスペクトルと発声変動との関係2)発声変動を受けた音声の認識に有効な周波数帯域の2点を認識実験の結果から検討する。まず、種々の雑音下で発声された音声の認識実験より雑音の低域成分が発声変形の主な原因であることを示す。次に種々の帯域制限を施した認識実験の結果から、高域のスペクトルが重要となることを示す。

    Technical report of IEICE. EA 95(70), 9-14, 1995-05-26

    References (9)

  • Compression of Speech Spectrum Dimension Using a Wine-Glass-Type Neural Network  [in Japanese]

    ITO Hironori , ITAKURA Fumitada

    砂時計型ニューラルネットを用いた恒等写像学習により、32次元の音声スペクトルを2〜4次元の特徴に圧縮し、復元するニューラルネットを構築した。本研究では、ニューラルネットの構造は3層と5層の2種類を用いたが、入力・出力間のスペクトル歪みを調べたところ5層の方が歪みがかなり小さかった。また、5層のニューラルネットの学習に対しては、あらかじめ圧縮部と復元部を3層のニューラルネットとして学習するという、事 …

    Technical report of IEICE. EA 95(70), 1-8, 1995-05-26

    References (4) Cited by (2)

  • Combining Dynamic and Acoustic Constraints in the Speech Production Inverse Problem

    YEHIA Hani , ITAKURA Fumitada

    本論文では、与えられた音声信号を生成できる様々な声道運動から、人間の生理に合うものを特定する方法について述べる。実際には、本手法では声道断面積軌道コーパスを用いて、約10フレームブロック(約200ms)に対するコンパクトなパラメータ表現を定式化する。この表現は特異値分解に基づいたもので、KL変換と同じ統計的最適化原理を含んでいる。得られたパラメータ化された調音空間を用いてコスト関数を定式化する。そ …

    IEICE technical report. Speech 95(42), 23-30, 1995-05-19

    References (12)

  • Acoustical Measurements of the Vocal-Tract Area Function : System Modelling and Experimental Results

    YEHIA Hani , HONDA Masaaki , ITAKURA Fumitada

    日本音響学会研究発表会講演論文集 1995(1), 305-306, 1995-03-01

    References (5)

  • Investigation of State Reduction on Extraction of Topology from Ergodic HMM  [in Japanese]

    KAWAI C. , ITAKURA F.

    日本音響学会研究発表会講演論文集 1995(1), 131-132, 1995-03-01

    References (4)

  • Investigation of Effective Frequency Band on Speech Recognition-Using Multiple Frequency Band-  [in Japanese]

    MURAKAMI T. , ITAKURA F.

    日本音響学会研究発表会講演論文集 1995(1), 103-104, 1995-03-01

    References (3) Cited by (1)

  • Evaluation of SBCOR Spectrum against Additive Noises  [in Japanese]

    KAJITA S. , ITAKURA F.

    日本音響学会研究発表会講演論文集 1995(1), 7-8, 1995-03-01

    References (5)

  • Speaker recognition using speaker individual information in the higher frequency band  [in Japanese]

    Hayakawa Shoji , Itakura Fumitada

    話者認識の分野において、音声の高域の周波数領域に含まれる話者の個人性情報については、従来ほとんど軽視されてきた。本論文では、音声の高域に含まれる話者情報について調査し、話者認識における高域の貢献度について調べる。また、幾つかの環境雑音が音声の高域に与える影響についても検討する。実験の結果、音声の高域には話者の個人性情報が確かに存在すると共に、その情報を用いることにより、話者認識性能を効果的に改善で …

    THE JOURNAL OF THE ACOUSTICAL SOCIETY OF JAPAN 51(11), 861-868, 1995

    J-STAGE  References (14) Cited by (17)

  • A study of the quantization of the line spectrum parameters  [in Japanese]

    Hotani Sanae , Itakura Fumitada

    低ビットレート音声符号化において、スペクトル包絡成分の量子化は重要な研究課題の一つである。このスペクトル包絡を表すパラメータに線スペクトルパラメータ(CSMパラメータ:Composite Sinusoidal Model parameters)がある。本研究では、線スペクトルパラメータの量子化方法としてDCTを用いたVQを提案する。これは、パラメータの時間方向の冗長性を利用することで、量子化性能を …

    IEICE technical report. Speech 94(215), 23-30, 1994-09-06

  • Investigation of Extraction of HMM Topology from Ergodic HMM  [in Japanese]

    Kawai Chiharu , Itakura Fumitada

    十分に学習されたergodic HMMでは、その構造(Markov Chainもしくは遷移確率)は、学習データ内に内在される特徴量の変化を効率的に表現するように学習される。つまり、学習データとして認識対象を含むようなデータを与えれば、その構造中に認識対象データの持つ変化を適切に表現する部分が形成されることになる。本研究では、このような、ergodic HMMの構造から認識対象データを表現する部分を …

    IEICE technical report. Speech 94(215), 9-14, 1994-09-06

  • Research of Effective Frequency Band on Speech Recognition  [in Japanese]

    Murakami Takuya , Itakura Fumitada

    音声認識に用いるパラメータとして、メル、バークなとの聴覚心理尺度に周波数変換したパラメータが用いられることがある。しかし、聴覚特性に基づいていても、それが音声認識に対してかならずしも最適であるとはいえない。そこで、本研究では線形選択予測の手法を用い、音声認識に対して有効な周波数帯域の調査を行なうことを目的とする。まず、選択線形予測の計算において自己相関係数を直接変換するという手法を提案した。そして …

    IEICE technical report. Speech 94(215), 1-8, 1994

    Cited by (2)

  • Vector quantization of transform coefficients with multi-codebook in audio transform coding  [in Japanese]

    Kumada Satoshi , Itakura Fumitada

    現在のオーディオ符号化の技術では、聴覚のマスキング効果を利用した情報圧縮が行われているが、異なるアプローチとしてChanらによるVQを用いて音源の特徴を捉える方法がある。しかしこの方法では、VQで用いるコードブックのサイズにより変換係数の量子化の精度に限界が生じてしまう。本報告では、VQによる誤差をさらにスカラー量子化する方法を提案し、実際に様々な音源データについて行った符号化実験の結果について考 …

    IEICE technical report. Speech 93(266), 31-38, 1993-10-14

  • Speaker recognition using information in the higher frequency band. : Analysis by Selective Linear Prediction  [in Japanese]

    Hayakawa Shoji , Itakura Fumitada

    音声の高域に含まれる個人性情報を注目し、この情報の話者認識に対する有効性を示してきた。本報告ではSelective LPを用いて、話者認識に使用する帯域と認識率についての詳細な検討を行った。まず、話者認識に用いる音声の0Hzからの帯域を高域に広げた場合と、10kHzからの帯域を低域に広げた場合の認識率の傾向について調べた。また、時間平均スペクトル成分を除去し求めた低域の累積距離に、高域の累積距離を …

    IEICE technical report. Speech 93(266), 55-61, 1993

    Cited by (1)

  • Tree searched multi-stage vector quantization of LSP parameters  [in Japanese]

    Hotani Sanae , Itakura Fumitada

    低ビットレート音声符号化において、音声のスペクトル包絡を表すLSPパラメータの量子化は、重要な研究課題の一つである。本研究では、2.4Kb, sCELP音声符号化方式のLSPパラメータの量子化方法として木探索多段ベクトル量子化を提案する。これは、多段ベクトル量子化に木探索を取り入れることにより、演算量を削減することが目的である。始めに、コードブック作成および探索の際に用いるLSP距離尺度の重み係数 …

    IEICE technical report. Speech, 39-46, 1993

    Cited by (6)

  • SBCOR Spectrum Taking Autocorrelation Coefficients at Integer Multiples of CF^-1> into Account  [in Japanese]

    Kajita Shoji , Itakura Fumitada

    音声の特徴抽出の目標は、音声波から音韻情報の損失ができるだけ少ないようにその特徴を抽出することである。その1つのアプローチとして、音声の特徴抽出システムとしてすでに存在する実際の聴覚系に学び、そこで行なわれている処理を聴覚生理・聴覚心理の観点から模擬することによって有効な特徴抽出を行なう方法が考えられる。これがいわゆる聴覚モデルである。その1つとして提案されたSeneffのモデルについて、「帯域を …

    IEICE technical report. Speech SP93-64, 1-8, 1993

    Cited by (1)

Page Top