板倉 文忠 ITAKURA Fumitada

ID:1000030168299

名城大学理工学研究科 Graduate School of Meijo University (2013年 CiNii収録論文より)

Search authors sharing the same name

Articles:  1-20 of 281

  • Proposals of a vibrato feature reflecting magnitude of fluctuations of fundamental frequency and power in singing voice and evaluation method of the feature  [in Japanese]

    SUZUKI Chifumi , BANNO Hideki , ASAHI Kensaku , ITAKURA Fumitada , MORISE Masanori

    本報告では、歌唱音声におけるビブラート部分の時間変動における類似度を測るためのビブラート特徴量を提案する。比較に用いる歌声データは、歌い方や声質が特徴的だと思われる目標の歌手を物真似した歌声と物真似していない歌声である。そして、CD音源から目標の歌手の歌声のみを抽出した歌声を用いて比較を行った。今回提案したビブラート特徴量は、基本周波数とパワーの変動量を反映した特徴量となっている。このビブラート特 …

    IEICE technical report. Speech 112(422), 61-66, 2013-01-30

  • A proposal of acoustic feature related to voice quality for estimation of similarity in singing voice  [in Japanese]

    Suzuki Chifumi , Bannno Hideki , Itakura Fumitada , MORISE Masanori

    本報告では,歌唱音声における類似度を測る音声特徴量の検討を行なう.今回は,歌唱者の声質とビブラート部分のスペクトル変動に着目し,それぞれに関する音声特徴量を用いて類似度の評価を行なう.比較に用いた歌声データは,歌い方や声質が特徴的だと思われる目標の歌手を物真似した歌声と,物真似していない歌声である.そして,CD音源から目標の歌手の歌声のみを抽出した歌声を用いて比較を行なった.比較に用いた音声特徴量 …

    IEICE technical report. Speech 111(365), 79-84, 2011-12-19

  • Study on extraction of vocal part in music signal by using non-negative matrix factorization  [in Japanese]

    YASUI Yuta , BANNO Hideki , ITAKURA Fumitada

    本研究では,歌声信号と伴奏信号を重ね合わせた楽曲信号から非負値行列分解を用いて歌声信号を抽出する方法について検討する.非負値行列分解は,入力スペクトログラムに対し,スペクトログラム上に現れる類似したスペクトルパターンを一つの基底ベクトルとして表現することで,複数の基底ベクトルと,それぞれの時間変化情報に分離することができる.しかし,歌声に現れるビブラートなどスペクトルが時間的に変動する信号に対して …

    IEICE technical report. Speech 111(365), 73-78, 2011-12-19

  • A proposal of acoustic feature related to voice quality for estimation of similarity in singing voice  [in Japanese]

    SUZUKI Chifumi , BANNNO Hideki , ITAKURA Fumitada , MORISE Masanori

    本報告では,歌唱音声における類似度を測る音声特徴量の検討を行なう.今回は,歌唱者の声質とビブラート部分のスペクトル変動に着目し,それぞれに関する音声特徴量を用いて類似度の評価を行なう.比較に用いた歌声データは,歌い方や声質が特徴的だと思われる目標の歌手を物真似した歌声と,物真似していない歌声である.そして,CD音源から目標の歌手の歌声のみを抽出した歌声を用いて比較を行なった.比較に用いた音声特徴量 …

    IEICE technical report. Natural language understanding and models of communication 111(364), 79-84, 2011-12-12

    References (9)

  • Study on extraction of vocal part in music signal by using non-negative matrix factorization  [in Japanese]

    YASUI Yuta , BANNO Hideki , ITAKURA Fumitada

    本研究では,歌声信号と伴奏信号を重ね合わせた楽曲信号から非負値行列分解を用いて歌声信号を抽出する方法について検討する.非負値行列分解は,入力スペクトログラムに対し,スペクトログラム上に現れる類似したスペクトルパターンを一つの基底ベクトルとして表現することで,複数の基底ベクトルと,それぞれの時間変化情報に分離することができる.しかし,歌声に現れるビブラートなどスペクトルが時間的に変動する信号に対して …

    IEICE technical report. Natural language understanding and models of communication 111(364), 73-78, 2011-12-12

    References (6)

  • A proposal of acoustic feature related to voice quality for estimation of similarity in singing voice  [in Japanese]

    SUZUKI Chifumi , BANNNO Hideki , ITAKURA Fumitada , MORISE Masanori

    電子情報通信学会技術研究報告. SP, 音声 111(365), 79-84, 2011-12-12

    References (9)

  • Evaluation of the acoustic feature representing loud-ness of music signal for music classification  [in Japanese]

    SATO Tsutomu , BANNO Hideki , ITAKURA Fumitada

    本研究は,楽曲推薦の特徴量に利用出来るような音響特徴量,特にラウドロック系の楽曲を特徴付ける音響特徴量の提案をする.ラウドロック系の楽曲は,歪んだ音を出すエレキギター及びベース,激しく叩くドラムの音が特徴的であり,上記の楽曲と,それ以外の楽曲とを混在させた曲順で聴くことはほとんどない.よって,両者を分類できる特徴量は,有用な特徴量となることが期待できる.本稿では,提案した音響特徴量を用いて,ラウド …

    IEICE technical report 111(97), 41-46, 2011-06-16

    References (9)

  • Improvement method of intelligibility of speech analysis and synthesis method focusing on the dynamic feature Guide to the Technical Report and Template  [in Japanese]

    SHIBATA Yoshiki , BANNO Hideki , ITAKURA Fumitada

    本研究では,音声分析合成音の明瞭性向上手法を提案する.明瞭音声と通常音声の違いに着目し,Δケプストラムによる動的特徴の違いを分析した.分析の結果,明瞭発声における音素変化部のΔケプストラムの値が上昇し,スペクトル変動量が増加することが分かった.この観測結果に基づき,スペクトルの変動量を表す変調スペクトルの特定の変調周波数を強調するフィルタを設計し,強調音声の動的特徴量が増加することを確認した.単語 …

    IEICE technical report 110(297), 101-106, 2010-11-11

    References (10)

  • Analysis of difference of vibrato features by singers  [in Japanese]

    SUZUKI Chifumi , BANNO Hideki , ITAKURA Fumitada , MORISE Masanori

    本報告では,ユーザの目的とする歌手とその歌手に似せて歌ったときのビブラート部分の類似度の評価を行う方法について検討する.類似度を比較する際の尺度としては,基本周波数におけるビブラートらしさと,パワーにおけるビブラートらしさの両方を用いた.その結果,基本周波数の変動に合わせてパワー信号の変動が大きくなる歌い方をする歌手と,基本周波数の変動が大きくなってもパワー信号の変動は大きくならない歌い方をする歌 …

    IEICE technical report 110(297), 89-94, 2010-11-11

    References (6)

  • GMM voice conversion of singing voice using vocal tract area function  [in Japanese]

    KAWAKAMI Yuuji , BANNO Hideki , ITAKURA Fumitada

    本稿では声道断面積関数を用いたGMMに基づく歌唱音声の声質変換について報告する.従来法では学習と変換に用いる特徴量はメルケプストラムが主流である.しかしこの場合,変換後のスペクトル包絡が不自然になり,合成音声の品質が劣化することがある.この問題を解決するため,LPC分析に基づく声道断面積比と高域強調特性を特徴量として用いる手法を提案した.提案法により,従来法で見られた変換音声と目標音声のスペクトル …

    IEICE technical report 110(297), 71-76, 2010-11-11

    References (6)

  • Analysis of the vocal tract area function aimed at manipulation of voice quality  [in Japanese]

    UCHIMURA Yoshinori , BANNO Hideki , ITAKURA Fumitada

    声質制御の新たな手法として声道断面積関数による声質制御方式を提案する.この方法は,声道の形状を表すパラメタとして知られるKellyの音声生成モデルに基づく声道断面積関数を変化させることにより声質を制御する.本稿では,まず,この声道断面積関数を求める際に行う音源と放射の特性の除去方法に関して検討を行った.その結果,中島らによって提案された適応逆フィルタを用いる方法が適していることが分かった.また,声 …

    IPSJ SIG Notes 2008(12), 127-132, 2008-02-08

  • Singing Voice Synthesis Taking Account of Tempo Effect  [in Japanese]

    KAWAZOE Masato , BANNO Hideki , ITAKURA Fumitada

    子音を含む歌唱音声合成の品質を向上させる方法について検討している.実際の歌唱音声を収録して観察した結果,楽曲のテンポが速くなるにつれ,スペクトルの変動が小さくなる現象があることが明らかとなった.これは,声道の形状が急に変化できないことに起因すると考えられる.既存の歌唱音声合成手法では,このことがあまり考慮されておらず,これが合成音が不自然となる原因の1つとなっている.そこで,本稿では,発声タイミン …

    IPSJ SIG Notes 2008(12), 45-50, 2008-02-08

  • Analysis of the vocal tract area function aimed at manipulation of voice quality  [in Japanese]

    UCHIMURA Yoshinori , BANNO Hideki , ITAKURA Fumitada

    声質制御の新たな手法として声道断面積関数による声質制御方式を提案する.この方法は,声道の形状を表すパラメタとして知られるKellyの音声生成モデルに基づく声道断面積関数を変化させることにより声質を制御する.本稿では,まず,この声道断面積関数を求める際に行う音源と放射の特性の除去方法に関して検討を行った.その結果,中島らによって提案された適応逆フィルタを用いる方法が適していることが分かった.また,声 …

    IPSJ SIG Notes 74, 127-132, 2008-02-08

    References (6)

  • Singing Voice Synthesis Taking Account of Tempo Effect  [in Japanese]

    KAWAZOE Masato , BANNO Hideki , ITAKURA Fumitada

    子音を含む歌唱音声合成の品質を向上させる方法について検討している.実際の歌唱音声を収録して観察した結果,楽曲のテンポが速くなるにつれ,スペクトルの変動が小さくなる現象があることが明らかとなった.これは,声道の形状が急に変化できないことに起因すると考えられる.既存の歌唱音声合成手法では,このことがあまり考慮されておらず,これが合成音が不自然となる原因の1つとなっている.そこで,本稿では,発声タイミン …

    IPSJ SIG Notes 74, 45-50, 2008-02-08

    References (4)

  • Accuracy of the Synthesis of Wave Fronts in Wave Field Synthesis Using Directional Microphones  [in Japanese]

    KIMURA Toshiyuki , KAKEHI Kazuhiko , TAKEDA Kazuya , ITAKURA Fumitada

    指向性マイクロホンを用いた波面合成法は制御領域の境界上に配置した指向性マイクロホンで収録したチャネル信号を再生することによって聴取領域内に波面を合成する立体音場再生技術である.しかしながら, この技術に基づいたシステムにおいて波面が忠実に合成される条件は十分に検討されていない.本報告では波面が忠実に合成される条件を検討するために計算機シミュレーションを行い, 波面が忠実に合成されるためにはマイクロ …

    Technical report of IEICE. EA 105(289), 13-18, 2005-09-16

  • Construction of Bimodal Database for Evaluating In-Car Speech Recognition  [in Japanese]

    NEGI Daisuke , MAENO Toshiki , KITASAKA Takayuki , MORI Kensaku , SUENAGA Yasuhito , MIYAJIMA Chiyomi , ITOU Katsunobu , TAKEDA Kazuya , ITAKURA Fumitada , SANO Masami , NINOMIYA Yoshiki

    近年, 現実の雑音環境下の様々なシーンにおいて音声認識率を向上させるために, 音声情報と映像情報を統合したバイモーダル音声認識への関心が高まっている.映像情報は音響雑音の影響を受けない情報源として, 音声認識において重要な役割を果たすものと考えられる.しかし, 大規模バイモーダルデータベースが少ないことなどから, 映像情報は実際の音声認識システムにおいて十分に利用されるには至っていない.そこで我々 …

    IPSJ SIG Notes 55, 35-40, 2005-02-04

    References (11) Cited by (3)

  • Subjective Effect of the Number of Channel Signals in Wave Field Synthesis : in the Case of Sound Sources of Frontal Direction  [in Japanese]

    Kimura Toshiyuki , Kakehi Kazuhiko , Takeda Kazuya , Itakura Fumitada

    It is important to evaluate the effect of the number of channel signals in the sound field auralization system based on wave field synthesis. Although the effect of the number of channel signals on th …

    Transactions of the Virtual Reality Society of Japan 10(2), 257-266, 2005

    J-STAGE  References (22) Cited by (4)

  • Spatial Coding of the Sound Field by Moving Sound Sources : Bit Reduction Based on the Extraction of Sound Sources  [in Japanese]

    Kimura Toshiyuki , Kakehi Kazuhiko , Takeda Kazuya , Itakura Fumitada

    The sound field reproduction technique is important to realize the more realistic communication system. However, a transmission data should be reduced for the remote system based on wave field synthes …

    Transactions of the Virtual Reality Society of Japan 10(1), 101-109, 2005

    J-STAGE  References (20)

  • Two-stage Noise Spectra Estimation and Regression based In-car Speech Recognition using Single Distant Microphone

    LI Weifeng , ITOU Katunobu , TAKEDA Kazuya , ITAKURA Fumitada

    走行中の車内のような騒々しい環境においても,精度の高い音声認識技術が望まれている.本稿では,二段雑音スペクトルの推定という手法を提案され,-つの遠隔マイクロホンで収録した音声データを基に,非線形回帰を行うことで,車内での音声認識精度の向上を目指した.12車内走行条件の音声認識実験によって,もとの遠隔マイクロホンに比べて相対ワード認識誤りを65%の程度で減少できる結果が得られた.

    IPSJ SIG Notes 54, 217-222, 2004-12-22

    References (20)

  • Two-stage Noise Spectra Estimation and Regression based In-car Speech Recognition using Single Distant Microphone

    LI Weifeng , ITOU Katunobu , TAKEDA Kazuya , ITAKURA Fumitada

    走行中の車内のような騒々しい環境においても,精度の高い音声認識技術が望まれている.本稿では,二段雑音スペクトルの推定という手法を提案され,一つの遠隔マイクロホンで収録した音声データを基に,非線形回帰を行うことで,車内での音声認識精度の向上を目指した.12車内走行条件の音声認識実験によっで,もとの遠隔マイクロホンに比べて相対ワード認識誤りを65%の程度で減少できる結果が得られた.

    IEICE technical report. Speech 104(542), 127-132, 2004-12-21

Page Top