声質と歌唱スタイルを自動学習可能な歌声合成システム(スペシャルセッション・歌情報処理2)  [in Japanese] A trainable singing voice synthesis system capable of representing personal characteristics and singing styles  [in Japanese]

    • 酒向 慎司 SAKO SHINJI
    • 名古屋工業大学大学院工学研究科 Department of Computer Science and Engineering, Nagoya Institute of Technology
    • 徳田 恵一 TOKUDA KEIICHI
    • 名古屋工業大学大学院工学研究科 Department of Computer Science and Engineering, Nagoya Institute of Technology

    • 北村 正 KITAMURA TADASHI
    • 名古屋工業大学大学院工学研究科 Department of Computer Science and Engineering, Nagoya Institute of Technology

Abstract

声質や歌唱法など歌い手の特徴を歌声データと楽譜から自動学習し,それらを再現するような歌声合成システムについて述べる.本システムでは,歌い手の声質とピッチに関する特徴を確率モデルによる統一的な枠組みでモデル化している.特に,リズムやメロディといった音楽特有の表現要素が,音声信号のスペクトルや基本周波数パターンの変動に大きく関係していることから,楽譜から得られる音階や音長などを考慮したモデル化を行い,楽譜と歌詞を入力として,個人性を備えた歌声を合成するシステムを構築してきた.本手法の特徴は,このような歌声合成モデルを楽譜と歌声データから自動学習できることにある.本報告では,音楽固有のコンテキストの導入,実際の歌声データと楽譜の音符列の間のずれに着目した時間構造モデルについて検討する.実験では,童謡60曲の男性1名の歌声データを用いた歌声合成システムを構成し,ずれモデルの導入による自然性の向上が確認できた.

We describe a trainable singing voice synthesis system, that can automatically learns the model parameters from singing voice waveform and musical scores by applying HMM-based speech synthesis technique. In this system, a sequence of spectrum and fundamental freqency (FO) are modeled simultaneously in a unified framework of HMM, and context dependent HMMs are constructed by taking account of contextual factors that affects singing voice. In addition, the distributions for spectral and FO parameter are clustered independently by using a decision-tree based context clustering technique. Synthetic singing voice is generated from HMMs themselves by using parameter generation algorithm. We introduced an additional "time-lag" model to control start timing of each musical note. In the experiments, we confirmed that smooth and natural-sounding singing voice is synthesized. It is also maintains the characteristics and personality of the donor of the singing voice data for HMM training.

Journal

IPSJ SIG Notes   [List of Volumes]

IPSJ SIG Notes 2008(12), 39-44, 2008-02-08  [Table of Contents]

Information Processing Society of Japan (IPSJ)

References:  17

You must have a user ID to see the references.If you already have a user ID, please click "Login" to access the info.New users can click "Sign Up" to register for an user ID.

Cited by:  2

You must have a user ID to see the cited references.If you already have a user ID, please click "Login" to access the info.New users can click "Sign Up" to register for an user ID.

Preview

Preview

Codes

  • NII Article ID (NAID) :
    110006664847
  • NII NACSIS-CAT ID (NCID) :
    AN10438388
  • Text Lang :
    JPN
  • Article Type :
    Journal Article
  • ISSN :
    09196072
  • Databases :
    CJP  CJPref  NII-ELS 

Export