Sinsy:「あの人に歌ってほしい」をかなえるHMM歌声合成システム  [in Japanese] Sinsy ― An HMM-based singing voice synthesis system which can realize your wish "I want this person to sing my song"  [in Japanese]

Access this Article

Search this Article

Author(s)

Abstract

近年,コンピュータによる歌声合成が注目を集めている.中でも隠れマルコフモデル(hidden Markov model; HMM)に基づく歌声合成では,歌い手の特徴を歌声データと対応する楽譜から自動的に学習することができる.2009年12月,無料のオンラインサービス「HMM歌声合成システム: Sinsy」を開始した.ユーザーは楽譜をウェブサイトにアップロードすることで,任意の楽譜に対応した歌声を合成することができる.但し,Sinsyの歌声モデルには70曲で学習した特定話者モデルを用いており,新しい歌い手の歌声モデル追加の際の収録コストが高くなる問題があった.本稿ではSinsyのシステム構成について述べるとともに,話者適応手法により少量のデータから所望の歌い手の特徴を再現した歌声を合成することを検討する.A statistical parametric approach to singing voice synthesis based on hidden Markov models (HMMs) has been grown over the last few years. In this approach, spectrum, excitation, and duration of singing voices are simultaneously modeled by context-dependent HMMs, and waveforms are generated from HMMs themselves. Since December 2009, we started a free on-line service named "Sinsy." By uploading musical scores represented by MusicXML to the Sinsy website, users can obtain synthesized singing voices. However, a high recording cost may be required to train new singer's model because a speakerdependent model trained by using 70 songs is used in Sinsy. The present paper describes the recent developments of Sinsy and a speaker adaptation technique to generate waveforms from a small amount of adaptation data.

Journal

  • 研究報告音楽情報科学(MUS)

    研究報告音楽情報科学(MUS) 2010-MUS-86(1), 1-8, 2010-07-21

    情報処理学会

References:  38

Cited by:  3

Codes

  • NII Article ID (NAID)
    110007997414
  • NII NACSIS-CAT ID (NCID)
    AN10438388
  • Text Lang
    JPN
  • Article Type
    Journal Article
  • ISSN
    09196072
  • NDL Article ID
    025075271
  • NDL Call No.
    YH247-911
  • Data Source
    CJP  CJPref  NDL  NII-ELS  IPSJ 
Page Top