Search Results 1-20 of 32

  • 1 / 2
  • Cross-Lingual Voice Conversion With Controllable Speaker Individuality Using Variational Autoencoder and Star Generative Adversarial Network

    Ho Tuan Vu , Akagi Masato

    … To avoid the over-smoothing degradation problem of the conventional VAE, the adversarial training scheme of the StarGAN is adopted to improve the training-objective function of the VAE in a CLVC task. …

    IEEE Access (9), 47503-47515, 2021-03-02

    IR 

  • Joint Adversarial Training of Speech Recognition and Synthesis Models for Many-to-One Voice Conversion Using Phonetic Posteriorgrams

    SAITO Yuki , AKUZAWA Kei , TACHIBANA Kentaro

    … However, 1) the differences among speakers observed in PPGs and 2) an over-smoothing effect of generated acoustic features degrade the converted speech quality. … In addition, it incorporates a generative adversarial network into the training of the synthesis model for alleviating the over-smoothing effect. …

    IEICE Transactions on Information and Systems E103.D(9), 1978-1987, 2020

    J-STAGE 

  • Adaptive Graph-Based Total Variation for Tomographic Reconstructions

    Faisal Mahmood , Nauman Shahid , Ulf Skoglund , Pierre Vandergheynst

    … Local TV methods fail to preserve texture details and often create additional artifacts due to over-smoothing. …

    IEEE Signal Processing Letters 25(5), 700-704, 2018-03-16

    IR 

  • Evaluation of DNN-Based Voice Conversion Deceiving Anti-spoofing Verification  [in Japanese]

    齋藤 佑樹 , 高道 慎之介 , 猿渡 洋

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 116(414), 29-34, 2017-01-21

  • Voice Conversion Using Input-to-Output Highway Networks

    SAITO Yuki , TAKAMICHI Shinnosuke , SARUWATARI Hiroshi

    … The architecture not only alleviates over-smoothing effects that degrade speech quality, but also effectively represents the characteristics of spectral parameters. …

    IEICE Transactions on Information and Systems E100.D(8), 1925-1928, 2017

    J-STAGE 

  • A study on quality improvement of HMM-based synthesized voices using asymmetric bilinear model

    Dinh-Anh Tuan , Morikawa Daisuke , Akagi Masato

    … HMM-based synthesized voices are intelligible but not natural especially in limited data condition because of over smoothing speech spectra in time-frequency domain. … One solution for the problem is using voice conversion techniques to convert over-smoothed spectra to natural spectra. …

    2016 RISP International Workshop on Nonlinear Circuits, Communications and Signal Processing (NCSP'16), 13-16, 2016-03

    IR 

  • Adaptive Gaussian Filtering based on Contrast of Luminance for Perceptual Video Coding

    Wahyu Wiratama , Yong-Jo Ahn , Ismail Marzuki , Donggyu Sim

    IEICE Proceeding Series (61), 183-184, 2016

    DOI 

  • Modulation Spectrum-Constrained Trajectory Training Algorithm for Statistical Parametric Speech Synthesis  [in Japanese]

    TAKAMICHI Shinnosuke , TODA Tomoki , BLACK Alan W. , NAKAMURA Satoshi

    統計的パラメトリック音声合成の合成音声の音質改善に対して,我々は,音声パラメータ生成部における変調スペクトル補償の有効性を示している.しかしながら,生成部における補償処理は,解析解を得るのが困難であるため,短遅延合成処理を必要とするシステムに不向きである.本稿では,変調スペクトルの制約を考慮したトラジェクトリ学習法を提案し,(1)学習部と生成部における最適化尺度の統一化,(2)コンテキストの影響を …

    IEICE technical report. Speech 114(475), 31-36, 2015-03-02

  • Modulation Spectrum-Constrained Trajectory Training Algorithm for Statistical Parametric Speech Synthesis  [in Japanese]

    TAKAMICHI Shinnosuke , TODA Tomoki , BLACK Alan W. , NAKAMURA Satoshi

    統計的パラメトリック音声合成の合成音声の音質改善に対して,我々は,音声パラメータ生成部における変調スペクトル補償の有効性を示している.しかしながら,生成部における補償処理は,解析解を得るのが困難であるため,短遅延合成処理を必要とするシステムに不向きである.本稿では,変調スペクトルの制約を考慮したトラジェクトリ学習法を提案し,(1)学習部と生成部における最適化尺度の統一化,(2)コンテキストの影響を …

    Technical report of IEICE. EA 114(473), 31-36, 2015-03-02

  • Modulation Spectrum-Constrained Trajectory Training Algorithm for Statistical Parametric Speech Synthesis  [in Japanese]

    TAKAMICHI Shinnosuke , TODA Tomoki , BLACK Alan W. , NAKAMURA Satoshi

    統計的パラメトリック音声合成の合成音声の音質改善に対して,我々は,音声パラメータ生成部における変調スペクトル補償の有効性を示している.しかしながら,生成部における補償処理は,解析解を得るのが困難であるため,短遅延合成処理を必要とするシステムに不向きである.本稿では,変調スペクトルの制約を考慮したトラジェクトリ学習法を提案し,(1)学習部と生成部における最適化尺度の統一化,(2)コンテキストの影響を …

    IEICE technical report. Signal processing 114(474), 31-36, 2015-03-02

  • Speech Parameter Generation Algorithm Considering Modulation Spectrum for Statistical Parametric Speech Synthesis  [in Japanese]

    高道 慎之介 , 戸田 智基 , ブラック アラン , 中村 哲

    統計的パラメトリック音声合成において生成パラメータの過剰な平滑化は,合成音声の音質を著しく劣化させる.これに対して,系列内変動を考慮したパラメータ生成法の有効性が知られている.近年,我々は,系列内変動の拡張である変調スペクトルが,過剰な平滑化をより高精度に捉える特徴量であることを明らかにしている.本稿では,過剰な平滑化をより一層緩和する手法として,変調スペクトルを考慮した音声パラメータ生成法を提案 …

    IPSJ SIG Notes 2015-SLP-105(1), 1-6, 2015-02-20

  • A joint restricted Boltzmann machine for dictionary learning in sparse-representation-based voice conversion  [in Japanese]

    NAKASHIKA Toru , TAKIGUCHI Tetsuya , ARIKI Yasuo

    … 近年,声質変換の研究分野において,over-fittingやover-smoothingの生じにくいスパース表現に基づく手法が注目を浴びている.スパース表現に基づく声質変換法では,予め入力話者・出力話者のパラレル辞書を求めておき,スパースな辞書選択重みを用いて適切な辞書を選択することで声質変換を実現する.この手法は主に2つのアプローチに分けることができる.1つ目はパラレル辞書として,学 …

    IEICE technical report. Speech 114(52), 343-348, 2014-05-24

  • Optical Flow Estimation Combining Spatial-Temporal Derivatives Based Nonlinear Filtering

    SHI Kaihong , LU Zongqing , SHE Qingyun , ZHOU Fei , LIAO Qingmin

    … This paper presents a novel filter to keep from over-smoothing the edges and corners and rectify the outliers in the flow field after each incremental computation step, which plays a key role during the process of estimating flow field. …

    IEICE Transactions on Information and Systems E97.D(9), 2559-2562, 2014

    J-STAGE 

  • Postfilter Based on Modulation Spectrum in HMM-Based Speech Synthesis  [in Japanese]

    TAKAMICHI Shinnosuke , TODA Tomoki , NEUBIG Graham , SAKTI Sakriani , NAKAMURA Satoshi

    隠れマルコフモデル(Hidden Markov Model: HMM)に基づく音声合成において,生成される音声パラメータ系列は過剰に平滑化される傾向にあり,合成音声の肉声感は劣化する.系列内変動(Global Variance: GV)は,過剰な平滑化を定量的に表現する特徴量として広く使用されるが,GVを考慮して生成されたパラメータ系列は,未だに平滑化の影響を強く受ける.これに対し本稿では,過剰な …

    IEICE technical report. Speech 113(308), 19-24, 2013-11-21

  • Text-to-speech synthesis based on composite wavelet trajectory model  [in Japanese]

    HOJO Nobukatsu , KAMEOKA Hirokazu , SAGAYAMA Shigeki

    本稿は,高品質なテキスト音声合成を目指し,複合ウェーブレットモデル(composite wavelet model; CMW)と隠れマルコフモデル(hidden Markov model; HMM)の統合モデルに,フォルマント周波数軌跡のモデルを組み込む.ケプストラム特徴量による従来のHMM音声合成方式では,モデル学習時におけるケプストラム特徴量の平均化がスペクトルの周波数方向の平滑化の原因となり …

    IEICE technical report. Speech 113(308), 13-18, 2013-11-21

  • Reconstruction-based super resolution by anisotropic diffusion constraint and total variation regularization  [in Japanese]

    Shibata Takashi , Iketani Akihiko , Senda Shuji

    異方拡散とテクスチャ適応的TVを正則化とした再構成型超解像を提案する提案手法では、エッジの接線方向への高周波成分を制約する異方拡散と、テクスチャ強度に対して適応的に変化するTVを正則化として導入する。異方拡散とテクスチャ適応的TVを併用することで、超解像処理により発生するジャギーを低減し、さらに、平坦領域を平滑化させつつ、テクスチャ領域の低階調化を低減させることができる。画質評価指標による評価実験 …

    Technical report of IEICE. PRMU 112(441), 25-30, 2013-02-21

  • A Line Smoothing Method of Hand-Drawn Strokes Using Adaptive Moving Average for Illustration Tracing Tasks

    KAWASE Hotaka , SHINYA Mikio , SHIRAISHI Michio

    … Although naive applications of moving average filters can smooth input lines, they may cause over-smoothing artifacts in which sharp features are lost by the filtering. … This paper describes an improved line smoothing method using adaptive moving averages, which smoothes input lines while keeping high curvature points. …

    IEICE Transactions on Information and Systems E95.D(11), 2704-2709, 2012

    J-STAGE 

  • Beautification of Hand-drawn Strokes by Adaptive Moving Average for Illustration Tracing Tasks  [in Japanese]

    KAWASE Hotaka , SHINYA Mikio , SHIRAISHI Michio

    デジタルイラストの作成においては,紙に下書きの絵を描き,ペンタブレットを用いてその絵をトレースすることがよく行われる.しかし,トレースする際には手ぶれが発生するので,イラストの質が低下してしまうことがある.手ぶれ補正法としては移動平均法を利用した手法が提案されている.この手法は手書きの線を滑らかにできるが,角などの高曲率部の特徴が保てない.そこで本研究では,移動平均のフィルタサイズを曲率に基づいて …

    ITE Technical Report 36.16(0), 167-170, 2012

    J-STAGE  References (5)

  • Global Variance Modeling on Frequency Domain Delta LSP for HMM-Based Speech Synthesis

    Shifeng Pan , Yoshihiko Nankaku , Keiichi Tokuda , Jianhua Tao

    … The speech parameter generation algorithm considering global variance (GV) for HMM-based speech synthesis proved to be effective against the over-smoothing problem. … By improving the GV likelihood on frequency domain delta LSP, the over-smoothing effect of generated parameter trajectory is better alleviated than conventional one. …

    IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2011., 4716-4719, 2011-05-22

    IR 

  • An Optimization Algorithm of Independent Mean and Variance Parameter Tying Structures for HMM-Based Speech Synthesis

    Shinji Takaki , keiichiro oura , Yoshihiko Nankaku , Keiichi Tokuda

    … The speech parameter generation algorithm considering global variance (GV) for HMM-based speech synthesis proved to be effective against the over-smoothing problem. … By improving the GV likelihood on frequency domain delta LSP, the over-smoothing effect of generated parameter trajectory is better alleviated than conventional one. …

    IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2011., 2011-05-22

    IR 

  • 1 / 2
Page Top