検索結果を絞り込む

本文・本体へのリンク

検索結果 89 件

  • 1 / 1

  • 信号周期整数倍長窓Kalliopeの理論的性質

    嵯峨山 茂樹 電子情報通信学会論文誌D 情報・システム J107-D (2), 82-86, 2024-02-01

    周期信号のパワーと調波パワーの推定(すなわちスペクトル推定)において,周期の整数倍の長さの時間窓を用いると推定精度の向上が期待できることを理論的に示す.音声処理においては短時間フレームごとに短時間スペクトル推定することが多く行われるが,有声音の場合,パワー,スペクトル形状,窓長,フレーム周期など全てを,周期波形と時間窓の相対位置関係に対して不変にすることは課題であった.この報告では,周期が既知の…

    DOI

  • Kalliope: 周期信号の短時間解析窓位置に不変な パワーとスペクトルの推定

    嵯峨山 茂樹 音声コミュニケーション研究会資料 3 (4), n/a-, 2023-09-14

    <p><tt>音声分析における基本的な問題を再考し、有声音のスペクトル包絡推定が内包する根源的問題を議論し、音声分 析が満たすべき要求条件を確認したのち、周期信号の周期の</tt>3 <tt>倍以上の整数倍長の時間窓として</tt>von Hann <tt>窓や</tt>Hamming <tt>窓などを用いると、パワーと調波パワー値(すなわちスペクトル微細構造の山の値)が音声波形と窓との相対位置…

    DOI

  • 楽譜情報を用いた高時間分解能Audio-to-MIDI変換

    保利, 武志, 中村, 和幸, 嵯峨山, 茂樹 情報処理学会論文誌 60 (11), 2034-2047, 2019-11-15

    本稿は,音楽音響信号に対し,高時間分解能で音楽特徴量(オンセット時刻,音長)を詳細に推定し,MIDI信号へと変換する手法について述べる.多重音からなる音楽音響信号に対する音楽特徴量の抽出は音楽情報科学分野においてきわめて重要な要素技術であり,演奏解析だけでなく自動演奏や作曲など幅広い音楽活動に寄与できる.特に演奏者の個性(演奏モデル)を獲得するためには,微細な演奏変化をとらえうる高時間分解能な解…

    情報処理学会

  • 模倣を考慮した和声的対位法の自動作曲の検討

    大森, 陽, Christoph, M. Wilk, 保利, 武志, 嵯峨山, 茂樹 第81回全国大会講演論文集 2019 (1), 433-434, 2019-02-28

    我々は、対位法的な自動作曲において、和声構造を先に与え、その中で対位法的な複旋律を生成する研究を行ってきた。本研究では、与えられた主題旋律から楽曲中の任意の場所・和声構造に合わせた模倣旋律を生成することを目指している。主題旋律の変形の確率モデルに基づいてその旋律が主題の模倣と認識される尤度と、音楽理論的制約とを合わせて最適な模倣を行う。さらにその模倣旋律に合致するような対旋律の生成について、他声…

    情報処理学会

  • 弾き直しに対応したピアノ練習支援のための模範演奏との比較可視化

    堀, 松仁, Christoph, M. Wilk, 嵯峨山, 茂樹 第81回全国大会講演論文集 2019 (1), 337-338, 2019-02-28

    本稿では、ピアノ練習時に演奏情報と教師演奏との比較を可視化して提示する練習支援システムについて報告する。ピアノ練習では、練習者が間違えた個所を何度も弾き直すことが想定される。従来の練習支援システムでは弾き直しはミス入力と判定されていたのに対し、我々が開発した自動伴奏システムEurydiceの楽譜追跡アルゴリズムにより弾き直しに対応した練習支援を可能にした。また、支援に必要な情報は練習段階によって…

    情報処理学会

  • 周波数基底チューニングに基づく演奏詳細解析に向けたスコアフォローイング

    保利, 武志, 中村, 和幸, 嵯峨山, 茂樹 第81回全国大会講演論文集 2019 (1), 69-70, 2019-02-28

    本研究では、楽譜情報に基づきモノラル音楽音響信号から音楽特徴量(音高、詳細オンセット時刻、音量、音長)を詳細に推定するための手法について述べる。音楽音響信号からの多重音分離は、演奏解析としてだけではなく自動演奏や音楽情報探索などにおいても極めて重要な要素技術であり、従来音楽スペクトログラムの生成モデルに基づく逆問題として定式化されることが多かったが、本研究では楽譜を既知とすることで、楽譜情報を事…

    情報処理学会

  • HMMを用いた最尤ドラム編曲

    宮坂, 和樹, 嵯峨山, 茂樹, 保利, 武志, 堀, 松仁 第81回全国大会講演論文集 2019 (1), 421-422, 2019-02-28

    本稿では伴奏のリズムに基づいたドラムパタンの自動編曲手法を提案する.ドラムトラックのない伴奏にドラムを付与するとき,様々な曲調の変化に対してドラムパタンも変化すべきである.しかし,時系列的な変化を考慮したドラムパタンを付与する問題は単純ではない.そこで,ロック・ポップスにおけるドラムと伴奏リズムの関係に注目し,ドラムパタンの変化を経路と捉え,編曲を経路探索問題として定式化することでドラムパタンの…

    情報処理学会

  • 非和声音を考慮した楽譜データ和声解析

    井村, 海斗, Christoph, M. Wilk, 嵯峨山, 茂樹, 中村, 和幸 第81回全国大会講演論文集 2019 (1), 373-374, 2019-02-28

    和声は西洋音楽における重要な要素であり、和声解析の達成は自動採譜、自動作曲において重要な役割を担っている。しかし、隠れマルコフモデルなどを用いた現状の和声解析システムは考慮できることが多くなく、精度の限界を迎えている。そこで、本研究では和声解析において理解が困難だった非和声音に着目し、その確率モデル化を考えた。そして、導き出した確率モデルを用いて、和声解析を行なった。解析には、ダイナミックプログ…

    情報処理学会

  • 確率文脈自由文法を用いたコード進行からの調推定

    松村, 幸輝, Christoph, M. Wilk, 嵯峨山, 茂樹 第81回全国大会講演論文集 2019 (1), 377-378, 2019-02-28

    本稿ではコード進行からその曲の調を推定する手法として、確率文脈自由文法を用いて生成モデルを作成し、その逆問題を解く手法を提案する。音楽の調は、旋律を生成する上で重要なことの一つであり、調推定に関する研究は多くある。調推定の手法としては、現在では音響信号から音高のヒストグラムを生成し、それに基づく手法が主流である。それに対して、音楽のコード進行には階層構造があり、確率文脈自由文法を用いて解析するこ…

    情報処理学会

  • word2vecを用いて歌詞と写真を対応付けたスライドショー生成システム

    梅村, 允康, 保利, 武志, 嵯峨山, 茂樹 第81回全国大会講演論文集 2019 (1), 403-404, 2019-02-28

    本稿では、ユーザが指定した楽曲と画像から歌詞に合った画像を選定するスライドショー生成システムを提案する。画像に付与した語ラベルと楽曲の歌詞との共起性をword2vecを用いて得られた単語ベクトルとの距離に基づき計算し、さらに画像間の類似性を遷移確率として適用した遺伝的アルゴリズムにより、画像印象の滑らかな遷移と歌詞印象を同時に考慮したスライドショーを生成する。また、本手法による歌詞と画像の対応付…

    情報処理学会

  • 音型のエントロピーに基づく合奏曲のピアノへの自動編曲

    李, 由, 保利, 武志, Christoph, M. Wilk, 嵯峨山, 茂樹 第81回全国大会講演論文集 2019 (1), 427-428, 2019-02-28

    本稿では、情報理論に基づきオーケストラ譜の各音符イベントに対する情報量を計算する方法と、それを用いた合奏曲のピアノ譜への自動編曲手法を検討する。従来の自動編曲システムでは、ルールベースが主要な方法であったが、それに対し本研究では情報理論に基づき得られた情報量を基準として、原曲の中で目立つ(より多くの情報を持つ)部分と和音部分を抽出する。さらにピアノ演奏可能とするための音符数等に対する制約を付加す…

    情報処理学会

  • 歌詞の意味重み付けHMMによる旋律への和声付け

    高橋, 拓椰, クリストフ, ウィルク, 保利, 武志, 嵯峨山, 茂樹 第81回全国大会講演論文集 2019 (1), 423-424, 2019-02-28

    本稿では、歌詞に対してword2vecを適用し得られた歌詞意味ベクトルを用いた旋律に対する和声付けの手法を提案する。従来の旋律に対する和声付けはHMMや、近年ではDNNが主流であるが、本研究ではHMMによる手法をベースとし、実際の日本語の楽曲から統計的に得られる和声進行に対する歌詞意味ベクトルを用いて、ある和声進行から入力された歌詞が出力される確率をVon …

    情報処理学会

  • マウス操作を模擬した音声カーソル制御

    田上, 集, 光本, 大記, 嵯峨山, 茂樹 第80回全国大会講演論文集 2018 (1), 363-364, 2018-03-13

    多くのGUIにおいて手によるポインティング操作が行われている。しかし、腕が自由に使えない状況、例えば運転中にカーナビを扱うためには手以外の操作手段が必要となる。手に代わる直感的に扱いやすい身体機能として声が考えられ、実際、音声認識によるコンピュータ操作が実用化されている。しかし、ポインティング操作に要求される即時性や自由度が、音声認識では不足すると考えられる。そこで我々はこれまで声の持つ様々な特…

    情報処理学会

  • 不完全な四声体を補完するためのHMMによる自動ヴォイシングアルゴリズム

    伊藤, 綜耶, 嵯峨山, 茂樹, Christoph, Matthias Wilk 第80回全国大会講演論文集 2018 (1), 47-48, 2018-03-13

    本研究では、不完全な四声体を補完するためのHMMによる自動ヴォイシングアルゴリズムを扱う。近年、作曲を志す人が増えているが、どうしても禁則を犯してしまう、綺麗な和声にならないなど、作曲者の思い通りの四声体が作れない場合が起こりえる。そこで、基本的な作曲技術を持たないユーザによる断片的な旋律と和声進行に対して自動ヴォイシング推定を行うために、声部連結の独立性を遷移確率、ヴォイシングの調和性を出力確…

    情報処理学会

  • ポジション移動に着目した隠れマルコフモデルによる単旋律マンドリンの自動運指決定

    川島, 佑希奈, 堀, 玄, 嵯峨山, 茂樹 第80回全国大会講演論文集 2018 (1), 51-52, 2018-03-13

    左手の押弦を隠れ状態とし演奏する音符を出力記号とする隠れマルコフモデルの復号問題として、マンドリンの運指決定を自動的に行う方法を提案する。ポジション移動をともなう遷移に大きなペナルティを課すことによりポジション移動回数を最小化し、復号問題の目的関数として対数遷移確率のp乗ノルムを用いることにより運指の中で最も難しい部分ができるだけ簡単になるような自動運指決定を行う。提案手法により得られたマンドリ…

    情報処理学会

  • 時間周波数分解能の異なる2つのスペクトログラムに対する並列NMFを用いた演奏詳細解析

    保利, 武志, 中村, 和幸, 嵯峨山, 茂樹 第80回全国大会講演論文集 2018 (1), 43-44, 2018-03-13

    音楽演奏における演奏者の個性は、演奏の緩急や強弱、アーティキュレーション等として反映されるが、これらを詳細に抽出するためには高精度な時間・周波数分解能による解析が必要となる。本研究では、高時間分解能なスペクトログラムと高周波数分解能なスペクトログラムの2つを用いて、互いの基底情報とアクティベーションを参照し合う並列NMFを適用することで、従来時間分解能と周波数分解能においてトレードオフであった音…

    情報処理学会

  • CSM周波数と基本周波数を用いた音声によるマウスカーソル操作

    田上, 集, 小口, 純矢, 光本, 大記, 松原, 聖人, 嵯峨山, 茂樹 第79回全国大会講演論文集 2017 (1), 323-324, 2017-03-16

    本研究は、手が使えないあらゆる環境においてもマウスカーソル操作を行うため、音声によるマウスカーソル操作の実現を目標とする。音声が持つ性質を利用し、CSM周波数と基本周波数によるマウスカーソル操作を検討した。さらに、音声認識を用いる従来の方法とは異なり、二次元平面上で画面の目標座標に直に移動する方式とカーソル移動を速度ベクトルとみなす方式をそれぞれ検討し比較することでより良い操作性を追求した。

    情報処理学会

  • 日本語歌詞からの自動作曲における手描き入力による旋律制御

    大森, 陽, 光本, 大記, 濱田, 康弘, 嵯峨山, 茂樹 第79回全国大会講演論文集 2017 (1), 99-100, 2017-03-16

    自動作曲システムOrpheusは、現在ユーザが音高や音程を文字入力により指定することで制限し旋律を制御する機能を有している。本研究ではこれを発展させ、作曲技能を持たないユーザを支援する、より直感的な手法として、概形の手描き入力による旋律制御を提案する。旋律の作曲をDPの経路問題として捉え、音楽理論と日本語歌詞からの韻律の上下動に、概形の手描き入力に沿ったコストを加味することで、ユーザの創作意図が…

    情報処理学会

  • 複合ウェーブレットモデルを用いたテキスト音声合成の検討

    小口, 純矢, 濱田, 康弘, 嵯峨山, 茂樹 第79回全国大会講演論文集 2017 (1), 249-250, 2017-03-16

    本研究では,安定感のある音声合成を目指し,複合ウェーブレットモデルを用いたケプストラム特徴量からの音声合成法を検討する.従来のHMM音声合成では合成時にケプストラム特徴量と基本周波数からMLSAフィルタを用いた合成を行っていたが,巡回型フィルタを用いた方法ではフィルタの時間特性,ゲイン特性が音質の劣化を招いていた。そこで,本発表では,フィルタを用いない方法として,HMM音声合成により得られたケプ…

    情報処理学会

  • HMMに基づくジャズセッションシステムにおけるベース・ドラムスの演奏に関する検討

    保利, 武志, 中村, 和幸, 嵯峨山, 茂樹 第79回全国大会講演論文集 2017 (1), 129-130, 2017-03-16

    従来ヒューリスティックや感性情報を必要とした手法によって実現されていたジャズセッションシステムに対し、我々はこれまで統計的に学習可能な枠組みによるシステムの実現に向けた数理モデルや演奏の解析を行ってきた。また、その数理モデルの妥当性を実証するために、ピアノの演奏データを入力として、事例データからピアノ演奏にうまく調和するようなベースとドラムスの演奏を、NMFによるクラスタリングやtrigramに…

    情報処理学会

  • 視線解析を併用した頷き動作による自動譜めくりシステム

    地曳 はるか, 齋藤 康之, 中村 栄太, 嵯峨山 茂樹 映像情報メディア学会技術報告 41.4 (0), 29-32, 2017

    本論文では奏者の頷き動作による自動譜めくりシステムについて議論する.実際のピアノ演奏において,奏者は譜めくり係に頷いて譜めくりの合図を送っていることから,我々は頷き動作による自動譜めくりを開発してきた.しかし,頷き動作は譜めくりの合図だけではなくリズムのノリにも含まれる.そのため,システムは譜めくり合図の頷き動作だけに応答する必要がある.頷き動作とリズムノリ動作をサンプリングした結果,頷き動作よ…

    DOI Web Site

  • 分散的意味表現を利用した自動作詞

    堀 玄, 嵯峨山 茂樹 人工知能学会全国大会論文集 JSAI2017 (0), 1N12-1N12, 2017

    <p>歌詞コーパスを形態素解析して得られた形態素リスト上の経路探索による自動作詞システムを開発し、歌詞の韻律に基づく自動作曲システムと統合して、自動作詞作曲システム「オルフェウス」として公開中である。本システムは人工知能による芸術創作の事例として各種メディア(NHK、テレビ朝日、日経新聞等)に取り上げられている。稼動中の、word2vecの類似度を利用した経路探索に基づく自動作詞の原理について発…

    DOI

  • カラー画像内の対象物と背景からの印象語抽出による楽曲の半自動生成

    藤井 ほのか, 齋藤 康之, 嵯峨山 茂樹 映像情報メディア学会技術報告 41.4 (0), 25-28, 2017

    画像,音楽は人の情動に大きな影響を与える.画像を見る際にその画像の印象に合った音楽が流れれば,より深く画像の印象を伝えることができると考えられる.本研究では,画像内の対象物と背景を手動で分け,各色情報を「印象語」に変換し,楽曲を半自動で生成した.主観評価実験結果では,5段階評価で3以上を得た.

    DOI Web Site

  • CSM分析を用いた音声によるマウスカーソル操作

    田澤, 健斗, 篠原, 一輝, 嵯峨山, 茂樹 第78回全国大会講演論文集 2016 (1), 371-372, 2016-03-10

    手を使わずにでマウス操作を行いたい場面(調理中にレシピのページを変えたい時や、車の運転中など)がある。本研究では、そのような環境でマウス操作を行うために、音声によるマウス操作の実現を目標とする。音声認識を用いる従来の手法とは異なり、二次元平面上の任意の点に直接移動する方法を考えた。音声から得られる二次元量として音声フォルマント周波数が考えられるが用いると時間連続性に難があるため、それに性質が近く…

    情報処理学会

  • 音色に配慮した単旋律のギター自動運指決定

    金杉, 季実果, 田口, 旺太朗, 堀, 玄, 嵯峨山, 茂樹 第78回全国大会講演論文集 2016 (1), 435-436, 2016-03-10

    ギターの運指では、1つの音に対して取り得る左手の運指パターンは複数存在することが多く、運指を人手で決定することは必ずしも容易ではない。そこで、我々は、与えられた単旋律の楽譜データから、もっとも演奏しやすい運指を自動決定する研究を進めてきた。今回は、さらに、音色を考慮した演奏を行うための運指を自動決定する問題の定式化、アルゴリズム、実験結果について述べる。

    情報処理学会

  • ジャムセッションシステムに向けた演奏特徴量の統計解析

    保利, 武志, 中村, 和幸, 嵯峨山, 茂樹 第78回全国大会講演論文集 2016 (1), 431-432, 2016-03-10

    JAZZのセッションでは奏者同士のインタラクションによって様々なアドリブ演奏が展開される。この時、奏者の演奏意図は音高や音量といった物理的特徴量として観測され、各奏者がこれらの遷移やコード進行等に合わせた演奏を行うことによりセッションは成立する。本論文ではジャムセッションシステムの実現を目的として、実際のジャズ演奏MIDIデータから物理的特徴量を抽出して統計的に解析し、演奏の予測や生成に適した特…

    情報処理学会

  • 無矛盾位相復元を用いたケプストラム特徴量からの音声合成

    濱田, 康弘, 小野, 順貴, 嵯峨山, 茂樹 第78回全国大会講演論文集 2016 (1), 15-16, 2016-03-10

    本研究では,高品質な音声合成を目指し,無矛盾位相復元を用いたケプストラム特徴量からの音声合成法を提案する。従来のHMM音声合成では合成時にケプストラム特徴量と基本周波数からMLSAフィルタを用いた合成を行っていたが,巡回型フィルタを用いた方法ではフィルタの時間特性,ゲイン特性が音質の劣化を招いていた。そこで,本発表では,フィルタを用いない方法として,HMM音声合成により得られたケプストラム特徴量…

    情報処理学会

  • 動画特徴量からの印象推定に基づく動画BGMの自動生成

    清水, 柚里奈, 菅野, 沙也, 伊藤, 貴之, 嵯峨山, 茂樹 第78回全国大会講演論文集 2016 (1), 447-448, 2016-03-10

    動画を撮影してSNSで公開する際に,BGMを付与して楽しむ人が増え,またそれを支援するアプリも増えてきた.本研究では,動画から一定時間ごとに抽出した動きや色の動画特徴量から動画の印象を推定し,その結果に基づいて楽曲生成を行うことで,動画の印象に合った楽曲を付与する手法を提案する.また,ユーザに予め印象を回答してもらったリズム・メロディ素材をマッシュアップすることで楽曲生成を行うことから,ユーザご…

    情報処理学会

  • ケプストラム領域ピッチ操作とスペクトル位相復元を組み合わせた音声加工

    松原, 聖人, 林, 耕平, 光本, 大記, 濱田, 康弘, 小野, 順貴, 嵯峨山, 茂樹 第78回全国大会講演論文集 2016 (1), 535-536, 2016-03-10

    入力音声をケプストラム分析し、それによって取得した情報を基本周波数に関して操作したあと、パワースペクトルを経由して位相復元を用いて音声波形に戻すことによって、ピッチ変更などの変化を入力音声に与える。ケプストラムドメインで音声を加工することと、それを位相復元で音声波形領域に戻して可聴とすることの組み合わせによる音声加工法の提案である。

    情報処理学会

  • 楽譜上で演奏者が休止時の自動伴奏のテンポ制御(セッション1,学生研究発表会)

    長野 亜美, 齋藤 康之, 中村 栄太, 嵯峨山 茂樹 映像情報メディア学会技術報告 40.5 (0), 17-20, 2016

    楽譜に従って,人の演奏に追従して自動的に伴奏パートを演奏するシステムEurydice(ユリディス)は,演奏の生成過程を確率モデルでモデル化することにより,速度変化や弾き間違いがあっても柔軟に追従できる自動伴奏システムである.Eurydiceでは演奏者による入力に基づいてテンポ制御するが,楽譜上で演奏者パートの休止区間では伴奏パートのテンポ制御ができない.本研究では,そのような区間で,鍵のタップ動…

    DOI Web Site

  • 譜めくり合図の頷きとリズムノリの判別(セッション6,学生研究発表会)

    地曳 はるか, 齋藤 康之, 中村 栄太, 嵯峨山 茂樹 映像情報メディア学会技術報告 40.5 (0), 117-120, 2016

    本論文では自動譜めくりシステムにおいて,演奏者の譜めくり合図の頷きとリズムノリ動作を判別する方法について議論する.実際のピアノ演奏において演奏者は譜めくり係に頷いて譜めくりの合図を送っていることから,頷き動作をキューとした自動譜めくりを開発した.しかし,頷き動作は譜めくりの合図だけではなくリズムのノリにも含まれる.そのためシステムは譜めくり合図の頷き動作のみ認識する必要がある.そこで頷き動作とリ…

    DOI Web Site

  • ピアノ運指を含んだタテ線譜のSMFからの自動生成(セッション2,学生研究発表会)

    佐藤 陸, 中村 栄太, 齋藤 康之, 阿方 俊, 五十嵐 優, 嵯峨山 茂樹 映像情報メディア学会技術報告 40.5 (0), 29-32, 2016

    現在の楽譜の主流は,ピアノに限らず五線譜である.五線譜は多数の楽器の楽譜に採用されているものであり,情報量も多い.しかし,五線譜に慣れていない人にとってはその複雑さによって読むのが難しい.タテ線譜は,ピアノ演奏初心者が読譜し易い新しい楽譜であり,五線譜とは異なり簡素で直感的である.従来,タテ線譜は手動で作成されているが,本研究ではこれをSMFからピアノ運指を含めて自動生成する方法について検討する…

    DOI Web Site

  • 動画特徴量からの印象推定に基づく動画BGMの自動生成

    清水, 柚里奈, 菅野, 沙也, 伊藤, 貴之, 嵯峨山, 茂樹 第77回全国大会講演論文集 2015 (1), 377-378, 2015-03-17

    個人撮影動画をSNSで公開する際にBGMを付与するアプリが増えており、動画共有の楽しみの一環として普及している。本研究では動画特徴量からの印象推定結果に基づいた楽曲生成により、動画の印象に合った楽曲を付与する手法を提案する。まず動画に対して一定時間ごとに色および動きの特徴量を算出し、それに基づいて動画の印象を推定する。また予め用意したメロディとリズム進行についてユーザに印象を回答させ、動画の印象…

    情報処理学会

  • MIDIファイルからのタテ線譜の生成に関する研究(セッション1,学生研究発表会)

    佐藤 陸, 齋藤 康之, 阿方 俊, 嵯峨山 茂樹 映像情報メディア学会技術報告 39.8 (0), 5-8, 2015

    現在の楽譜の主流は,ピアノに限らず五線譜である.五線譜は多数の楽器の楽譜に採用されているものであり,情報量も多い.しかしながら,五線譜はその複雑さによって読み方に慣れていない人にとっては難しいものとなっている.タテ線譜は,共著者の一人である阿方が提唱している,読譜のしやすい新しい楽譜であり,五線譜とは異なり,簡素で直観的な見た目となっている.2010年から昭和音楽大学でピアノ初心者を対象に,効果…

    DOI Web Site

  • 音楽要素の分解再構成に基づく日本語歌詞からの旋律自動作曲

    深山, 覚, 中妻, 啓, 酒向, 慎司, 西本, 卓也, 小野, 順貴, 嵯峨山, 茂樹 情報処理学会論文誌 54 (5), 1709-1720, 2013-05-15

    日本語歌詞からユーザの意向を反映して多様な歌唱旋律を生成するための自動 作曲法があれば,歌のプレゼント,メールの歌い上げ,非専門家の創作支援な どが行える.本論文では初めに,自動作曲される旋律の多様性向上と音楽性の 保持の両立が難しいこ とを議論し,特に日本語歌詞から歌唱旋律を生成する際には,(1)音符数の変化 にかかわらず同じ印象を持つリズムの生成法と,(2)ユーザの意向,歌詞の韻律 …

    情報処理学会

  • 任意箇所への弾き直し・弾き飛ばしを含む演奏に追従可能な楽譜追跡と自動伴奏

    中村, 栄太, 武田, 晴登, 山本, 龍一, 齋藤, 康之, 酒向慎司, 嵯峨山, 茂樹 情報処理学会論文誌 54 (4), 1338-1349, 2013-04-15

    人間の演奏に対して,楽譜に基づき,自動的に同期して伴奏することは自動伴奏と呼ばれる.これは,合奏曲の練習や生演奏と電子音楽の融合に応用可能な技術であり,その効用は大きい.特に,練習時においては,弾き誤りや弾き直し,弾き飛ばしを含む演奏が起こりうるが,従来の自動伴奏はそのような演奏に対して追従が困難であるか,または特定箇所への弾き飛ばしのみ対応している.本稿では,任意箇所への弾き飛ばしを含む演奏に…

    情報処理学会

  • 日本語歌詞からの伴奏付き二重唱の自動作曲

    桐淵大貴, 深山覚, 齋藤大輔, 嵯峨山茂樹 第75回全国大会講演論文集 2013 (1), 303-304, 2013-03-06

    日本語歌詞から伴奏付き二重唱を自動作曲する手法について議論する.日本語歌詞から独唱を自動生成する先行研究があるが,さらに二重唱を作曲可能とすることによって,自動生成楽曲の音楽性と多様性を増大させることができる.また独唱作曲に比べ二重唱作曲はより作曲技能を必要とし,自動作曲を行う意義の大きい問題である.本発表では,あらかじめ作曲された第1声部に対して第2声部を生成する問題設定において,2声部間の音…

    情報処理学会

  • 楽譜の二次元木構造表現とリズム語彙に基づくMIDIデータからの自動採譜

    土屋政人, 落合和樹, 亀岡弘和, 嵯峨山茂樹 第75回全国大会講演論文集 2013 (1), 281-282, 2013-03-06

    自動採譜問題における発話時刻列から元の楽譜を推定するリズム解析の課題は,テンポと音価の間には無限の解釈が存在しうるという不良設定性の高い問題である.人間が音楽を聞く時にその楽譜を想像することができるのは、人間は音楽として常識的なリズムに関する知識を持っており,そういったトップダウンな情報と観測発話時刻列というボトムアップな情報の両側面から総合的に解釈を行っていると考えられる.そこで本研究ではこう…

    情報処理学会

  • 弾き直し・弾き飛ばしを含む音楽演奏への高速な音響入力楽譜追跡

    中村友彦, 中村栄太, 嵯峨山茂樹 第75回全国大会講演論文集 2013 (1), 283-284, 2013-03-06

    本研究の目的は,誤りや任意の弾き飛ばし・弾き直しを含む演奏の音響信号を入力とし,伴奏音響信号を同期再生する自動伴奏の実現である.楽譜上の任意の箇所から任意の箇所への弾き飛ばし・弾き直しを含む演奏を追跡する(楽譜追跡)ためには,総音符数の2乗オーダーの計算量が必要となる.そのため我々は,弾き飛ばし・弾き直しの際に短時間の演奏休止が起こりやすいことに着目し,弾き飛ばし・弾き直しの際に短時間の無音区間…

    情報処理学会

  • 日本語歌詞からの自動作曲におけるDP経路制約による旋律制御

    深山覚, 齋藤大輔, 嵯峨山茂樹 第75回全国大会講演論文集 2013 (1), 65-66, 2013-03-06

    日本語歌詞から歌唱曲を自動作曲する際に旋律の音楽的特徴を制御する方法を議論する。先行研究を用いると、手軽に日本語歌詞からオリジナル歌唱曲が作れる。よりユーザの意向を反映した歌唱曲の作曲のためには、旋律の特徴の制御が重要である。本発表では、まず旋律の作曲が確率的に定式化できることを議論した上で、跳躍進行型(元気のよい)旋律と順次進行型(なめらかな)旋律の作り分け、モチーフを含む旋律の生成が、動的計…

    情報処理学会

  • 楽譜情報からの作曲家らしさ認識のための音楽特徴量の提案

    長谷川, 隆, 西本, 卓也, 小野, 順貴, 嵯峨山, 茂樹 情報処理学会論文誌 53 (3), 1204-1215, 2012-03-15

    本論文では,音楽から受ける「作曲家らしさ」の印象を説明し定量的に測定できる工学的手法を目指して,音楽学における様式分析手法の1つであるラルーらの綜合的様式分析において論じられている様々な定性的特徴に対応する特徴量を提案する.対象データはMIDIデータとし,音の厚み等の音楽的な表現語の意味を解釈し,楽譜情報から計算可能な量を検討する.正準判別分析の作曲家推測精度を求めることにより,提案した特徴量群…

    情報処理学会 Web Site

  • マルチモーダル入力と強化学習による擬人化エージェントの対話制御の検討

    盧 迪, 久保 伸太郎, 深山 覚, 中沢 正幸, 西本 卓也, 嵯峨山 茂樹 人工知能学会全国大会論文集 JSAI2010 (0), 1J1OS135-1J1OS135, 2010

    <p>我々は、音声対話技術が人間に違和感を与えることなく使われるために、人間に近い外観を持ち、マルチモーダル情報を常に受け取り、意味のある反応をリアルタイムに行う擬人化エージェントシステムの実現を目指している。本報告では、強化学習に基づく音声対話の枠組みを発展させ、音声、顔認識等のマルチモーダル入力を用いて、エージェントが人間に話しかけたり人間の発話に割り込んだりするタイミングを制御する手法を提…

    DOI Web Site

  • チャネル間相関を用いた多チャネル信号の可逆圧縮符号化

    鎌本優, 守谷, 健弘, 西本, 卓也, 嵯峨山, 茂樹 情報処理学会論文誌 46 (5), 1118-1128, 2005-05-15

    本稿では,多チャネル時系列信号を対象に,各チャネルごとの時間領域の線形予測とその残差信号のチャネル間相関に基づく適応的差分を柔軟に利用した可逆圧縮符号化法を提案する.予測残差信号のチャネル間相関関数を基準に,符号化対象のチャネル信号から参照チャネルに最適重み係数を乗じた信号を引いた差信号を求め,信号の振幅が小さくなる傾向を利用してエントロピー符号化を行う.参照チャネルと符号化対象チャネルは逐次芋…

    情報処理学会 Web Site 被引用文献4件 参考文献15件

  • 視線制御モデルによる擬人化音声対話エージェントの制御

    中沢 正幸, 西本 卓也, 嵯峨山 茂樹 人工知能学会全国大会論文集 JSAI05 (0), 220-220, 2005

    擬人化音声対話エージェントにおいて,対話の流れに応じて適切にアイコンタクトを行うことは,対話相手である人間に自然な印象を与え,エージェントの実在感を高めるうえで重要である。我々は,(1)人間は相手に関する情報を得たり,相手に合図を送ったりするために能動的に視線を動かしながら対話を行う,(2)対話時の頭部及び眼球の動きは数理的な視線制御モデルに従う,という仮説に基づいて,擬人化音声対話エージェント…

    DOI Web Site 被引用文献1件

  • 確率モデルによる多声音楽演奏のMIDI信号のリズム認識

    武田晴登, 西本卓也, 嵯峨山茂樹 情報処理学会論文誌 45 (3), 670-679, 2004-03-15

    本稿では,人間による器楽演奏の情報を保存したMIDI(Musical InstrumentDigital Interface)信号からリズム認識を行う手法について述べる.演奏のテンポが未知であり多声部の構造を持つ楽曲のMIDI信号は従来リズム認識の対象として十分取り上げられてこなかったが,我々は演奏曲に対する事前知識を用いずにリズム認識を行う手法を提案する.演奏のテンポについての事前知識を用いず…

    情報処理学会 Web Site 被引用文献4件 参考文献12件

  • 視線制御モデルを用いた擬人化音声対話エージェントの提案

    中沢 正幸, 西本 卓也, 嵯峨山 茂樹 人工知能学会全国大会論文集 JSAI04 (0), 162-162, 2004

    音声対話技術コンソーシアム(ISTC)で開発中の擬人化音声対話エージェントツールキットGalateaにおいて,より人間に近く自然な頭部動作や視線移動などの振る舞いを行うための視線制御モデルについて提案を行う。

    DOI Web Site

  • 音声対話における擬人化エージェントの身体動作表現の利用

    西本 卓也, 中沢 正幸, 嵯峨山 茂樹 人工知能学会全国大会論文集 JSAI04 (0), 125-125, 2004

    音声対話技術コンソーシアム(ISTC)で開発中の擬人化音声対話エージェントツールキットGalateaにおいて,人間らしさを重視した視線,身体動作,表情などの制御を対話に応じて行うことで,対話システムの状態をユーザに効果的に提示することを試みる。

    DOI Web Site 被引用文献1件

  • 擬人化エージェントGalateaのためのVoiceXML処理系

    西本 卓也, 嵯峨山 茂樹 人工知能学会全国大会論文集 JSAI03 (0), 117-117, 2003

    擬人化音声対話エージェントツールキット"Galatea"の一部としてVoiceXML処理系を開発したので報告する。また本ツールキットの応用例と、対話記述機能に関する今後の課題について述べる。

    DOI Web Site 被引用文献1件

  • 最尤推定を用いた声道長線形変換による話者正規化

    六井, 淳, 中井, 満, 下平, 博, 嵯峨山, 茂樹 情報処理学会論文誌 43 (7), 2030-2037, 2002-07-15

    音声認識技術において性能劣化要因として話者性の違いや雑音などの使用条件の変化があげられる.近年,HMM(隠れマルコフモデル)のパラメータ推定に用いられるEMアルゴリズムに基づくケプストラム領域での声道長正規化手法が提案されている.従来法では,周波数領域において端点固定の非線形伸縮となるため,少量の適応データでは十分な精度が得られないという問題があった.本研究では声道長による特徴量の変化を周波数領…

    情報処理学会 Web Site 被引用文献1件 参考文献11件

  • カスタマイズ性を考慮した擬人化音声対話ソフトウェアツールキットの設計

    川本, 真一, 下平, 博, 新田, 恒雄, 西本, 卓也, 中村, 哲, 伊藤, 克亘, 森島, 繁生, 四倉, 達夫, 甲斐, 充彦, 李晃伸, 山下, 洋一, 小林, 隆夫, 徳田, 恵一, 広瀬, 啓吉, 峯松, 信明, 山田, 篤, 伝, 康晴, 宇津呂, 武仁, 嵯峨山, 茂樹 情報処理学会論文誌 43 (7), 2249-2263, 2002-07-15

    本論文では,擬人化音声対話エージェントを将来のヒューマンインタフェースの重要な技術要素として位置づけ,研究開発の共通プラットフォームとなりうる高いカスタマイズ可能性を備えたソフトウェアツールキットの実現を目指し,それに必要な要素とその実現技術について論じる.今後のヒューマンインタフェース技術において,コンピュータがあたかも一個の人間として振る舞い,人間の顔や姿を持ち,ユーザと音声言語で対話するよ…

    機関リポジトリ 情報処理学会 HANDLE ほか1件 被引用文献17件 参考文献31件

  • 隠れマルコフモデルによる音楽リズムの認識

    大槻知史, 齋藤, 直樹, 中井, 満, 下平, 博, 嵯峨山, 茂樹 情報処理学会論文誌 43 (2), 245-255, 2002-02-15

    本稿では,隠れマルコフモデル(HMM)を用いて,人間が鍵盤入力した演奏情報(標準MIDIファイル)の発音時刻の間隔から,意図された音価列を復元推定する手法を提案し,実験によりその効果を実証する.人間が音楽演奏する際の物理的音長は,音価に対応する正規の長さから意識的・無意識的に揺らぐため,楽譜入力や自動採譜などでは,楽譜として意図された各音符の音価を正しく推定するのは容易ではない.そこで,連続音声…

    情報処理学会 Web Site 被引用文献12件 参考文献13件

  • 日本語ディクテーション基本ソフトウェア(99年度版)

    河原 達也, 李 晃伸, 小林 哲則, 武田 一哉, 峰松 信明, 嵯峨山 茂樹, 伊藤 克亘, 伊藤 彰則, 山本 幹雄, 山田 篤, 宇津呂 武仁, 鹿野 清宏 日本音響学会誌 57 (3), 210-214, 2001

    「日本語ディクテーション基本ソフトウェア」は, 大語彙連続音声認識(LVCSR)研究・開発の共通プラットフォームとして設計・作成された。このプラットフォームは, 標準的な認識エンジン・日本語音響モデル・日本語言語モデル及び日本語形態素解析・読み付与ツール等から構成される。99年度版では更なる高精度化・高速化そして大語彙化がなされた。本稿ではその仕様を述べると共に, 20, 000語彙及び60, …

    DOI 機関リポジトリ HANDLE ほか1件 被引用文献44件 参考文献12件

  • HMMと一般化LR構文解析を用いた実時間大語彙連続音声認識装置の実現

    永井 明人, 北 研二, 花沢 利行, 川端 豪, 鹿野 清宏, 森元 逞, 嵯峨山 茂樹, 榑松 明, 鈴木 忠, 岩崎 知宏, 中島 邦男 日本音響学会誌 50 (9), 723-729, 1994

    本稿は、大語彙の連続音声認識を実時間で処理するための、HMM-LR連続音声認識装置の設計、処理性能について述べる。HMM-LR法は、一般化LR構文解析により入力音声データ中の音素を予測し、予測された音素の存在確率をHMM音素照合により調べることで、音声認識と言語処理を同時進行させる方式であり、高精度で効率的な処理系を構成することができる。処理量が極めて大きな継続時間制御付きトレリス計算を伴うHM…

    DOI 機関リポジトリ HANDLE ほか1件 被引用文献1件 参考文献13件

  • ATR音声言語翻訳実験システムASURA

    竹沢, 寿幸, 森元, 逞, 谷戸, 文廣, 鈴木, 雅実, 嵯峨山, 茂樹, 槫松, 明 全国大会講演論文集 第46回 (人工知能及び認知科学), 161-162, 1993-03-01

    異なる言語を話す人の間のコミュニケーションが円滑に行なえることを目指して、音声認識・言語翻訳および音声合成を一貫して結合した音声言語翻訳実験システムASURA(Advanced Speech Understanding and Rendering System of ATR)を作成した。音声認識部はATRで提案・開発されたSSS-LR方式を採用しており、多数話者に対しても高い認識率を達成している…

    情報処理学会

  • 隠れマルコフモデルによる言語モデル自動獲得の検討

    山本, 寛樹, 村上, 仁一, 嵯峨山, 茂樹 全国大会講演論文集 第45回 (人工知能及び認知科学), 227-228, 1992-09-28

    本稿では、全状態間の遷移が許された隠れマルコフモデル(ergodic HMM、以後、HMMと略記する)を用いて確率つきネットワーク文法を自動的に獲得することを試みた。言語モデルには、構文情報を記述したモデルとしてネットワーク文法(有限状態オートマトン)、自由文脈文法などがあり、統計情報を記述したモデルとしてbigramやtrigram、さらにネットワーク文法に統計的な情報を加えた確率つきネットワ…

    情報処理学会

  • HMMを用いた形態素解析

    村上, 仁-, 嵯峨山, 茂樹 全国大会講演論文集 第45回 (人工知能及び認知科学), 161-162, 1992-09-28

    形態素解析は、従来から対話、翻訳、校正などの目的のために、自然言語処理研究の一つの分野として研究が続けられている。これらの方式の多くは、予め単語を構文的意味的なカテゴリに分類してカテゴリー間の接続ルールや係受けルールを記述しておく必要がある。しかし、実際の日本語では単語の境界が明確でないことや単語の多品詞性や曖昧な係受けなどの問題があるため、精密なルールの作成は容易でない。そこで、本論文では隠れ…

    情報処理学会 被引用文献1件

  • ピッチとスペクトルの相関を用いたHMM音素認識

    シンガー ハラルド, 嵯峨山 茂樹 テレビジョン学会技術報告 15 (54), 15-20, 1991

    本論文では、ピッチとスペクトルの相関を利用して、ピッチ情報を音素HMMのパラメータに反映させた新しい音声認識手法を提案する。本手法は、ピッチを利用した従来の手法とは異なり、ピッチパターンは直接利用せず、ピッチとスペクトルの間に存在する相関関係を用いて、スペクトルパラメータをフレーム毎に正規化して使用することを特徴としている。これによって音素認識性能の向上に直接結び付くと考えられるいくつかの効果が…

    DOI

  • 双方向網探索によるHMM文節音声認識系の評価

    松永, 昭一, 嵯峨山, 茂樹 全国大会講演論文集 第41回 (人工知能及び認知科学), 241-242, 1990-09-04

    隠れマルコフモデル(HMM)は音声認識において広く用いられている。特に、音素単位のモデルは、連続音声認識への拡張性に優れている。本稿では、筆者らが構築してきた音素単位のHMMに基づく文節音声認識系(図1)における文節音声認識部(双方向網探索を用いた文節認識)に対して、処理量の評価を行ったので、その結果を報告する。[figure]

    情報処理学会

  • 音声の分析・合成・認識

    嵯峨山 茂樹, 板倉 文忠 応用物理 49 (4), 330-337, 1980

    Advances of these years in field of speech analysis, synthesis, and recognition are briefly reviewed.<br> First, engineering model of speech production is introduced as a time varying linear system …

    DOI Web Site

  • 図形の分離と特徴抽出

    藤村 貞夫, 嵯峨山 茂樹 計測自動制御学会論文集 10 (1), 127-133, 1974

    A method for segmentation of quantized patterns from a standpoint of connectivity is proposed. A pattern consisting of black points connected to each other is separated as a unit. These points are …

    DOI Web Site

  • 1 / 1
ページトップへ