TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024057679
公報種別公開特許公報(A)
公開日2024-04-25
出願番号2022164477
出願日2022-10-13
発明の名称情報処理装置及び情報処理方法、コンピュータプログラム、音生成システム、並びに情報端末
出願人ソニーグループ株式会社
代理人個人,個人,個人,個人,弁理士法人大同特許事務所
主分類G10H 1/00 20060101AFI20240418BHJP(楽器;音響)
要約【課題】楽器音の生成に関する情報処理を行う情報処理装置を提供する。
【解決手段】情報処理装置は、入力音及び音程情報を入力する入力部と、入力音から音色特徴量を抽出する抽出部と、音色特徴量と音程情報に基づいて、入力音の特徴を反映した音程付き楽器音の情報を生成する生成部を具備する。前記生成部は、本開示モデルによって学習された生成器を用いて、入力音を前処理後の情報と音程情報をインスタンス条件として音程付き楽器音の情報を生成する。前記抽出部は、音程に関する敵対的学習を行った音色特徴抽出器を用いて、音程情報が残らないように、入力音の音色特徴量を抽出する。
【選択図】 図3
特許請求の範囲【請求項1】
入力音及び音程情報を入力する入力部と、
入力音から音色特徴量を抽出する抽出部と、
音色特徴量と音程情報に基づいて、入力音の特徴を反映した音程付き楽器音の情報を生成する生成部と、
を具備する情報処理装置。
続きを表示(約 1,000 文字)【請求項2】
前記生成部は、学習済みモデルを用いて、入力音を前処理後の情報と音程情報をインスタンス条件として音程付き楽器音の情報を生成する、
請求項1に記載の情報処理装置。
【請求項3】
前記抽出部は、音程情報が残らないように音色特徴量を抽出する、
請求項1に記載の情報処理装置。
【請求項4】
前記抽出部は、音程に関する敵対的学習を行った音色特徴抽出器を用いて、入力音の音色特徴量を抽出する、
請求項1に記載の情報処理装置。
【請求項5】
入力音をメルスペクトログラムに変換する変換部をさらに備え、
前記抽出部は、入力音のメルスペクトログラムから入力音の音色特徴量を抽出する、
請求項1乃至4のいずれか1つの記載の情報処理装置。
【請求項6】
前記生成部は、音色特徴量と音程情報をインスタンス条件として、音程付き楽器音のメルスペクトログラムを生成し、
前記生成部が生成したメルスペクトログラムからオーディオ波形を構築する逆変換部をさらに備える、
請求項5に記載の情報処理装置。
【請求項7】
前記逆変換部は、メルスペクトログラムを線形スペクトログラムに周波数スケールに変換するスケール変換部と、線形スペクトログラムの位相を復元する位相復元部と、位相を復元した後の線形スペクトログラムをフーリエ逆変換するフーリエ逆変換部を含む、
請求項6に記載の情報処理装置。
【請求項8】
前記スケール変換部は、非負値制約なしの最小二乗法の解に非負値への修正を施したものを反復計算の初期値に設定して、勾配法による更新と非負値への修正を繰り返す反復法によって周波数スケール変換を行う、
請求項7に記載の情報処理装置。
【請求項9】
前記入力部は、複数の入力音を入力可能であり、
前記抽出部は、入力された各入力音から音色特徴量を抽出し、
前記生成部は、各入力音の音色特徴量を混合した音色特徴量と音程情報に基づいて楽器音情報を生成する、
請求項1に記載の情報処理装置。
【請求項10】
前記入力部は、複数の入力音の混合比率に関する情報をさらに入力し、
前記生成部は、入力された混合比率に基づいて各入力音の音色特徴量を混合した音色特徴量と音程情報に基づいて楽器音情報を生成する、
請求項9に記載の情報処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本明細書で開示する技術(以下、「本開示」とする)は、音楽制作に関する情報処理を行う情報処理装置及び情報処理方法、コンピュータプログラム、音生成システム、並びに情報端末に関する。
続きを表示(約 2,600 文字)【背景技術】
【0002】
AI(Artificial Intelligence)技術の発達が目覚ましく、学習モデルを用いた画像や音声などの認識技術が普及している。最近では、敵対的生成ネットワーク(GAN)を用いて精巧な画像を生成する画像生成技術も開発されている。さらに、AI技術を音楽の制作に活用する方法も模索されている。例えば、楽器音の特性を反映したDNN(Deep Neural Network)を用いて音源強調をする楽音強調装置や(特許文献1を参照のこと)、GANsやVAE(Variational AutoEncoder)を用いて生成された学習済みモデルを使って多様な楽曲を自動生成する情報処理方法(特許文献2を参照のこと)などが提案されている。
【先行技術文献】
【特許文献】
【0003】
特開2019-78864号公報
特開2020-3535号公報
【非特許文献】
【0004】
Arantxa Casanova,Marl'ene Careil,Jakob Verbeek,Michal Drozdzal, and Adriana Romero-Soriano,"Instance-conditioned GAN," in Advances in Neural Information Processing Systems (NeurIPS),2021.
Jesse Engel, Cinjon Resnick, Adam Roberts,Sander Dieleman,Mohammad Norouzi,Douglas Eck,and Karen Simonyan,"Neural audio synthesis of musical notes with wavenet autoencoders," in International Conference on Machine Learning.PMLR,2017,pp.1068-1077.
Aaron van den Oord, Sander Dieleman,Heiga Zen,Karen Simonyan,Oriol Vinyals,Alex Graves,Nal Kalchbrenner,Andrew Senior, and Koray Kavukcuoglu, "Wavenet:A generative model for raw audio," arXiv preprint arXiv:1609.03499,2016.
Jesse Engel, Kumar Krishna Agrawal, Shuo Chen, Ishaan Gulrajani, Chris Donahue, and Adam Roberts, "Gansynth: Adversarial neural audio synthesis," in International Conference on Learning Representations, 2018.
Sean Vasquez and Mike Lewis,"Melnet: A generative model for audio in the frequency domain," arXiv preprint arXiv:1906.01083,2019.
【発明の概要】
【発明が解決しようとする課題】
【0005】
計算機を用いて音楽を制作するアプローチとして主に、メロディーや伴奏を含む音楽の音を直接合成する方法と、単音の楽器音を合成してMIDI(Musical Instrument Digital Interface)を演奏する方法の2つが挙げられる。前者は、end-to-endでの音楽生成が可能であるが、生成の制御性が低いという問題がある。これに対し、後者は、MIDIの生成と音色のデザインをそれぞれ独立に制御可能であり、生成される音の品質が高いという利点がある。
【0006】
そこで、本開示の目的は、例えばMIDI演奏に使用可能な楽器音の生成に関する情報処理を行う情報処理装置及び情報処理方法、コンピュータプログラム、音生成システム、並びに情報端末を提供することとする。
【課題を解決するための手段】
【0007】
本開示は、上記課題を参酌してなされたものであり、その第1の側面は、
入力音及び音程情報を入力する入力部と、
入力音から音色特徴量を抽出する抽出部と、
音色特徴量と音程情報に基づいて、入力音の特徴を反映した音程付き楽器音の情報を生成する生成部と、
を具備する情報処理装置である。
【0008】
前記生成部は、本開示モデルによって学習された生成器を用いて、入力音を前処理後の情報と音程情報をインスタンス条件として音程付き楽器音の情報を生成するように構成されている。
【0009】
また、前記抽出部は、音程に関する敵対的学習を行った音色特徴抽出器を用いて、音程情報が残らないように入力音の音色特徴量を抽出するように構成されている。
【0010】
第1の側面に係る情報処理装置は、入力音をメルスペクトログラムに変換する変換部をさらに備えている。そして、前記抽出部は、入力音のメルスペクトログラムから入力音の音色特徴量を抽出するように構成されている。この場合、前記生成部は、音色特徴量と音程情報をインスタンス条件として、音程付き楽器音のメルスペクトログラムを生成するように構成されている。そして、第1の側面に係る情報処理装置は、前記生成部が生成したメルスペクトログラムからオーディオ波形を構築する逆変換部をさらに備えている。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

株式会社フジコー
吸音材
19日前
個人
歌唱補助マスク
3日前
三井化学株式会社
防音構造体
23日前
株式会社JVCケンウッド
情報処理装置
9日前
株式会社フェルナンデス
電気ギター用弦振動持続装置
9日前
ヤマハ株式会社
管楽器用スワブ
17日前
株式会社レゾナック
吸音材及び車両部材
10日前
株式会社河合楽器製作所
自動演奏装置及び自動演奏プログラム
19日前
TDK株式会社
振動デバイス及びこれを備えるICカード
23日前
トヨタ自動車株式会社
車室の床下構造
17日前
富士通株式会社
評価プログラム、評価方法、評価装置
11日前
株式会社NTTドコモ
発話スタイル改善支援装置
16日前
株式会社河合楽器製作所
鍵盤楽器の鍵盤装置
23日前
株式会社河合楽器製作所
鍵盤楽器の鍵盤装置
23日前
株式会社河合楽器製作所
鍵盤楽器の鍵盤装置
18日前
株式会社河合楽器製作所
鍵盤楽器の鍵盤装置
23日前
株式会社河合楽器製作所
鍵盤楽器の鍵盤装置
18日前
ヤマハ株式会社
音響モデルの訓練方法
18日前
日産自動車株式会社
対話装置及び対話制御方法
17日前
ヤマハ株式会社
音響モデルの訓練方法
18日前
株式会社河合楽器製作所
鍵盤楽器の鍵ガイド構造
23日前
株式会社河合楽器製作所
鍵盤楽器のハンマー装置
23日前
株式会社河合楽器製作所
鍵盤用錘及び鍵盤楽器の鍵
23日前
株式会社河合楽器製作所
鍵盤用錘及び鍵盤楽器の鍵
23日前
ヤマハ株式会社
楽曲生成方法、およびプログラム
16日前
ヤマハ株式会社
音波形の特性分布に係る表示方法
18日前
ヤマハ株式会社
音響モデルの訓練システム及び方法
18日前
福井経編興業株式会社
吸音体
22日前
福井経編興業株式会社
吸音体
22日前
ヤマハ株式会社
プログラム、音響処理方法および音響処理システム
10日前
カシオ計算機株式会社
情報処理装置、電子楽器、制御方法及びプログラム
16日前
ヤマハ株式会社
演奏操作装置
22日前
カシオ計算機株式会社
電子機器、電子楽器システム、再生制御方法及びプログラム
18日前
学校法人日本大学
防音材の設計方法、製造方法、設計装置及び設計用プログラム
16日前
カシオ計算機株式会社
練習システム、練習方法、及びプログラム、並びに指導者端末装置
17日前
株式会社毎日放送
コンテンツ再生制御システム
9日前
続きを見る