TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025069511
公報種別
公開特許公報(A)
公開日
2025-05-01
出願番号
2023179264
出願日
2023-10-18
発明の名称
音声処理方法、音声処理システム、プログラムおよび音声処理ソフトウェア
出願人
ヤマハ株式会社
代理人
弁理士法人旺知国際特許事務所
主分類
G10L
21/007 20130101AFI20250423BHJP(楽器;音響)
要約
【課題】複数のトラックに設定された音声信号の声質変換において、聴感的に自然な再生音声を生成することを目的とする。
【解決手段】音声処理システムは、音楽制作ソフトウェアにおける複数のトラックの各々に対し、当該トラックに設定された音声信号の声質変換を含む音声処理プラグインを割当てる割当部と、複数のトラックのうち第1トラックに割当てられた音声処理プラグインによる処理後の第1音声信号に関する第1音楽パラメータと、第1トラックとは異なる第2トラックに割当てられた音声処理プラグインによる処理後の第2音声信号に関する第2音楽パラメータとを相違させる調整部43とを具備する。
【選択図】図6
特許請求の範囲
【請求項1】
音楽制作ソフトウェアにおける複数のトラックの各々に対し、当該トラックに設定された音声信号の声質変換を含む音声処理プラグインを割当て、
前記複数のトラックのうち第1トラックに割当てられた音声処理プラグインによる処理後の第1音声信号に関する第1音楽パラメータと、前記第1トラックとは異なる第2トラックに割当てられた音声処理プラグインによる処理後の第2音声信号に関する第2音楽パラメータとを相違させる
コンピュータシステムにより実現される音声処理方法。
続きを表示(約 1,500 文字)
【請求項2】
前記第1音楽パラメータおよび前記第2音楽パラメータは、発音タイミングを含む
請求項1の音声処理方法。
【請求項3】
前記第1音楽パラメータおよび前記第2音楽パラメータは、音高、音量、および、音響特性の時間的な変動に関するパラメータ、のうちの少なくともひとつを含む
請求項1または請求項2の音声処理方法。
【請求項4】
前記第1トラックに割当てられた音声処理プラグインによる声質変換は、第1声質への変換であり、
前記第2トラックに割当てられた音声処理プラグインによる声質変換は、第1声質とは相違する第2声質への変換であり、
前記第1音声信号における音楽パラメータの調整条件と、前記第2音声信号における音楽パラメータの調整条件とは相違する
請求項1の音声処理方法。
【請求項5】
前記音声処理プラグインによる声質変換は、複数の声質のうち利用者が選択した声質に変換する処理である
請求項1の音声処理方法。
【請求項6】
前記複数の声質の何れかの選択と前記音声処理プラグインによる声質変換とは、変換後の音声信号の再生に並行して実行される
請求項5の音声処理方法。
【請求項7】
前記音声処理プラグインによる声質変換は、
訓練済の第1生成モデルにより前記声質変換前の音声信号を処理することで、当該音声信号の音響的な特徴を表す第1制御データを生成する処理と、
前記音楽パラメータを相違させるための処理を前記第1制御データに対して実行することで第2制御データを生成する処理と、
訓練済の第2生成モデルにより前記第2制御データを処理することで、前記声質変換後の音声信号を生成する処理とを含む
請求項1の音声処理方法。
【請求項8】
音楽制作ソフトウェアにおける複数のトラックの各々に対し、当該トラックに設定された音声信号の声質変換を含む音声処理プラグインを割当てる割当部と、
前記複数のトラックのうち第1トラックに割当てられた音声処理プラグインによる処理後の第1音声信号に関する第1音楽パラメータと、前記第1トラックとは異なる第2トラックに割当てられた音声処理プラグインによる処理後の第2音声信号に関する第2音楽パラメータとを相違させる調整部と
を具備する音声処理システム。
【請求項9】
音楽制作ソフトウェアにおける複数のトラックの各々に対し、当該トラックに設定された音声信号の声質変換を含む音声処理プラグインを割当てる割当部、および、
前記複数のトラックのうち第1トラックに割当てられた音声処理プラグインによる処理後の第1音声信号に関する第1音楽パラメータと、前記第1トラックとは異なる第2トラックに割当てられた音声処理プラグインによる処理後の第2音声信号に関する第2音楽パラメータとを相違させる調整部、
としてコンピュータシステムを機能させるプログラム。
【請求項10】
音楽制作ソフトウェアにおける複数のトラックの各々に対して割当てられ、当該トラックに設定された音声信号の声質変換を含む音声処理プラグインと、
前記複数のトラックのうち第1トラックに割当てられた音声処理プラグインによる処理後の第1音声信号に関する第1音楽パラメータと、前記第1トラックとは異なる第2トラックに割当てられた音声処理プラグインによる処理後の第2音声信号に関する第2音楽パラメータとを相違させる調整プログラムと
を含む音声処理ソフトウェア。
発明の詳細な説明
【技術分野】
【0001】
本開示は、音声信号を処理する技術に関する。
続きを表示(約 2,300 文字)
【背景技術】
【0002】
声質を変換するための各種の技術が従来から提案されている。例えば特許文献1には、音響データから生成された音響特徴データを音響エンコーダにより処理することで中間特徴データを生成し、中間特徴データを音響デコーダにより処理することで、音響データとは声質が異なる合成音響データを生成する構成が開示されている。
【先行技術文献】
【特許文献】
【0003】
特開2022-06554号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
音楽制作ソフトウェア(DAW:Digital Audio Workstation)に追加されるプラグインにより音声信号の声質を変換することが想定される。音楽制作ソフトウェアの相異なるトラックに設定された複数の音声信号の声質を変換して並列に再生した場合、変換後の複数の音声信号の間で発音タイミングまたは音高等の音楽パラメータが完全に一致すると、再生音声が聴感的に不自然な印象となる。以上の事情を考慮して、本開示のひとつの態様は、複数のトラックに設定された音声信号の声質変換において、聴感的に自然な再生音声を生成することを目的とする。
【課題を解決するための手段】
【0005】
以上の課題を解決するために、本開示のひとつの態様に係る音声処理方法は、音楽制作ソフトウェアにおける複数のトラックの各々に対し、当該トラックに設定された音声信号の声質変換を含む音声処理プラグインを割当て、前記複数のトラックのうち第1トラックに割当てられた音声処理プラグインによる処理後の第1音声信号に関する第1音楽パラメータと、前記第1トラックとは異なる第2トラックに割当てられた音声処理プラグインによる処理後の第2音声信号に関する第2音楽パラメータとを相違させる。
【0006】
本開示のひとつの態様に係る音声処理システムは、音楽制作ソフトウェアにおける複数のトラックの各々に対し、当該トラックに設定された音声信号の声質変換を含む音声処理プラグインを割当てる割当部と、前記複数のトラックのうち第1トラックに割当てられた音声処理プラグインによる処理後の第1音声信号に関する第1音楽パラメータと、前記第1トラックとは異なる第2トラックに割当てられた音声処理プラグインによる処理後の第2音声信号に関する第2音楽パラメータとを相違させる調整部とを具備する。
【0007】
本開示のひとつの態様に係るプログラムは、音楽制作ソフトウェアにおける複数のトラックの各々に対し、当該トラックに設定された音声信号の声質変換を含む音声処理プラグインを割当てる割当部、および、前記複数のトラックのうち第1トラックに割当てられた音声処理プラグインによる処理後の第1音声信号に関する第1音楽パラメータと、前記第1トラックとは異なる第2トラックに割当てられた音声処理プラグインによる処理後の第2音声信号に関する第2音楽パラメータとを相違させる調整部、としてコンピュータシステムを機能させる。
【0008】
本開示のひとつの態様に係る音声処理ソフトウェアは、音楽制作ソフトウェアにおける複数のトラックの各々に対して割当てられ、当該トラックに設定された音声信号の声質変換を含む音声処理プラグインと、前記複数のトラックのうち第1トラックに割当てられた音声処理プラグインによる処理後の第1音声信号に関する第1音楽パラメータと、前記第1トラックとは異なる第2トラックに割当てられた音声処理プラグインによる処理後の第2音声信号に関する第2音楽パラメータとを相違させる調整プログラムとを含む。
【図面の簡単な説明】
【0009】
第1実施形態における音声処理システムの構成を例示するブロック図である。
記憶装置に記憶される情報の説明図である。
音楽制作画面の模式図である。
音声処理システムが実行する音声処理の説明図である。
音声処理システムの機能的な構成を例示するブロック図である。
音声処理部の構成を例示するブロック図である。
調整部が発音タイミングを調整する処理の説明図である。
音声信号を生成する処理のフローチャートである。
第2実施形態の調整部が音高を調整する処理の説明図である。
第3実施形態の調整部が音量を調整する処理の説明図である。
第4実施形態の調整部が特性変動パラメータを調整する処理の説明図である。
第5実施形態における調整条件の説明図である。
第6実施形態における表示画面の模式図である。
【発明を実施するための形態】
【0010】
A:第1実施形態
図1は、第1実施形態における音声処理システム100の構成を例示するブロック図である。音声処理システム100は、各種の音声処理を実行するコンピュータシステムであり、例えばスマートフォン、タブレット端末またはパーソナルコンピュータ等の情報装置で実現される。音声処理システム100は、制御装置11と記憶装置12と表示装置13と操作装置14と放音装置15とを具備する。なお、音声処理システム100は、単体の装置として実現されるほか、相互に別体で構成された複数の装置でも実現される。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
ヤマハ株式会社
情報処理方法
今日
ヤマハ株式会社
情報処理方法
今日
ヤマハ株式会社
機器制御方法および機器制御装置
2日前
ヤマハ株式会社
機器制御方法および機器制御装置
2日前
ヤマハ株式会社
情報処理システム、情報処理方法及びプログラム
1日前
ヤマハ株式会社
テレビ会議装置、テレビ会議方法およびテレビ会議プログラム
5日前
株式会社コルグ
ピッチ表示装置、ピッチ表示制御装置、プログラム
6日前
ヤマハ株式会社
コミュニケーション支援方法、コミュニケーション支援装置、およびプログラム
6日前
個人
メガホン
2日前
個人
リアルタイム翻訳システム
1か月前
個人
10デジタルサラウンドラジオ
19日前
三井化学株式会社
遮音構造体
28日前
三井化学株式会社
遮音構造体
7日前
三菱電機株式会社
吸音体
1日前
旭化成株式会社
内装吸音材
2日前
トヨタ自動車株式会社
音声制御装置
27日前
ヤマハ株式会社
情報処理方法
今日
矢崎総業株式会社
車両用対話システム
13日前
矢崎総業株式会社
車両用対話システム
13日前
ヤマハ株式会社
情報処理方法
今日
矢崎総業株式会社
車両用対話システム
13日前
矢崎総業株式会社
車両用対話システム
13日前
矢崎総業株式会社
車両用対話システム
13日前
矢崎総業株式会社
車両用対話システム
13日前
トヨタ自動車株式会社
情報処理装置
1か月前
株式会社第一興商
カラオケ装置
9日前
ヤマハ株式会社
鍵盤装置
8日前
ヤマハ株式会社
鍵盤楽器
27日前
トヨタ自動車株式会社
車両
1日前
株式会社しくみ
音声翻訳プログラム
29日前
学校法人 工学院大学
音響拡散パネル
8日前
株式会社Gottsu
サキソフォーン向けねじ込み式スクリュー
21日前
日本放送協会
音声認識装置およびプログラム
13日前
ソフトバンクグループ株式会社
システム
1か月前
ソフトバンクグループ株式会社
システム
1か月前
国立研究開発法人産業技術総合研究所
実況音声生成システム
5日前
続きを見る
他の特許を見る