TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025061575
公報種別公開特許公報(A)
公開日2025-04-10
出願番号2025008873,2023207055
出願日2025-01-22,2016-06-09
発明の名称音声処理装置および方法、並びにプログラム
出願人ソニーグループ株式会社
代理人個人,個人
主分類H04S 7/00 20060101AFI20250403BHJP(電気通信技術)
要約【課題】より高品質な音声を得ることができるようにする。
【解決手段】取得部は、オブジェクトのオーディオ信号とメタデータを取得する。ベクトル算出部は、オブジェクトのメタデータに含まれている、音像の広がりを示す水平方向角度および垂直方向角度に基づいて、音像の広がりを示す領域内の位置を示すspreadベクトルを算出する。ゲイン算出部は、spreadベクトルに基づいて、VBAPにより各スピーカについてオーディオ信号のVBAPゲインを算出する。本技術は音声処理装置に適用することができる。
【選択図】図6
特許請求の範囲【請求項1】
オーディオオブジェクトの位置を示す位置情報と、少なくとも2次元以上のベクトルからなる、前記位置からの音像の広がりを表す音像情報とを含むメタデータを取得する取得部と、
前記音像情報により定まる音像の広がりを表す領域に関する水平方向角度および垂直方向角度に基づいて、前記領域内の位置を示すspreadベクトルを算出するベクトル算出部と、
前記spreadベクトルに基づいて、前記位置情報により示される前記位置近傍に位置する2以上の音声出力部に供給されるオーディオ信号のそれぞれのゲインを算出するゲイン算出部と
を備える音声処理装置。
続きを表示(約 1,000 文字)【請求項2】
前記ベクトル算出部は、前記水平方向角度と前記垂直方向角度の比に基づいて、前記spreadベクトルを算出する
請求項1に記載の音声処理装置。
【請求項3】
前記ベクトル算出部は、予め定められた個数の前記spreadベクトルを算出する
請求項1に記載の音声処理装置。
【請求項4】
前記ベクトル算出部は、可変である任意の個数の前記spreadベクトルを算出する
請求項1に記載の音声処理装置。
【請求項5】
前記音像情報は、前記領域の中心位置を示すベクトルである
請求項1に記載の音声処理装置。
【請求項6】
前記音像情報は、前記領域の中心からの音像の広がり度合いを示す2次元以上のベクトルである
請求項1に記載の音声処理装置。
【請求項7】
前記音像情報は、前記位置情報により示される位置から見た前記領域の中心位置の相対的な位置を示すベクトルである
請求項1に記載の音声処理装置。
【請求項8】
前記ゲイン算出部は、
各前記音声出力部について、前記spreadベクトルごとに前記ゲインを算出し、
前記音声出力部ごとに、各前記spreadベクトルについて算出した前記ゲインの加算値を算出し、
前記音声出力部ごとに、前記加算値を2値以上のゲインに量子化し、
前記量子化された前記加算値に基づいて、前記音声出力部ごとに最終的な前記ゲインを算出する
請求項1に記載の音声処理装置。
【請求項9】
前記ゲイン算出部は、3つの前記音声出力部により囲まれる領域であるメッシュであって、前記ゲインの算出に用いるメッシュの数を選択し、前記メッシュの数の選択結果と前記spreadベクトルとに基づいて、前記spreadベクトルごとに前記ゲインを算出する
請求項8に記載の音声処理装置。
【請求項10】
前記ゲイン算出部は、前記ゲインの算出に用いる前記メッシュの数、前記量子化を行うか否か、および前記量子化時における前記加算値の量子化数を選択し、その選択結果に応じて前記最終的な前記ゲインを算出する
請求項9に記載の音声処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本技術は音声処理装置および方法、並びにプログラムに関し、特に、より高品質な音声を得ることができるようにした音声処理装置および方法、並びにプログラムに関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
従来、複数のスピーカを用いて音像の定位を制御する技術として、VBAP(Vector Base Amplitude Panning)が知られている(例えば、非特許文献1参照)。
【0003】
VBAPでは、3つのスピーカから音を出力することで、それらの3つのスピーカで構成される三角形の内側の任意の一点に音像を定位させることができる。
【0004】
しかしながら、実世界では、音像は一点に定位するのではなく、ある程度の広がりを持った部分空間に定位すると考えられる。例えば、人間の声は声帯から発せられるが、その振動は顔や体などに伝搬し、その結果、人間の体全体という部分空間から音声が発せられると考えられる。
【0005】
このような部分空間に音を定位させる技術、すなわち音像を広げる技術としてMDAP(Multiple Direction Amplitude Panning)が一般に知られている(例えば、非特許文献2参照)。また、このMDAPはMPEG(Moving Picture Experts Group)-H 3D Audio規格のレンダリング処理部でも使われている(例えば、非特許文献3参照)。
【先行技術文献】
【非特許文献】
【0006】
Ville Pulkki, “Virtual Sound Source Positioning Using Vector Base Amplitude Panning”, Journal of AES, vol.45, no.6, pp.456-466, 1997
Ville Pulkki, "Uniform Spreading of Amplitude Panned Virtual Sources", Proc. 1999 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, New Paltz, New York, Oct. 17-20, 1999
ISO/IEC JTC1/SC29/WG11 N14747, August 2014, Sapporo, Japan, "Text of ISO/IEC 23008-3/DIS, 3D Audio"
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上述した技術では、十分に高品質な音声を得ることができなかった。
【0008】
例えばMPEG-H 3D Audio規格では、オーディオオブジェクトのメタデータにspreadと呼ばれる音像の広がり度合いを示す情報が含まれており、このspreadに基づいて音像を広げる処理が行われる。ところが、音像を広げる処理では、オーディオオブジェクトの位置を中心として音像の広がりが上下左右対称であるという制約がある。そのため、オーディオオブジェクトからの音声の指向性(放射方向)を考慮した処理を行うことができず、十分高品質な音声を得ることができなかった。
【0009】
本技術は、このような状況に鑑みてなされたものであり、より高品質な音声を得ることができるようにするものである。
【課題を解決するための手段】
【0010】
本技術の一側面の音声処理装置は、オーディオオブジェクトの位置を示す位置情報と、少なくとも2次元以上のベクトルからなる、前記位置からの音像の広がりを表す音像情報とを含むメタデータを取得する取得部と、前記音像情報により定まる音像の広がりを表す領域に関する水平方向角度および垂直方向角度に基づいて、前記領域内の位置を示すspreadベクトルを算出するベクトル算出部と、前記spreadベクトルに基づいて、前記位置情報により示される前記位置近傍に位置する2以上の音声出力部に供給されるオーディオ信号のそれぞれのゲインを算出するゲイン算出部とを備える。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
防犯AIプラグイン
1か月前
個人
テレビ会議拡張システム
1か月前
日本精機株式会社
投影システム
今日
日本放送協会
無線通信装置
1か月前
キヤノン電子株式会社
画像処理装置
1か月前
ヤマハ株式会社
音響出力装置
9日前
ヤマハ株式会社
音響出力装置
9日前
個人
無線中継赤外線コピーリモコン
1か月前
キヤノン電子株式会社
画像読取装置
25日前
TOA株式会社
音響システム
1か月前
キヤノン株式会社
画像読取装置
22日前
キヤノン株式会社
映像表示装置
11日前
オムロン株式会社
スレーブ装置
11日前
株式会社ニコン
カメラボディ
22日前
株式会社ユピテル
撮像装置等
1か月前
株式会社ニコン
撮像装置
1か月前
理想科学工業株式会社
連絡システム
1か月前
アイホン株式会社
インターホン機器
11日前
17LIVE株式会社
サーバ及び方法
23日前
キヤノン株式会社
冷却装置と電子機器
1か月前
二幸産業株式会社
建物設備の管理装置
17日前
シャープ株式会社
画像読取装置
7日前
キヤノン株式会社
撮像装置
7日前
キヤノン株式会社
撮像装置
15日前
国立大学法人東京科学大学
超音波照射器
11日前
株式会社JVCケンウッド
映像記録装置
1か月前
アイホン株式会社
ナースコールシステム
8日前
キヤノン株式会社
撮像装置
1か月前
ニッタン株式会社
引率支援システム
1か月前
株式会社国際電気
無線通信システム
1か月前
株式会社JVCケンウッド
撮影画像処理装置
1か月前
日産自動車株式会社
スピーカ取付構造
1か月前
株式会社テレビ朝日クリエイト
字幕制作装置
7日前
KDDI株式会社
基地局及び通信端末
1か月前
株式会社豊田自動織機
情報送受信方法
15日前
シャープ株式会社
動画像符号化装置、復号装置
1か月前
続きを見る