TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025108471
公報種別公開特許公報(A)
公開日2025-07-23
出願番号2025060899,2023151430
出願日2025-04-02,2013-12-04
発明の名称音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置
出願人ドルビー・インターナショナル・アーベー
代理人弁理士法人ITOH
主分類G10L 19/008 20130101AFI20250715BHJP(楽器;音響)
要約【課題】音場のための高次アンビソニックス(HOA)表現を圧縮及び圧縮解除する方法および装置を提供する。
【解決手段】方法は、圧縮解除された支配的な方向性信号および空間領域内の残差のHOA成分を表現する圧縮解除された時間領域信号を供給するように、圧縮された支配的な方向性信号及び圧縮された残差の成分信号を知覚復号し、圧縮解除された時間領域信号を再相関させて、対応する低次化された残差のHOA成分を取得し、圧縮解除された残差のHOA成分を、対応する低次化された残差のHOA成分に基づいて決定し、予測された方向性信号を決定し、圧縮解除された支配的な方向性信号と、予測された方向性信号と、圧縮解除された残差のHOA成分とに基づいて、HOA音場表現を決定する。
【選択図】図2a
特許請求の範囲【請求項1】
圧縮された高次アンビソニックス(HOA)表現を圧縮解除する方法であって、当該方法は:
圧縮解除された支配的な方向性信号および空間領域内の残差のHOA成分を表現する圧縮解除された時間領域信号を決定するように、前記圧縮されたHOA表現を知覚復号するステップであって、前記圧縮解除された時間領域信号は低次化された残差HOA成分に対応する、ステップと、
前記圧縮解除された支配的な方向性信号に基づいて、予測された方向性信号を決定するステップであって、前記予測された方向性信号は、窓関数を使用する平滑化に基づいて決定される、ステップと、
圧縮解除された残差のHOA成分を、前記圧縮解除された時間領域信号に基づいて決定するステップであって、前記圧縮解除されたHOA成分は、前記低次化された残差HOA成分の次数を拡張することに基づき、前記拡張することは、前記低次化された残差HOA成分に零値を付加することを含む、ステップと、
前記予測された方向性信号と、前記圧縮解除された残差のHOA成分とに基づいて、HOA音場表現を決定するステップと、
前記HOA音場表現をスピーカ・フィードへのレンダリングのために出力するステップと
を含む、
方法。
続きを表示(約 660 文字)【請求項2】
実行されると請求項1に記載の方法のステップを実行する命令を含んでいる非一時的なコンピュータ可読媒体。
【請求項3】
高次アンビソニックス(HOA)表現を圧縮解除する装置であって、当該装置は:
圧縮解除された支配的な方向性信号および空間領域内の残差のHOA成分を表現する圧縮解除された時間領域信号を決定するように、前記圧縮されたHOA表現を知覚復号するデコーダであって、前記圧縮解除された時間領域信号は低次化された残差HOA成分に対応する、デコーダと、
前記圧縮解除された支配的な方向性信号に基づいて、予測された方向性信号を決定する第1のプロセッサであって、前記第1のプロセッサは、前記予測された方向性信号を、窓関数を使用する平滑化に基づいて決定するように構成されている、第1のプロセッサと、
圧縮解除された残差のHOA成分を、前記圧縮解除された時間領域信号に基づいて決定する第2のプロセッサであって、前記圧縮解除されたHOA成分は、前記低次化された残差HOA成分の次数を拡張することに基づき、前記拡張することは、前記低次化された残差HOA成分に零値を付加することを含む、第2のプロセッサと、
前記予測された方向性信号と、前記圧縮解除された残差のHOA成分とに基づいて、HOA音場表現を決定する第3のプロセッサと、
前記HOA音場表現をスピーカ・フィードへのレンダリングのために出力するさらなるプロセッサと
を有する、
装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、音場のための高次アンビソニックス表現を圧縮および圧縮解除する方法および装置に関する。
続きを表示(約 2,900 文字)【背景技術】
【0002】
HOAと称する高次アンビソニックス表現は、三次元音声を表現する1つの方法である。他の技術は波面合成法(WFS)や22.2のようなチャンネルに基づく方法である。チャンネルに基づく方法と比較して、HOA表現には、特定のラウドスピーカの設定とは独立しているという利点がある。しかしながら、この柔軟性を得るためには特定のラウドスピーカの設定でHOA表現を再生するための復号処理が必要となる。通常、必要なラウドスピーカの数が大変多くなるWFSのアプローチと比較して、HOAは極めて少ない数のラウドスピーカのみで構成される設定にすることできる。HOAのさらなる利点は、ヘッドフォンへのバイノーラル・レンダリングにも変更を必要とすることなく同じ表現を利用することができる点にある。
【0003】
HOAは、切断球面調和関数(SH)展開による複素調和平面波振幅の空間密度の表現に基づいている。各展開係数は角周波数の関数であり、これを時間領域関数によって同等に表現することができる。したがって、一般性を失うことなく、完全なHOA音場表現は、実際には、“Ο”時間領域関数から構成されるものと考えることができる。ここで、Οは、展開係数の数を表している。これらの時間領域関数と同等の意味を有するものとして、以下のHOA係数列を参照する。
【0004】
HOA表現の空間解像度は、展開の最大次数Nの増加とともに向上する。残念ながら、展開係数の数“Ο”は、次数Nに対して二乗的に増加し、特にΟ=(N+1)
2
となる。例えば、次数N=4を使用した一般的なHOA表現には、Ο=25の個数のHOA(展開)係数が必要となる。上記の点を考慮して、HOA表現の伝送のための合計ビットレートは、所望の単一チャンネルのサンプリング・レートf

およびサンプル毎のビットの数N

が与えられると、Ο・f

・N

によって求めることができる。サンプル毎にN

=16の個数のビットを使用してf

=48kHzのサンプリング・レートでの次数N=4のHOA表現を伝送すると、結果として、ビットレートは、19.2メガビット/秒となるが、これは、多くの実用的なアプリケーション、例えば、ストリーミングでは極めて高いビットレートである。したがって、HOA表現を圧縮することが大いに望まれている。
【発明の概要】
【0005】
1次よりも高いHOA表現の圧縮を取り扱う既存の方法は殆ど存在しない。E.Hellerud、I.Burnett、A.Solvang、およびU.P.Svenssonによって探究されている最も直接的なアプローチ「Encoding Higher Order Ambisonics with AAC(AACを用いた高次アンビソニックスの符号化)」第124回AESコンベンション、アムステルダム、2008年は、知覚符号化アルゴリズムである、AAC(Advanced Audio Coding)を用いて個々のHOA係数列の直接的な符号化を行うものである。しかしながら、この手法に伴う固有の問題は、全く聴かれることのない信号の知覚符号化である。再構築された再生信号は、通常、HOA係数列の加重和によって得られ、特定のラウドスピーカの設定で圧縮解除されたHOA表現がレンダリングされる場合には、知覚符号化ノイズをマスク除去する可能性が高い。知覚符号化ノイズのマスク除去の抱える主要な問題は、個々のHOA係数列間の高い相互相関である。個々のHOA係数列における符号化ノイズ信号は、互いに相関していないため、知覚符号化ノイズの構造的な重畳が発生することがあり、それと同時に、その重畳でノイズのないHOA係数列がキャンセルされてしまう。別の問題は、これらの相互相関が知覚符号化器の効率の低下につながる点である。
【0006】
双方の影響の程度を最小限にするために、欧州特許出願第2469742号(EP2469742A2)では、HOA表現を知覚符号化の前に離散空間領域において、等価な表現に変換することが提案されている。形式的には、離散空間領域は、何らかの離散方向でサンプリングされる、複素調和平面波振幅の空間密度と等価な時間領域である。したがって、離散空間領域は、“Ο”個の従来の時間領域信号によって表現される。この信号は、サンプリング方向から到来する一般的な平面波として解釈することができ、空間領域変換に対して想定されるものと厳密に同じ方向にラウドスピーカが位置しているのであれば、ラウドスピーカ信号に対応するであろう。
【0007】
離散空間領域への変換により、個々の空間領域信号間の相互相関が低減するが、これらの相互相関は、完全には除去されない。比較的に高い相互相関の例は、空間領域信号によって包含される複数の隣接した方向の間を方向とする方向性信号である。
【0008】
双方のアプローチの主な欠点は、知覚符号化される信号の数が(N+1)

であり、圧縮されたHOA表現のデータ・レートがアンビソニックスの次数Nの二乗で増加することである。
【0009】
知覚符号化される信号の数を減少させるために、欧州特許出願公開第2665208号は、HOA表現を所与の最大数の支配的な方向性信号と残差のアンビエント成分とに分解することを提案している。知覚符号化されるべき信号の数の減少は、残差のアンビエント成分の次数を減少させることによって成し遂げることができる。この手法の背景にある理論的根拠は、支配的な方向性信号に関して高い空間解像度を維持する一方で、より低い次数のHOA表現によって十分な精度で残差を表現することにある。
【0010】
このアプローチは、音場に関する仮定が満たされる限り、すなわち、音場が少ない数の支配的な方向性信号(これは、完全な次数Nで符号化された一般的な平面波関数を表現するものである。)と、方向性を有しない残差のアンビエント成分とからなるという仮定が満たされる限り、大変良好に機能する。しかしながら、分解の後、残差のアンビエント成分が依然として幾らかの支配的な方向性成分を含んでいる場合には、低次元化によって、分解の後のレンダリングの際に顕著に知覚される誤りが生じる。その仮定が満たされない場合のHOA表現の一般的な例は、Nよりも低い次数で符号化される一般的な平面波である。このようなNよりも低い次数の一般的な平面波は、音源の範囲が広がりを有するよう感じられるようにする芸術的な創作の結果として生ずることがあり、球形マイクロフォンによるHOA音場表現の収録に伴って生ずることもある。双方の例において、音場は、多数の相関性の高い空間領域信号によって表現される(説明については、高次アンビソニックスの空間解像度の項目を参照されたい。)。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

三井化学株式会社
吸音構造体
1か月前
個人
弦楽器用押弦補助具及び弦楽器
1か月前
三井化学株式会社
遮音構造体
1か月前
三井化学株式会社
遮音構造体
1か月前
富士フイルム株式会社
消音器
11日前
三井化学株式会社
遮音構造体
1か月前
林テレンプ株式会社
防音カバー
1か月前
積水化学工業株式会社
吸音構造体
7日前
株式会社ドクター中松創研
歌及び歌の制作方法
1か月前
ヤマハ株式会社
弦楽器用の支持装置
11日前
富士フイルム株式会社
消音器付き風路
11日前
ヤマハ株式会社
リード
5日前
株式会社総合車両製作所
吸音パネル
1か月前
株式会社JVCケンウッド
車載装置
1か月前
個人
電気自動車等の「接近音」における最適な「音の種類」
1か月前
株式会社HOWA
遮音構造
1か月前
株式会社レゾナック
吸音材及び車両部材
27日前
カシオ計算機株式会社
楽器
1か月前
個人
電子管楽器
1か月前
株式会社第一興商
カラオケ装置
20日前
株式会社第一興商
カラオケ装置
1か月前
株式会社第一興商
カラオケ装置
1か月前
株式会社JVCケンウッド
情報処理装置及び情報処理方法
1か月前
ヤマハ株式会社
連打判定装置および方法、プログラム
21日前
有限会社舞システム企画
介護情報生成システム
11日前
ヤマハ株式会社
鍵盤装置
12日前
株式会社エクシング
端末装置、及び、端末装置用プログラム
5日前
株式会社コルグ
電子楽器用アナログエフェクタ
1か月前
シャープ株式会社
制御装置、電気機器、およびシステム
14日前
ヤマハ株式会社
発音制御装置
1か月前
川上産業株式会社
吸音シート
1か月前
トヨタ自動車株式会社
制御装置
15日前
トヨタ自動車株式会社
電気自動車
1か月前
AOBAENERGY株式会社
サービス提供機器
1か月前
株式会社麗光
防音積層体とその製造に用いる遮音膜、および遮音膜シート
4日前
トヨタ自動車株式会社
音響式遮音材の製造方法
1か月前
続きを見る