TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025128202
公報種別公開特許公報(A)
公開日2025-09-02
出願番号2025089515,2023144104
出願日2025-05-29,2016-10-07
発明の名称圧縮された音または音場表現のための層構成の符号化
出願人ドルビー・インターナショナル・アーベー
代理人弁理士法人ITOH
主分類G10L 19/008 20130101AFI20250826BHJP(楽器;音響)
要約【課題】圧縮された音または音場表現の層構成符号化のための方法およびエンコーダ/デコーダを提供する。
【解決手段】音または音場の圧縮された音表現の層構成のエンコードの方法であって、複数の成分を複数のグループに細分し、各グループを複数の階層的な層のうちの個別のものに割り当てる。グループの数は層の数に対応し、複数の層は、基本層及び階層的な向上層を含む。方法はまた、基本サイド情報を基本層に加え、向上サイド情報から向上サイド情報の複数の部分を判別し、向上サイド情報の複数の部分のそれぞれを、複数の層のそれぞれの層に割り当てる。向上サイド情報の各部分は、該それぞれの層および前記層より低い任意の諸層に含まれるデータから得られる再構成された音表現を改善するパラメータを含む。
【選択図】図1
特許請求の範囲【請求項1】
音または音場の圧縮された高次アンビソニックス(HOA)表現をデコードする方法であって、当該方法は:
ビットストリームを受領する段階と;
前記ビットストリームから前記圧縮されたHOA表現を抽出する段階であって、前記ビットストリームは基本層および二つ以上の階層式の向上層を含む複数の階層式の層を含み、前記ビットストリームはさらに、基本層に関連付けられている基本サイド情報および前記二つ以上の階層式の向上層に関連付けられている向上サイド情報を含み、前記二つ以上の階層式の向上層は最高の使用可能な階層式の向上層を含む、段階と;
前記ビットストリームから、ある入射方向をもつ方向性信号を表す第一の個別のモノラル信号を示す独立サイド情報を抽出する段階と;
前記独立サイド情報に基づき、かつ、前記基本層に関連付けられている前記基本サイド情報に基づき、かつ前記最高の使用可能な階層式の向上層に関連付けられている前記向上サイド情報の部分に基づき、かつ前記二つ以上の階層式の向上層の他のいかなる層に関連付けられている前記向上サイド情報の第二の部分にも基づかずに、前記圧縮されたHOA表現をデコードする段階とを含む、
方法。
続きを表示(約 600 文字)【請求項2】
プロセッサで実行されると該プロセッサに請求項1に記載の方法を実行させるコンピュータ実行可能コードを担持している非一時的な担体媒体。
【請求項3】
音または音場の圧縮された高次アンビソニックス(HOA)音表現をデコードするための装置であって、当該装置は:
前記圧縮されたHOA表現を含むビットストリームを受領する受領器を含み、前記ビットストリームは、基本層および二つ以上の階層式の向上層を含む複数の階層式の層を含み、前記ビットストリームはさらに、基本層に関連付けられている基本サイド情報および前記二つ以上の階層式の向上層に関連付けられている向上サイド情報を含み、
前記二つ以上の階層式の向上層は最高の使用可能な階層式の向上層を含む、受領器と;
前記ビットストリームから、ある入射方向をもつ方向性信号を表す第一の個別のモノラル信号を示す独立サイド情報を決定するプロセッサと;
独立サイド情報と、前記基本層に関連付けられている前記基本サイド情報とに基づき、かつ前記最高の使用可能な階層式の向上層に関連付けられている前記向上サイド情報の部分に基づき、かつ前記二つ以上の階層式の向上層の他のいかなる層に関連付けられている前記向上サイド情報の第二の部分にも基づかずに、前記圧縮されたHOA表現をデコードするデコーダとを有する、
装置。

発明の詳細な説明【技術分野】
【0001】
関連出願への相互参照
本願は2015年10月15日に出願された欧州特許出願第15306590.9号および米国特許出願第62/361,809号の優先権を主張するものである。これらの出願の内容はここに参照によってその全体において組み込まれる。
続きを表示(約 3,200 文字)【0002】
技術分野
本稿は層構成のオーディオ符号化(layered audio coding)のための方法および装置に関する。特に、本稿は圧縮された音(または音場)表現、たとえば高次アンビソニックス(HOA: Higher-Order Ambisonics)音(または音場)表現の層構成にされたオーディオ符号化のための方法および装置に関する。
【背景技術】
【0003】
時間変動する条件をもつ伝送チャネルを通じた音(または音場)表現のストリーミングについて、層構成の符号化は、受領される音表現の品質を伝送条件に適合させ、特に望まれない信号脱落を回避する手段である。
【0004】
層構成の符号化のためには、音(または音場)表現は通例、比較的小さなサイズの高優先度の基本層と、デクリメントする優先度および任意のサイズをもつ追加的な向上層とに細分される。各向上層は典型的には、音(または音場)表現の品質を改善するために、より低位のすべての層の情報を補完するためのインクリメンタルな情報を含むと想定される。個々の層の伝送のための誤り保護の量が、それらの優先度に基づいて制御される。特に、基本層は、高い誤り保護を提供され、これはその小さなサイズのため、合理的であり、受け入れ可能である。
【0005】
しかしながら、たとえば圧縮されたHOA音または音場表現のような、音または音場の特別な型の圧縮された表現(の拡張されたバージョン)のための層構成符号化方式が必要とされている。
【先行技術文献】
【非特許文献】
【0006】
ISO/IEC JTC1/SC29/WG11 23008-3:2015(E)、Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio, February 2015
ISO/IEC JTC1/SC29/WG11 23008-3:2015/PDAM3、Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio, AMENDMENT 3: MPEG-H 3D Audio Phase 2, July 2015
【発明の概要】
【発明が解決しようとする課題】
【0007】
本稿は上記の問題に取り組むものである。特に、圧縮された音または音場表現の層構成符号化のための方法およびエンコーダ/デコーダが記述される。
【課題を解決するための手段】
【0008】
ある側面によれば、音または音場の圧縮された音表現の層構成のエンコードの方法が記述される。圧縮された音表現は、複数の成分を含む基本的な圧縮された音表現を含んでいてもよい。前記複数の成分は、相補的な(complementary)成分であってもよい。圧縮された音表現はさらに、前記基本的な圧縮された音表現をデコードして前記音または音場の基本的な再構成された音表現にするための基本サイド情報を含んでいてもよい。圧縮された音表現はさらに、前記基本的な再構成された音表現を改善する(たとえば向上させる)ためのパラメータを含む向上サイド情報を含んでいてもよい。本方法は、前記複数の成分を複数の成分グループに細分する(たとえばグループ分けする)ことを含んでいてもよい。本方法はさらに、前記複数のグループの各グループを、複数の階層的な層のうちの個別のものに割り当てる(たとえば加える)ことを含んでいてもよい。割り当ては、個別のグループと層との間の対応を示してもよい。それぞれの層に割り当てられた成分は、その層に含まれると言われてもよい。グループの数は層の数に対応してもよい(たとえば等しくてもよい)。前記複数の層は、基本層および一つまたは複数の階層的な向上層を含んでいてもよい。前記複数の階層的な層は、基本層から、第一の向上層、第二の向上層などを経て、全体的な最高の向上層(全体的な最上位の層)まで、順序付けられてもよい。本方法はさらに、基本サイド情報を基本層に加えること(たとえば、たとえば伝送または記憶の目的のために、基本サイド情報を基本層に含めること、あるいは基本サイド情報を基本層に割り当てること)を含んでいてもよい。本方法はさらに、向上サイド情報から、向上サイド情報の複数の部分を判別することを含んでいてもよい。本方法はさらに、向上サイド情報の前記複数の部分のそれぞれを、前記複数の層のそれぞれの層に割り当てる(たとえば加える)ことを含んでいてもよい。向上サイド情報の各部分は、該それぞれの層および該それぞれの層より低い任意の諸層に含まれる(たとえば割り当てられているまたは加えられている)データから得られる再構成された(たとえば圧縮解除された)音表現を改善するためのパラメータを含んでいてもよい。層構成のエンコードは、伝送チャネルを通じた伝送のためまたはたとえばCD、DVDまたはブルーレイディスク(商標)のような好適な記憶媒体に記憶するために実行されてもよい。
【0009】
上記のように構成されて、提案される方法は、層構成の符号化を、複数の成分ならびに上記のような性質をもつ第一のサイド情報および向上サイド情報(たとえば独立基本サイド情報および向上サイド情報)を含む圧縮された音表現に効率的に適用することを可能にする。特に、提案される方法は、各層が、問題になっている層までの任意の層に含まれる成分から、再構成された音表現を再構成するための好適なサイド情報を含む。ここで、問題の層までの層とは、たとえば問題の層に至るまでの基本層、第一の向上層、第二の向上層などを含むものと理解される。こうして、実際の最高の使用可能な層(たとえば、まだ有効に受領されていない最低の層の下の層;使用可能な最高の層より下のすべての層および使用可能な最高の層自身は有効に受領されている)に関わりなく、再構成された音表現が完全な(たとえばフルの)音表現とは異なっていたとしても、デコーダは、再構成された音表現を改善するまたは向上させることを可能にされる。特に、実際の使用可能な最高の層に関わりなく、実際の最高の使用可能な層までの諸層に含まれるすべての成分に基づいて得ることのできる再構成された音表現を改善するまたは向上させるために、デコーダにとって、単一の層のみについて(すなわち、使用可能な最高の層について)向上サイド情報のペイロードをデコードすることが十分である。すなわち、各時間区間(たとえばフレーム)について、デコードされる必要があるのは、向上サイド情報の単一のペイロードだけであってもよい。他方、提案される方法は、層構成の符号化を適用するときに達成されうる所要帯域幅の低減の利点をフルに受けることを許容する。
【0010】
諸実施形態において、基本的な圧縮された音表現の前記成分はモノラル信号(たとえばトランスポート信号またはモノラル・トランスポート信号)に対応していてもよい。該モノラル信号は、優勢音(predominant sound)信号またはHOA表現の係数シーケンスのいずれかを表わしていてもよい。モノラル信号は量子化されていてもよい。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

個人
破裂爆発波動体感バルーン
6日前
富士フイルム株式会社
消音器
1か月前
三井化学株式会社
吸音構造体
1か月前
三井化学株式会社
遮音構造体
2か月前
個人
弦楽器用押弦補助具及び弦楽器
2か月前
三井化学株式会社
遮音構造体
2か月前
林テレンプ株式会社
防音カバー
2か月前
株式会社白鳩
音漏れ抑制マスク
今日
株式会社白鳩
音漏れ抑制マスク
今日
積水化学工業株式会社
吸音構造体
29日前
株式会社イシダ
商品処理装置
20日前
ヤマハ株式会社
弦楽器用の支持装置
1か月前
富士フイルム株式会社
消音器付き風路
1か月前
株式会社総合車両製作所
吸音パネル
1か月前
株式会社JVCケンウッド
車載装置
2か月前
ヤマハ株式会社
リード
27日前
川崎重工業株式会社
表面材
2日前
日本音響エンジニアリング株式会社
騒音低減装置
5日前
株式会社フジタ
環境音快音化システム
5日前
NOK株式会社
吸音構造体
19日前
株式会社レゾナック
吸音材及び車両部材
1か月前
個人
歌唱技術表示装置および歌唱技術表示方法
8日前
株式会社第一興商
カラオケ装置
1か月前
株式会社第一興商
カラオケ装置
21日前
株式会社JVCケンウッド
情報処理装置及び情報処理方法
1か月前
株式会社第一興商
カラオケ装置
1か月前
株式会社第一興商
カラオケ装置
1か月前
個人
電子管楽器
2か月前
株式会社第一興商
カラオケ装置
2日前
有限会社舞システム企画
介護情報生成システム
1か月前
株式会社エクシング
端末装置、及び、端末装置用プログラム
27日前
トヨタ自動車株式会社
防音カバー
21日前
ヤマハ株式会社
鍵盤装置
1か月前
ヤマハ株式会社
連打判定装置および方法、プログラム
1か月前
株式会社コルグ
電子楽器用アナログエフェクタ
1か月前
シャープ株式会社
電子機器および電子機器の制御方法
22日前
続きを見る