TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025016548
公報種別
公開特許公報(A)
公開日
2025-02-04
出願番号
2024186313,2022126230
出願日
2024-10-23,2016-10-07
発明の名称
圧縮された音または音場表現のための層構成の符号化
出願人
ドルビー・インターナショナル・アーベー
代理人
弁理士法人ITOH
主分類
G10L
19/008 20130101AFI20250128BHJP(楽器;音響)
要約
【課題】圧縮された音または音場表現の層構成符号化のための方法およびエンコーダ/デコーダを提供する。
【解決手段】音または音場の圧縮された音表現の層構成のエンコードの方法であって、複数の成分を複数のグループに細分し、各グループを複数の階層的な層のうちの個別のものに割り当てる。グループの数は層の数に対応し、複数の層は、基本層及び階層的な向上層を含む。方法はまた、基本サイド情報を基本層に加え、向上サイド情報から向上サイド情報の複数の部分を判別し、向上サイド情報の複数の部分のそれぞれを、複数の層のそれぞれの層に割り当てる。向上サイド情報の各部分は、該それぞれの層および前記層より低い任意の諸層に含まれるデータから得られる再構成された音表現を改善するパラメータを含む。
【選択図】図1
特許請求の範囲
【請求項1】
層構成のエンコードを使って複数の階層式の層においてエンコードされた音または音場の圧縮された高次アンビソニックス(HOA)音表現をデコードする方法であって、当該方法は:
フレーム・パケットを含むビットストリームを受領する段階と;
前記フレーム・パケットから、基本層および少なくとも一つの向上層を含む前記複数の階層式の層に対応する前記圧縮されたHOA表現を多重分離する段階であって、前記複数の階層式の層の少なくとも一つは、前記音または音場の基本的な圧縮された音表現の成分を含み、それらの成分は、複数のモノラル信号に対応する、段階と;
もとのHOA表現のどの係数シーケンスも前記基本層の基本的な圧縮された音表現に含まれないことを判別し、この判別に基づいて、それぞれのベクトル・ベースの信号についての従属基本サイド情報がベクトル成分すべてからなり、その最大サイズをもつことを判別する段階と;
前記従属基本サイド情報と、前記基本層に関連付けられている基本サイド情報と、前記向上層に関連付けられている向上サイド情報とに基づいて、前記圧縮されたHOA表現をデコードする段階とを含み、
前記基本サイド情報は、少なくとも一つの個々のモノラル信号がある入射方向をもつ方向性信号を表わすことを示し、前記向上サイド情報は、前記音または音場の欠けている部分の予測を許容する情報を含む、
方法。
続きを表示(約 700 文字)
【請求項2】
プロセッサによって実行されたときに請求項1記載の方法を実行する命令を含む非一時的なコンピュータ可読記憶媒体。
【請求項3】
層構成のエンコードを使って複数の階層式の層においてエンコードされた音または音場の圧縮された高次アンビソニックス(HOA)音表現をデコードするための装置であって、当該装置は:
フレーム・パケットを受領する受領器と;
前記フレーム・パケットから、基本層および少なくとも一つの向上層を含む前記複数の階層式の層に対応する前記圧縮されたHOA表現を含むビットストリームを多重分離するデマルチプレクサであって、前記複数の階層式の層は、前記音または音場の基本的な圧縮された音表現の成分を含み、それらの成分は、複数のモノラル信号に対応する、デマルチプレクサと;
もとのHOA表現のどの係数シーケンスも前記基本層の基本的な圧縮された音表現に含まれないことを判別し、この判別に基づいて、それぞれのベクトル・ベースの信号についての従属基本サイド情報がベクトル成分すべてからなり、その最大サイズをもつことを判別するプロセッサと;
前記従属基本サイド情報と、前記基本層に関連付けられている基本サイド情報と、前記向上層に関連付けられている向上サイド情報とに基づいて、前記圧縮されたHOA表現をデコードするデコーダとを有し、
前記基本サイド情報は、少なくとも一つの個々のモノラル信号がある入射方向をもつ方向性信号を表わすことを示し、前記向上サイド情報は、前記音または音場の欠けている部分の予測を許容する情報を含む、
装置。
発明の詳細な説明
【技術分野】
【0001】
関連出願への相互参照
本願は2015年10月15日に出願された欧州特許出願第15306589.1号および2015年10月15日に出願された同第15306653.5号ならびに米国特許出願第62/361,461号および第62/361,416号の優先権を主張するものである。これらの出願の内容はここに参照によってその全体において組み込まれる。
続きを表示(約 3,200 文字)
【0002】
技術分野
本稿は層構成のオーディオ符号化(layered audio coding)のための方法および装置に関する。特に、本稿は圧縮された音(または音場)表現、たとえば高次アンビソニックス(HOA: Higher-Order Ambisonics)音(または音場)表現の層構成にされたオーディオ符号化のための方法および装置に関する。
【背景技術】
【0003】
時間変動する条件をもつ伝送チャネルを通じた音(または音場)表現のストリーミングについて、層構成の符号化は、受領される音表現の品質を伝送条件に適合させ、特に望まれない信号脱落を回避する手段である。
【0004】
層構成の符号化のためには、音(または音場)表現は通例、比較的小さなサイズの高優先度の基本層と、デクリメントする優先度および任意のサイズをもつ追加的な向上層とに細分される。各向上層は典型的には、音(または音場)表現の品質を改善するために、より低位のすべての層の情報を補完するためのインクリメンタルな情報を含むと想定される。個々の層の伝送のための誤り保護の量が、それらの優先度に基づいて制御される。特に、基本層は、高い誤り保護を提供され、これはその小さなサイズのため、合理的であり、受け入れ可能である。
【0005】
しかしながら、たとえば圧縮されたHOA音または音場表現のような、音または音場の特別な型の圧縮された表現(の拡張されたバージョン)のための層構成符号化方式が必要とされている。
【先行技術文献】
【非特許文献】
【0006】
ISO/IEC JTC1/SC29/WG11 23008-3:2015(E)、Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio, February 2015
ISO/IEC JTC1/SC29/WG11 23008-3:2015/PDAM3、Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio, AMENDMENT 3: MPEG-H 3D Audio Phase 2, July 2015
【発明の概要】
【発明が解決しようとする課題】
【0007】
本稿は上記の問題に取り組むものである。特に、圧縮された音または音場表現の層構成符号化のための方法およびエンコーダ/デコーダが記述される。
【課題を解決するための手段】
【0008】
ある側面によれば、音または音場の圧縮された音表現の層構成のエンコードの方法が記述される。圧縮された音表現は、複数の成分を含む基本的な圧縮された音表現を含んでいてもよい。前記複数の成分は、相補的な(complementary)成分であってもよい。圧縮された音表現はさらに、前記基本的な圧縮された音表現をデコードして前記音または音場の基本的な再構成された音表現にするための基本サイド情報を含んでいてもよい。圧縮された音表現はさらに、前記基本的な再構成された音表現を改善する(たとえば向上させる)ためのパラメータを含む向上サイド情報を含んでいてもよい。本方法は、前記複数の成分を複数の成分グループに細分する(たとえばグループ分けする)ことを含んでいてもよい。本方法はさらに、前記複数のグループの各グループを、複数の階層的な層のうちの個別のものに割り当てる(たとえば加える)ことを含んでいてもよい。割り当ては、個別のグループと層との間の対応を示してもよい。それぞれの層に割り当てられた成分は、その層に含まれると言われてもよい。グループの数は層の数に対応してもよい(たとえば等しくてもよい)。前記複数の層は、基本層および一つまたは複数の階層的な向上層を含んでいてもよい。前記複数の階層的な層は、基本層から、第一の向上層、第二の向上層などを経て、全体的な最高の向上層(全体的な最上位の層)まで、順序付けられてもよい。本方法はさらに、基本サイド情報を基本層に加えること(たとえば、たとえば伝送または記憶の目的のために、基本サイド情報を基本層に含めること、あるいは基本サイド情報を基本層に割り当てること)を含んでいてもよい。本方法はさらに、向上サイド情報から、向上サイド情報の複数の部分を判別することを含んでいてもよい。本方法はさらに、向上サイド情報の前記複数の部分のそれぞれを、前記複数の層のそれぞれの層に割り当てる(たとえば加える)ことを含んでいてもよい。向上サイド情報の各部分は、該それぞれの層および該それぞれの層より低い任意の諸層に含まれる(たとえば割り当てられているまたは加えられている)データから得られる再構成された(たとえば圧縮解除された)音表現を改善するためのパラメータを含んでいてもよい。層構成のエンコードは、伝送チャネルを通じた伝送のためまたはたとえばCD、DVDまたはブルーレイディスク(商標)のような好適な記憶媒体に記憶するために実行されてもよい。
【0009】
上記のように構成されて、提案される方法は、層構成の符号化を、複数の成分ならびに上記のような性質をもつ基本サイド情報および向上サイド情報(たとえば独立基本サイド情報および向上サイド情報)を含む圧縮された音表現に効率的に適用することを可能にする。特に、提案される方法は、各層が、問題になっている層までの任意の層に含まれる成分から、再構成された音表現を再構成するための好適なサイド情報を含む。ここで、問題の層までの層とは、たとえば問題の層に至るまでの基本層、第一の向上層、第二の向上層などを含むものと理解される。こうして、実際の最高の使用可能な層(たとえば、まだ有効に受領されていない最低の層の下の層;使用可能な最高の層より下のすべての層および使用可能な最高の層自身は有効に受領されている)に関わりなく、再構成された音表現が完全な(たとえばフルの)音表現とは異なっていたとしても、デコーダは、再構成された音表現を改善するまたは向上させることを可能にされる。特に、実際の使用可能な最高の層に関わりなく、実際の最高の使用可能な層までの諸層に含まれるすべての成分に基づいて得ることのできる再構成された音表現を改善するまたは向上させるために、デコーダにとって、単一の層のみについて(すなわち、使用可能な最高の層について)向上サイド情報のペイロードをデコードすることが十分である。すなわち、各時間区間(たとえばフレーム)について、デコードされる必要があるのは、向上サイド情報の単一のペイロードだけであってもよい。他方、提案される方法は、層構成の符号化を適用するときに達成されうる所要帯域幅の低減の利点をフルに受けることを許容する。
【0010】
諸実施形態において、基本的な圧縮された音表現の前記成分はモノラル信号(たとえばトランスポート信号またはモノラル・トランスポート信号)に対応していてもよい。該モノラル信号は、優勢音(predominant sound)信号またはHOA表現の係数シーケンスのいずれかを表わしていてもよい。モノラル信号は量子化されていてもよい。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
ハリセン
21日前
個人
管部材の製造方法
21日前
ヤマハ株式会社
ヘルムホルツ共鳴器
14日前
ブラザー工業株式会社
カラオケ装置
18日前
ヤマハ株式会社
電子楽器
18日前
ブラザー工業株式会社
カラオケ装置
18日前
セイコーエプソン株式会社
吸音ボード
8日前
日産自動車株式会社
防音構造体
8日前
ヤマハ株式会社
シンバルワッシャ
21日前
オンキヨー株式会社
音声認識システム、及び、音声認識方法
21日前
株式会社イノアックコーポレーション
遮音カバー
21日前
株式会社第一興商
カラオケ装置
14日前
株式会社第一興商
カラオケ装置
21日前
株式会社エクシング
カラオケシステム、及び、カラオケ装置
21日前
コスモネクスト株式会社
入力支援プログラム及び入力支援方法
1日前
京セラ株式会社
音出力装置及び音出力方法
8日前
本田技研工業株式会社
能動型騒音低減装置
8日前
トヨタ自動車株式会社
制御装置及び制御方法
18日前
日本放送協会
音声認識装置およびプログラム
8日前
本田技研工業株式会社
能動型騒音低減装置
14日前
株式会社アナザーウェア
鍵盤画面表示プログラム及びそのシステム
14日前
ヤマハ株式会社
検出システムおよび楽器
21日前
トヨタ自動車株式会社
異音診断システム
14日前
株式会社コルグ
音波生成装置、音波生成方法、プログラム
1日前
ローランド株式会社
打楽器および張力の付与方法
21日前
株式会社SOKEN
遮音部
18日前
ソフトバンクグループ株式会社
行動制御システム
1日前
ローランド株式会社
打楽器およびロッドの締付方法
21日前
株式会社イノアックコーポレーション
ダクト
18日前
ブラザー工業株式会社
映像再生装置、映像再生プログラム、及び映像再生方法
21日前
ブラザー工業株式会社
情報処理装置、情報処理プログラム、及び情報処理方法
21日前
ローランド株式会社
電子打楽器およびリムセンサの支持方法
21日前
ローランド株式会社
打楽器およびボトムフレームの補強方法
21日前
ブラザー工業株式会社
情報処理装置、情報処理プログラム、及び情報処理方法
21日前
ローランド株式会社
電子打楽器およびヘッドセンサの支持方法
21日前
ローランド株式会社
電子楽器および位置検出回路の温度補償方法
21日前
続きを見る
他の特許を見る