TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025100674
公報種別公開特許公報(A)
公開日2025-07-03
出願番号2025064679,2024194253
出願日2025-04-10,2014-05-23
発明の名称オーディオ・エンコーダおよびデコーダ
出願人ドルビー・インターナショナル・アーベー
代理人弁理士法人ITOH
主分類G10L 19/02 20130101AFI20250626BHJP(楽器;音響)
要約【課題】本開示は、オーディオ符号化システムにおいてパラメータのベクトルをエンコードおよびデコードするための方法、装置およびコンピュータ・プログラム・プロダクトを提供する。本開示はさらに、オーディオ・デコード・システムにおいてオーディオ・オブジェクトを再構成するための方法および装置に関する。
【解決手段】本開示によれば、非周期的な量のベクトルの符号化およびエンコードのためのモジュロ差分アプローチが、符号化効率を改善するとともにエンコーダおよびデコーダに低減されたメモリ要求を提供しうる。さらに、疎な行列をエンコードおよびデコードするための効率的な方法が提供される。
【選択図】図7
特許請求の範囲【請求項1】
オーディオ・エンコード・システムにおいてパラメータのベクトルをエンコードする方法であって、各パラメータは非周期的な量に対応し、前記ベクトルは、第一の要素および少なくとも一つの第二の要素をもち、当該方法は:
N通りの値を取り得るインデックス値によって前記ベクトル中の各パラメータを表現する段階と;
前記少なくとも一つの第二の要素のそれぞれをシンボルに関連付ける段階であって、前記シンボルは:
前記第二の要素のインデックス値と前記ベクトル中でその先行する要素のインデックス値との間の差を計算し;
該差にモジュロNを適用することによって計算される、段階と;
前記少なくとも一つの第二の要素に関連付けられた前記シンボルを、シンボルの確率を含む確率テーブルに基づいてエントロピー符号化することによって、前記少なくとも一つの第二の要素のそれぞれをエンコードする段階であって、前記パラメータのベクトルの前記第一の要素および前記少なくとも一つの第二の要素は、特定の時間フレームにおいて前記オーディオ・エンコード・システムにおいて使用される異なる周波数帯域に対応する、段階と;
前記ベクトル中の前記第一の要素をシンボルと関連付ける段階であって、前記シンボルは:
前記ベクトル中の前記第一の要素を表わすインデックス値を、該インデックス値からあるオフセット値を引くことによってシフトし;
シフトされたインデックス値にモジュロNを適用することによって計算される、段階と;
シンボルの確率を含む確率テーブルに基づく前記第一の要素に関連付けられたシンボルのエントロピー符号化によって、前記第一の要素をエンコードする段階とを含む、
方法。
続きを表示(約 630 文字)【請求項2】
前記オフセット値は、前記第一の要素についての最も確からしいインデックス値と前記確率テーブルにおける前記少なくとも一つの第二の要素についての最も確からしいシンボルとの間の差に等しい、請求項1記載の方法。
【請求項3】
前記確率テーブルはハフマン・コードブックに変換され、前記ベクトル中のある要素に関連付けられたシンボルは、コードブック・インデックスとして使われ、前記エンコードする段階は、前記少なくとも一つの第二の要素のそれぞれをエンコードすることを、該第二の要素を、該第二の要素に関連付けられたコードブック・インデックスによってインデックスされるコードブック中の符号語で表わすことによって行なうことを含む、請求項1または2記載の方法。
【請求項4】
前記エンコードする段階は、前記第一の要素を、前記第一の要素に関連付けられたコードブック・インデックスによってインデックスされる前記ハフマン・コードブック中の符号語で表わすことによって、前記少なくとも一つの第二の要素をエンコードするために使われる同じハフマン・コードブックを使って前記ベクトル中の前記第一の要素をエンコードすることを含む、請求項3記載の方法。
【請求項5】
処理機能をもつ装置上で実行されたときに請求項1ないし4のうちいずれか一項記載の方法を実行するよう適応されたコンピュータ・コード命令を有するコンピュータ可読記憶媒体。

発明の詳細な説明【技術分野】
【0001】
関連出願への相互参照
本願は2013年5月24日に出願された米国仮特許出願第61/827,264号の出願日の利益を主張するものである。同出願の内容はここに参照により組み込まれる。
続きを表示(約 3,100 文字)【0002】
技術分野
本稿の開示は概括的にはオーディオ符号化に関する。詳細には、オーディオ符号化システムにおけるパラメータのベクトルのエンコードおよびデコードに関する。本開示はさらに、オーディオ・デコード・システムにおいてオーディオ・オブジェクトの再構成するための方法および装置に関する。
【背景技術】
【0003】
通常のオーディオ・システムでは、チャネル・ベースのアプローチが用いられる。各チャネルはたとえば、一つのスピーカーまたは一つのスピーカー・アレイのコンテンツを表わしてもよい。そのようなシステムのための可能な符号化方式は、離散的なマルチチャネル符号化またはMPEGサラウンドのようなパラメトリック符号化を含む。
【0004】
より最近は、新たなアプローチが開発されている。このアプローチはオブジェクト・ベースである。オブジェクト・ベースのアプローチを用いるシステムでは、三次元のオーディオ・シーンが、関連付けられた位置メタデータをもつオーディオ・オブジェクトによって表現される。これらのオーディオ・オブジェクトは、オーディオ信号の再生中に三次元オーディオ・シーン内を動き回る。システムはさらに、いわゆるベッド・チャネルを含んでいてもよい。ベッド・チャネルは、たとえば上記のような通常のオーディオ・システムのスピーカー位置に直接マッピングされる静的なオーディオ・オブジェクトとして記述されてもよい。
【0005】
オブジェクト・ベースのオーディオ・システムにおいて生じうる問題は、いかにして効率的にオーディオ信号をエンコードおよびデコードし、符号化された信号の品質を保持するかである。ある可能な符号化方式は、エンコーダ側で、前記オーディオ・オブジェクトおよびベッド・チャネルからのいくつかのチャネルを含むダウンミックス信号と、デコーダ側で前記オーディオ・オブジェクトおよびベッド・チャネルの再生成を可能にするサイド情報とを生成することを含む。
【0006】
MPEG空間的オーディオ・オブジェクト符号化(MPEG SAOC: MPEG Spatial Audio Object Coding)は、オーディオ・オブジェクトのパラメトリック符号化のためのシステムを記述している。このシステムは、前記オブジェクトの属性を記述するサイド情報、アップミックス行列参照、を、オブジェクトのレベル差および相互相関のようなパラメータによって送る。次いで、これらのパラメータは、デコーダ側でオーディオ・オブジェクトの再生成を制御するために使われる。このプロセスは、数学的に複雑であり、しばしば、該パラメータによって明示的に記述されない、オーディオ・オブジェクトの属性についての想定に依拠する必要がある。MPEG SAOCにおいて呈示される方法は、オブジェクト・ベースのオーディオ・システムについての必要とされるビットレートを下げうるが、上記のように効率および品質をさらに増すためにさらなる改善が必要とされることがある。
【図面の簡単な説明】
【0007】
例示的な実施形態についてこれから付属の図面を参照して記述する。
ある例示的実施形態に基づくオーディオ・エンコード・システムの一般化されたブロック図である。
図1に示される例示的なアップミックス行列エンコーダの一般化されたブロック図である。
図1のオーディオ・エンコード・システムによって決定されたアップミックス行列中の要素に対応するパラメータのベクトルにおける第一の要素についての例示的な確率分布を示す図である。
図1のオーディオ・エンコード・システムによって決定されたアップミックス行列中の要素に対応するパラメータのベクトルにおける少なくとも一つのモジュロ差分符号化された第二の要素についての例示的な確率分布を示す図である。
ある例示的実施形態に基づくオーディオ・デコード・システムの一般化されたブロック図である。
図5に示されるアップミックス行列デコーダの一般化されたブロック図である。
図1のオーディオ・エンコード・システムによって決定されたアップミックス行列中の要素に対応するパラメータのベクトルにおける前記第二の要素についてのエンコード方法を示す図である。
図1のオーディオ・エンコード・システムによって決定されたアップミックス行列中の要素に対応するパラメータのベクトルにおける第一の要素についてのエンコード方法を示す図である。
例示的なパラメータのベクトル中の前記第二の要素についての図7のエンコード方法の諸部分を示す図である。
例示的なパラメータのベクトル中の前記第一の要素についての図8のエンコード方法の諸部分を示す図である。
図1に示した第二の例示的なアップミックス行列エンコーダの一般化されたブロック図である。
ある例示的な実施形態に基づくオーディオ・デコード・システムの一般化されたブロック図である。
アップミックス行列の行の疎なエンコードのためのエンコード方法を示す図である。
アップミックス行列の例示的な行についての図10のエンコード方法の諸部分を示す図である。
アップミックス行列の例示的な行についての図10のエンコード方法の諸部分を示す図である。 すべての図面は概略的であり、一般に、本開示を明快にするために必要な部分を示すのみである。一方、他の部分は省略されたり示唆されるだけであったりすることがある。特に断わりのない限り、同様の参照符号は異なる図面における同様の部分を指す。
【発明を実施するための形態】
【0008】
上記に鑑み、増大した効率および符号化されたオーディオ信号の品質を提供するエンコーダおよびデコーダならびに関連する方法を提供することが目的である。
【0009】
〈I.概観――エンコーダ〉
第一の側面によれば、例示的実施形態は、エンコード方法、エンコーダおよびエンコードのためのコンピュータ・プログラム・プロダクトを提案する。提案される方法、エンコーダおよびコンピュータ・プログラム・プロダクトは、一般に、同じ特徴および利点を有していてもよい。
【0010】
例示的実施形態によれば、オーディオ・エンコード・システムにおいてパラメータのベクトルをエンコードする方法が提供される。各パラメータは非周期的な量に対応する。ベクトルは、第一の要素および少なくとも一つの第二の要素をもつ。本方法は:N通りの値を取り得るインデックス値によって前記ベクトル中の各パラメータを表現する段階と;前記少なくとも一つの第二の要素のそれぞれをシンボルに関連付ける段階とを含み、前記シンボルは:前記第二の要素のインデックス値と前記ベクトル中でその先行する要素のインデックス値との間の差を計算し;該差にモジュロNを適用することによって計算される。本方法はさらに、前記少なくとも一つの第二の要素に関連付けられたシンボルを、シンボルの確率を含む確率テーブルに基づいてエントロピー符号化することによって、前記少なくとも一つの第二の要素のそれぞれをエンコードする段階を含む。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

三井化学株式会社
遮音構造体
7日前
三井化学株式会社
遮音構造体
14日前
個人
弦楽器用押弦補助具及び弦楽器
7日前
三井化学株式会社
遮音構造体
7日前
三井化学株式会社
吸音構造体
2日前
林テレンプ株式会社
防音カバー
7日前
株式会社ドクター中松創研
歌及び歌の制作方法
17日前
株式会社総合車両製作所
吸音パネル
1日前
株式会社JVCケンウッド
車載装置
8日前
株式会社HOWA
遮音構造
14日前
個人
電気自動車等の「接近音」における最適な「音の種類」
10日前
カシオ計算機株式会社
楽器
14日前
株式会社JVCケンウッド
情報処理装置及び情報処理方法
2日前
株式会社第一興商
カラオケ装置
1日前
個人
電子管楽器
7日前
株式会社第一興商
カラオケ装置
2日前
株式会社コルグ
電子楽器用アナログエフェクタ
今日
ヤマハ株式会社
発音制御装置
8日前
川上産業株式会社
吸音シート
21日前
AOBAENERGY株式会社
サービス提供機器
7日前
トヨタ自動車株式会社
電気自動車
9日前
トヨタ自動車株式会社
音響式遮音材の製造方法
8日前
井関農機株式会社
作業車の操縦者用騒音低減装置
1日前
ローランド株式会社
鍵盤装置および押鍵情報の検出方法
2日前
ローランド株式会社
鍵盤装置および押鍵情報の検出方法
2日前
ローランド株式会社
鍵盤装置および鍵の揺動の規制方法
2日前
日本電波工業株式会社
音声再生装置及び音声再生方法
1日前
株式会社パトライト
メール読み上げテキスト生成プログラム
21日前
ヤマハ株式会社
音響測定装置、音響測定方法および音響測定プログラム
8日前
ブラザー工業株式会社
カラオケシステム、及び、カラオケ装置
2日前
カシオ計算機株式会社
音響処理装置、音響処理システム、音響処理方法及びプログラム
15日前
トヨタ自動車株式会社
車両管理システム及び電気自動車
9日前
株式会社丸高工業
防音板及びその附属品
2日前
株式会社石森管楽器
リガチャーおよび楽器
今日
ブラザー工業株式会社
カラオケシステム、カラオケ装置、及びカラオケ装置用のプログラム
1日前
ヤマハ株式会社
音響処理方法、音響処理システムおよびプログラム
21日前
続きを見る