TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025176120
公報種別
公開特許公報(A)
公開日
2025-12-03
出願番号
2025146680,2025121849
出願日
2025-09-04,2014-06-12
発明の名称
プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダ
出願人
ドルビー ラボラトリーズ ライセンシング コーポレイション
代理人
弁理士法人ITOH
主分類
G10L
19/00 20130101AFI20251126BHJP(楽器;音響)
要約
【課題】プログラム情報またはサブストリーム構造メタデータをもつオーディオ・エンコーダおよびデコーダを提供する。
【解決手段】サブストリーム構造メタデータ(SSM)および/またはプログラム情報メタデータ(PIM)およびオーディオ・データをビットストリーム中に含めることによることを含め、エンコードされたオーディオ・ビットストリームを生成する装置および方法。他の側面は、そのようなビットストリームをデコードするための装置および方法ならびに前記方法の任意の実施形態を実行するよう構成された(たとえばプログラムされた)、または前記方法の任意の実施形態に従って生成されたオーディオ・ビットストリームの少なくとも一つのフレームを記憶するバッファ・メモリを含むオーディオ処理ユニット(たとえば、エンコーダ、デコーダまたは後処理器)である。
【選択図】図3
特許請求の範囲
【請求項1】
一つまたは複数のプロセッサと;
前記一つまたは複数のプロセッサによって実行されると、前記一つまたは複数のプロセッサに動作を実行させる命令を記憶するように構成されている、前記一つまたは複数のプロセッサに結合されたメモリと
を有するオーディオ処理ユニットであって、前記動作は:
オーディオ・プログラムを含むエンコードされたオーディオ・ビットストリームを受領する段階であって、前記エンコードされたオーディオ・ビットストリームは一つまたは複数のオーディオ・チャネルの集合のエンコードされたオーディオ・データおよび前記オーディオ・チャネルの集合に関連付けられたメタデータを含み、前記メタデータはダイナミックレンジ制御(DRC)メタデータ、ラウドネス・メタデータおよび前記オーディオ・チャネルの集合におけるチャネル数を示すメタデータを含み、前記DRCメタデータはDRC値と、前記DRC値を生成するために使用されたDRCプロファイルを示すDRCプロファイル・メタデータとを含み、前記ラウドネス・メタデータは前記オーディオ・プログラムのダイアログ・ラウドネスを示すメタデータを含む、段階と;
前記エンコードされたオーディオ・データをデコードして、前記オーディオ・チャネルの集合のデコードされたオーディオ・データを得る段階と;
前記エンコードされたオーディオ・データの前記メタデータから、前記DRC値および前記オーディオ・プログラムの前記ダイアログ・ラウドネスを示すメタデータを取得する段階と;
前記DRC値および前記オーディオ・プログラムの前記ダイアログ・ラウドネスを示すメタデータに応答して前記オーディオ・チャネルの集合の前記デコードされたオーディオ・データを修正する段階であって、前記デコードされたオーディオ・データを修正することは、前記オーディオ・プログラムのダイアログ・ラウドネスを使って前記デコードされたオーディオ・データのラウドネス制御を実行することを含む、段階と
を含む、
オーディオ処理ユニット。
続きを表示(約 1,700 文字)
【請求項2】
前記エンコードされたオーディオ・ビットストリームがメタデータ・コンテナを含み、前記メタデータ・コンテナはヘッダと、該ヘッダの後に一つまたは複数のメタデータ・ペイロードとを含み、前記一つまたは複数のメタデータ・ペイロードが前記DRCメタデータを含む、請求項1に記載のオーディオ処理ユニット。
【請求項3】
オーディオ処理ユニットによって実行される方法であって:
オーディオ・プログラムを含むエンコードされたオーディオ・ビットストリームを受領する段階であって、前記エンコードされたオーディオ・ビットストリームは一つまたは複数のオーディオ・チャネルの集合のエンコードされたオーディオ・データおよび前記オーディオ・チャネルの集合に関連付けられたメタデータを含み、前記メタデータはダイナミックレンジ制御(DRC)メタデータ、ラウドネス・メタデータおよび前記オーディオ・チャネルの集合におけるチャネル数を示すメタデータを含み、前記DRCメタデータはDRC値と、前記DRC値を生成するために使用されたDRCプロファイルを示すDRCプロファイル・メタデータとを含み、前記ラウドネス・メタデータは前記オーディオ・プログラムのダイアログ・ラウドネスを示すメタデータを含む、段階と;
前記エンコードされたオーディオ・データをデコードして、前記オーディオ・チャネルの集合のデコードされたオーディオ・データを得る段階と;
前記エンコードされたオーディオ・データの前記メタデータから、前記DRC値および前記オーディオ・プログラムの前記ダイアログ・ラウドネスを示すメタデータを取得する段階と;
前記DRC値および前記オーディオ・プログラムの前記ダイアログ・ラウドネスを示すメタデータに応答して前記オーディオ・チャネルの集合の前記デコードされたオーディオ・データを修正する段階であって、前記デコードされたオーディオ・データを修正することは、前記オーディオ・プログラムのダイアログ・ラウドネスを使って前記デコードされたオーディオ・データのラウドネス制御を実行することを含む、段階と
を含む、
方法。
【請求項4】
一つまたは複数のプロセッサによって実行されると、前記一つまたは複数のプロセッサに動作を実行させる命令を記憶している、非一時的なコンピュータ可読記憶媒体であって、前記動作は:
オーディオ・プログラムを含むエンコードされたオーディオ・ビットストリームを受領する段階であって、前記エンコードされたオーディオ・ビットストリームは一つまたは複数のオーディオ・チャネルの集合のエンコードされたオーディオ・データおよび前記オーディオ・チャネルの集合に関連付けられたメタデータを含み、前記メタデータはダイナミックレンジ制御(DRC)メタデータ、ラウドネス・メタデータおよび前記オーディオ・チャネルの集合におけるチャネル数を示すメタデータを含み、前記DRCメタデータはDRC値と、前記DRC値を生成するために使用されたDRCプロファイルを示すDRCプロファイル・メタデータとを含み、前記ラウドネス・メタデータは前記オーディオ・プログラムのダイアログ・ラウドネスを示すメタデータを含む、段階と;
前記エンコードされたオーディオ・データをデコードして、前記オーディオ・チャネルの集合のデコードされたオーディオ・データを得る段階と;
前記エンコードされたオーディオ・データの前記メタデータから、前記DRC値および前記オーディオ・プログラムの前記ダイアログ・ラウドネスを示すメタデータを取得する段階と;
前記DRC値および前記オーディオ・プログラムの前記ダイアログ・ラウドネスを示すメタデータに応答して前記オーディオ・チャネルの集合の前記デコードされたオーディオ・データを修正する段階であって、前記デコードされたオーディオ・データを修正することは、前記オーディオ・プログラムのダイアログ・ラウドネスを使って前記デコードされたオーディオ・データのラウドネス制御を実行することを含む、段階と
を含む、
非一時的なコンピュータ可読記憶媒体。
発明の詳細な説明
【技術分野】
【0001】
関連出願への相互参照
本願は2013年6月19日に出願された米国仮特許出願第61/836,865号の優先権を主張するものである。同出願の内容はここに参照によってその全体において組み込まれる。
続きを表示(約 4,500 文字)
【0002】
技術分野
本発明は、オーディオ信号処理に、より詳細には、ビットストリームによって示されるオーディオ・コンテンツに関するサブストリーム構造および/またはプログラム情報を示すメタデータをもつオーディオ・データ・ビットストリームのエンコードおよびデコードに関する。本発明のいくつかの実施形態は、ドルビー・デジタル(AC-3)、ドルビー・デジタル・プラス(向上AC-3またはE-AC-3)またはドルビーEとして知られるフォーマットの一つでのオーディオ・データを生成または復号する。
【背景技術】
【0003】
ドルビー、ドルビー・デジタル、ドルビー・デジタル・プラスおよびドルビーEはドルビー・ラボラトリーズ・ライセンシング・コーポレイションの商標である。ドルビー・ラボラトリーズは、それぞれドルビー・デジタルおよびドルビー・デジタル・プラスとして知られる、AC-3およびE-AC-3の独自の実装を提供している。
【0004】
オーディオ・データ処理ユニットは典型的には盲目的な仕方で動作し、データが受領される前に行なわれたオーディオ・データの処理履歴には注意を払わない。これは、単一のエンティティが多様な目標メディア・レンダリング装置のためにすべてのオーディオ・データ処理およびエンコードを行ない、一方、目標メディア・レンダリング装置がエンコードされたオーディオ・データのすべてのデコードおよびレンダリングを行なう処理枠組みでは機能するかもしれない。しかしながら、この盲目的な処理は、複数のオーディオ処理ユニットが多様なネットワークを通じて分散しているまたは縦続的に(すなわちチェーン式に)配置されておりそれぞれの型のオーディオ処理を最適に実行することが期待される状況ではうまく(または全く)機能しない。たとえば、いくらかのオーディオ・データが高性能メディア・システムのためにエンコードされることがあり、メディア処理チェーンに沿ってモバイル装置に好適な低減された形に変換される必要があることがある。よって、オーディオ処理ユニットは、すでに実行されている型の処理をそのオーディオ・データに対して不必要に実行してしまうことがある。たとえば、ボリューム平準化ユニットは、入力オーディオ・クリップに対して同じまたは同様のボリューム平準化が以前に実行されているか否かに関わりなく、入力オーディオ・クリップに対して処理を実行することがある。結果として、ボリューム平準化ユニットは、必要ないときでさえも平準化を実行することがある。この無用な処理は、オーディオ・データのコンテンツをレンダリングする際に特定の特徴の劣化および/または除去を引き起こすこともある。
【発明の概要】
【課題を解決するための手段】
【0005】
あるクラスの諸実施形態では、本発明は、エンコードされたビットストリームをデコードすることができるオーディオ処理ユニットである。該ビットストリームは、該ビットストリームの少なくとも一つのフレームの少なくとも一つのセグメントにおいてサブストリーム構造メタデータおよび/またはプログラム情報メタデータを(任意的には他のメタデータ、たとえばラウドネス処理状態メタデータも)、前記フレームの少なくとも一つの他のセグメントにおいてオーディオ・データを含む。本稿では、サブストリーム構造メタデータ(substream structure metadata)(または「SSM」)はエンコードされたビットストリーム(またはエンコードされたビットストリームの集合)のメタデータであって、エンコードされたビットストリームのオーディオ・コンテンツのサブストリーム構造を示すものを表わし、「プログラム情報メタデータ(program information metadata)」(または「PIM」)は、少なくとも一つのオーディオ・プログラム(たとえば二つ以上のオーディオ・プログラム)を示すエンコードされたオーディオ・ビットストリームのメタデータであって、少なくとも一つの前記プログラムのオーディオ・コンテンツの少なくとも一つの属性または特性を示すものを表わす(たとえば、プログラムのオーディオ・データに対して実行された処理の型またはパラメータを示すメタデータまたはプログラムのどのチャネルがアクティブなチャネルであるかを示すメタデータ)。
【0006】
典型的な場合(たとえば、エンコードされたビットストリームがAC-3またはE-AC-3ビットストリームである場合)、プログラム情報メタデータ(PIM)は、ビットストリームの他の部分において担持されることが実際上できないプログラム情報を示す。たとえば、PIMは、エンコード(たとえばAC-3またはE-AC-3エンコード)に先立ってPCMオーディオに適用された処理、そのオーディオ・プログラムのどの周波数帯域が特定のオーディオ符号化技法を使ってエンコードされたかおよびビットストリーム中のダイナミックレンジ圧縮(DRC: dynamic range compression)データを生成するために使われた圧縮プロファイルを示してもよい。
【0007】
別のクラスの実施形態では、方法がビットストリームの各フレーム(または少なくともいくつかのフレームのそれぞれ)においてエンコードされたオーディオ・データをSSMおよび/またはPIMと多重化する段階を含む。典型的なデコードでは、デコーダはビットストリームからSSMおよび/またはPIMを抽出し(SSMおよび/またはPIMとオーディオ・データをパースし、多重分離することによることを含む)、オーディオ・データを処理してデコードされたオーディオ・データのストリームを生成する(場合によってはオーディオ・データの適応的な処理も実行する)。いくつかの実施形態では、デコードされたオーディオ・データおよびSSMおよび/またはPIMは、デコーダから、SSMおよび/またはPIMを使ってデコードされたオーディオ・データに適応的な処理を実行するよう構成された後処理器に転送される。
【0008】
あるクラスの実施形態では、本発明のエンコード方法は、エンコードされたオーディオ・データを含むオーディオ・データ・セグメント(たとえば図4に示したフレームのAB0~AB5セグメントまたは図7に示したフレームのセグメントAB0~AB5の全部または一部)と、該オーディオ・データ・セグメントと時分割多重されたメタデータ・セグメント(SSMおよび/またはPIMならびに任意的には他のメタデータをも含む)とを含むエンコードされたオーディオ・ビットストリーム(たとえばAC-3またはE-AC-3ビットストリーム)を生成する。いくつかの実施形態では、各メタデータ・セグメント(本稿では時に「コンテナ」と称される)は、メタデータ・セグメント・ヘッダ(任意的には他の必須のまたは「コア」の要素も)および該メタデータ・セグメント・ヘッダに続く一つまたは複数のメタデータ・ペイロードを含むフォーマットをもつ。SIMはもし存在すれば、メタデータ・ペイロードの一つ(ペイロード・ヘッダによって識別され、典型的には第一の型のフォーマットをもつ)に含められる。PIMはもし存在すれば、メタデータ・ペイロードの別の一つ(ペイロード・ヘッダによって識別され、典型的には第二の型のフォーマットをもつ)に含められる。同様に、他のそれぞれの型のメタデータは(もし存在すれば)、メタデータ・ペイロードの別の一つ(ペイロード・ヘッダによって識別され、典型的にはメタデータのその型に特有のフォーマットをもつ)に含められる。この例示的なフォーマットは、デコード中以外の時に、SSM、PIMおよび他のメタデータへの便利なアクセス(たとえばデコードに続く後処理器によるアクセスまたはエンコードされたビットストリームに対する完全なデコードを実行することなくメタデータを認識するよう構成されているプロセッサによるアクセス)を許容し、ビットストリームのデコード中の(たとえばサブストリーム識別の)便利で効率的な誤り検出および訂正を許容する。たとえば、上記例示的なフォーマットにおけるSSMへのアクセスなしでは、デコーダは、プログラムに関連するサブストリームの正しい数を誤って識別することがありうる。メタデータ・セグメント中のあるメタデータ・ペイロードがSSMを含んでいてもよく、該メタデータ・セグメント中の別のメタデータ・ペイロードがPIMを含んでいてもよく、任意的には、該メタデータ・セグメント中の少なくとも一つの他のメタデータ・ペイロードが他のメタデータ(たとえばラウドネス処理状態メタデータ(loudness processing state metadata)または「LPSM」)をも含んでいてもよい。
【図面の簡単な説明】
【0009】
本発明の方法のある実施形態を実行するよう構成されていてもよいシステムのある実施形態のブロック図である。
本発明のオーディオ処理ユニットの実施形態であるエンコーダのブロック図である。
本発明のオーディオ処理ユニットの実施形態であるデコーダならびにそれに結合された、本発明のオーディオ処理ユニットのもう一つの実施形態である後処理器のブロック図である。
AC-3フレームを、それが分割された諸セグメントを含めて描く図である。
AC-3フレームの同期情報(SI)セグメントを、それが分割された諸セグメントを含めて描く図である。
AC-3フレームのビットストリーム情報(BSI)セグメントを、それが分割された諸セグメントを含めて描く図である。
E-AC-3フレームを、それが分割された諸セグメントを含めて描く図である。
本発明のある実施形態に基づいて生成されたエンコードされたビットストリームのメタデータ・セグメントであって、コンテナ同期語(図8では「コンテナ同期」として同定されている)ならびにバージョンおよびキーID値を含むメタデータ・セグメント・ヘッダと、それに続く複数のメタデータ・ペイロードおよび保護ビットとを含むものの図である。
【発明を実施するための形態】
【0010】
〈記法および命名法〉
請求項を含む本開示を通じて、信号またはデータ「に対して」動作を実行する(たとえば信号またはデータをフィルタリングする、スケーリングする、変換するまたは利得を適用する)という表現は、信号またはデータに対して直接的に、または信号またはデータの処理されたバージョンに対して(たとえば、予備的なフィルタリングまたは前処理を該動作の実行に先立って受けている前記信号のバージョンに対して)該動作を実行することを表わすために広義で使用される。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
個人
ギター
3日前
個人
遮音材
1か月前
個人
管楽器用リガチャ-
1か月前
個人
歌唱補助器具
1か月前
個人
音声出力装置
1か月前
横浜ゴム株式会社
音響材
24日前
三井化学株式会社
防音構造体
4日前
三井化学株式会社
防音構造体
4日前
大和ハウス工業株式会社
音低減設備
1か月前
DIC株式会社
吸音材及び吸音部品
1か月前
個人
管楽器用音質改善留め具
18日前
NOK株式会社
吸音構造体
1か月前
株式会社SinasSP
自動騒音低減装置
1か月前
横浜ゴム株式会社
多層空洞音響材
1か月前
矢崎総業株式会社
車両用対話システム
1か月前
株式会社デンソー
音低減装置
3日前
トヨタ自動車株式会社
判定装置
1か月前
株式会社第一興商
カラオケ装置
1か月前
三井化学株式会社
防音構造体および自動車の防音構造
4日前
ヤマハ株式会社
鍵盤装置
11日前
株式会社JVCケンウッド
収音装置、収音方法、およびプログラム
1か月前
大建工業株式会社
吸音体及び音環境調整構造
1か月前
有限会社ツバサ
エレキギターおよび保護フィルム付きの樹脂プレート
1か月前
ヤマハ株式会社
音処理装置及び音処理方法
18日前
有限会社 宮脇工房
モーター挙動音発生装置
1か月前
株式会社デンソー
制御装置、制御方法、及び制御プログラム
24日前
株式会社SUBARU
乗物用遮音構造体、及び車両
1か月前
株式会社第一興商
カラオケ装置、カラオケシステム
10日前
株式会社第一興商
カラオケ装置、カラオケシステム
26日前
株式会社第一興商
カラオケ装置、カラオケシステム
3日前
株式会社コルグ
楽音信号変換装置、楽音信号変換方法、プログラム
1か月前
固昌通訊股ふん有限公司
音響調整装置
1か月前
株式会社東芝
発話言語理解のためのシステムおよび方法
1か月前
本田技研工業株式会社
音声認識装置、音声認識方法、及びプログラム
5日前
トヨタ自動車株式会社
ブレーキインジケータシステム
3日前
株式会社枚方技研
方向付き楽器固定具
1か月前
続きを見る
他の特許を見る