TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025092574
公報種別公開特許公報(A)
公開日2025-06-19
出願番号2025052789,2023220176
出願日2025-03-27,2014-09-09
発明の名称ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整
出願人ドルビー ラボラトリーズ ライセンシング コーポレイション,ドルビー・インターナショナル・アーベー
代理人弁理士法人ITOH
主分類H04R 3/00 20060101AFI20250612BHJP(電気通信技術)
要約【課題】ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整を提供する。
【解決手段】参照スピーカー構成のために符号化されたオーディオ・コンテンツが、特定のスピーカー構成のために符号化されたダウンミックス・オーディオ・コンテンツにダウンミックスされる。前記特定のスピーカー構成のために符号化された前記ダウンミックス・オーディオ・コンテンツの個々の部分に対して一つまたは複数の利得調整が実行される。次いで、前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対してラウドネス測定が実行される。前記参照スピーカー構成のために符号化された前記オーディオ・コンテンツと、ダウンミックス・ラウドネス・メタデータとを含むオーディオ信号が生成される。ダウンミックス・ラウドネス・メタデータは、少なくとも部分的には前記ダウンミックス・オーディオ・コンテンツの前記個々の部分に対する前記ラウドネス測定に基づいて生成される。
【選択図】図3
特許請求の範囲【請求項1】
エンコーダで生成されたラウドネス・メタデータに基づいてオーディオ信号を利得調整する方法であって:
参照チャネル構成とは異なる再生チャネル構成で動作するオーディオ・デコーダによって、前記参照チャネル構成のためのオーディオ信号を受領する段階であって、前記オーディオ信号は前記参照チャネル構成の各チャネルについてのオーディオ・サンプル・データおよび前記エンコーダで生成されたラウドネス・メタデータを含み、前記エンコーダで生成されたラウドネス・メタデータは前記再生チャネル構成および前記参照チャネル構成を含む複数のチャネル構成についてのラウドネス・メタデータを含む、段階と;
前記複数のチャネル構成についてのラウドネス・メタデータから、前記再生チャネル構成についてのラウドネス・メタデータを選択する段階と;
前記オーディオ・サンプル・データをダウンミックスして、前記再生チャネル構成のオーディオ・チャネルのためのダウンミックスされたオーディオ・サンプル・データにする段階と;
前記再生チャネル構成についてのラウドネス・メタデータからラウドネス調整利得を決定する段階と;
前記ラウドネス調整利得を前記ダウンミックスされたオーディオ・サンプル・データに適用される全体的な利得の一部として適用して、前記再生チャネル構成の各チャネルについて出力オーディオ・サンプル・データを生成する段階とを含み、
前記ラウドネス調整利得は、前記再生チャネル構成についてのラウドネス・メタデータによって示されるラウドネス・レベルと、参照ラウドネス・レベルとに依存し、
前記再生構成は、前記参照チャネル構成とは異なる数のオーディオ・チャネルを有する、
方法。
続きを表示(約 2,100 文字)【請求項2】
前記全体的な利得は:ダウンミックスに関係した利得、前記オーディオ・サンプル・データの入力ダイナミックレンジが変換された元のダイナミックレンジを復元することに関係した利得、利得制限に関係した利得、利得平滑化に関係した利得またはダイアログ・ラウドネス正規化に関係した利得のうちの一つまたは複数を含む、請求項1に記載の方法。
【請求項3】
前記全体的な利得は、部分的に/個々に適用される、直列に適用される、並列に適用される、または部分的に直列、部分的に並列に適用される利得を含む、請求項1に記載の方法。
【請求項4】
前記全体的な利得は、前記再生チャネル構成におけるチャネルの部分集合に適用される利得を含む、請求項1に記載の方法。
【請求項5】
前記再生チャネル構成は2チャネル構成である、請求項1に記載の方法。
【請求項6】
前記ラウドネス調整利得は、前記再生チャネル構成についてのラウドネス・メタデータによって示されるラウドネス・レベルと、前記参照ラウドネス・レベルとの間の差に依存する、請求項1に記載の方法。
【請求項7】
前記オーディオ・デコーダは、前記参照ラウドネス・レベルを設定する、請求項1に記載の方法。
【請求項8】
ソフトウェア命令を記憶している非一時的なコンピュータ読み取り可能記憶媒体であって、前記ソフトウェア命令は、一つまたは複数のプロセッサによって実行されると:
参照チャネル構成とは異なる再生チャネル構成で動作するオーディオ・デコーダによって、前記参照チャネル構成のためのオーディオ信号を受領する段階であって、前記オーディオ信号は前記参照チャネル構成の各チャネルについてのオーディオ・サンプル・データおよびエンコーダで生成されたラウドネス・メタデータを含み、前記エンコーダで生成されたラウドネス・メタデータは前記再生チャネル構成および前記参照チャネル構成を含む複数のチャネル構成についてのラウドネス・メタデータを含む、段階と;
前記複数のチャネル構成についてのラウドネス・メタデータから、前記再生チャネル構成についてのラウドネス・メタデータを選択する段階と;
前記オーディオ・サンプル・データをダウンミックスして、前記再生チャネル構成のオーディオ・チャネルのためのダウンミックスされたオーディオ・サンプル・データにする段階と;
前記再生チャネル構成についてのラウドネス・メタデータからラウドネス調整利得を決定する段階と;
前記ラウドネス調整利得を前記ダウンミックスされたオーディオ・サンプル・データに適用される全体的な利得の一部として適用して、前記再生チャネル構成の各チャネルについて出力オーディオ・サンプル・データを生成する段階とを実行させるものであり、
前記ラウドネス調整利得は、前記再生チャネル構成についてのラウドネス・メタデータによって示されるラウドネス・レベルと、参照ラウドネス・レベルとに依存し、
前記再生構成は、前記参照チャネル構成とは異なる数のオーディオ・チャネルを有する、
媒体。
【請求項9】
エンコーダで生成されたラウドネス・メタデータに基づいてオーディオ信号を利得調整するためのオーディオ信号処理装置であって、当該オーディオ信号処理装置は:
参照チャネル構成とは異なる再生チャネル構成で動作するオーディオ・デコーダによって、前記参照チャネル構成のためのオーディオ信号を受領する段階であって、前記オーディオ信号は前記参照チャネル構成の各チャネルについてのオーディオ・サンプル・データおよび前記エンコーダで生成されたラウドネス・メタデータを含み、前記エンコーダで生成されたラウドネス・メタデータは前記再生チャネル構成および前記参照チャネル構成を含む複数のチャネル構成についてのラウドネス・メタデータを含む、段階と;
前記複数のチャネル構成についてのラウドネス・メタデータから、前記再生チャネル構成についてのラウドネス・メタデータを選択する段階と;
前記オーディオ・サンプル・データをダウンミックスして、前記再生チャネル構成のオーディオ・チャネルのためのダウンミックスされたオーディオ・サンプル・データにする段階と;
前記再生チャネル構成についてのラウドネス・メタデータからラウドネス調整利得を決定する段階と;
前記ラウドネス調整利得を前記ダウンミックスされたオーディオ・サンプル・データに適用される全体的な利得の一部として適用して、前記再生チャネル構成の各チャネルについて出力オーディオ・サンプル・データを生成する段階とを実行し、
前記ラウドネス調整利得は、前記再生チャネル構成についてのラウドネス・メタデータによって示されるラウドネス・レベルと、参照ラウドネス・レベルとに依存し、
前記再生構成は、前記参照チャネル構成とは異なる数のオーディオ・チャネルを有する、
オーディオ信号処理装置。

発明の詳細な説明【技術分野】
【0001】
関連出願への相互参照
本願は2013年9月12日に出願された米国仮特許出願第61/877,230号、2013年10月15日に出願された米国仮特許出願第61/891,324号、2014年2月10日に出願された米国仮特許出願第61/938,043号および2013年10月17日に出願された米国仮特許出願第61/892,313号の優先権を主張するものである。各出願の内容はここに参照によってその全体において組み込まれる。
続きを表示(約 3,400 文字)【0002】
技術
本発明は、概括的にはオーディオ信号の処理に、より詳細にはダイナミックレンジ制御および他の型のオーディオ処理動作を幅広い多様な再生環境のうちの任意のものにおいてオーディオ信号に適用することに使用されうる技法に関する。
【背景技術】
【0003】
メディア消費装置の高まる人気は、そうした装置での再生のためのメディア・コンテンツのクリエーターおよび頒布者にとって、またはそうした装置の設計者および製造業者にとって新たな機会と課題を作り出した。多くの消費者装置は幅広いメディア・コンテンツの型およびフォーマットを再生でき、中にはHDTV、ブルーレイまたはDVDのためのしばしば高品質、広帯域幅および広いダイナミックレンジのオーディオ・コンテンツに関連するものも含まれる。メディア処理装置は、この型のオーディオ・コンテンツを、自らの内部音響トランスデューサ上でまたはヘッドフォンのような外部トランスデューサ上で再生するために使用されうる。しかしながら、メディア処理装置は一般には、多様なメディア・フォーマットおよびコンテンツ型にわたる一貫したラウドネスおよび了解性をもってこのコンテンツを再生することはできない。
【0004】
このセクションで記述されたアプローチは、追求されることができたが必ずしも以前に着想または追求されたアプローチではない。したがって、特に断りのない限り、このセクションにおいて記述されるアプローチはいずれも、このセクションに含まれているというだけのために従来技術の資格をもつと想定されるべきではない。同様に、特に断りのない限り、一つまたは複数のアプローチに関して特定されている問題は、このセクションに基づいて何らかの従来技術において認識されていたと想定されるべきではない。
【図面の簡単な説明】
【0005】
本発明は、限定ではなく例として、付属の図面において示される。図面において、同様の参照符号は同様の要素を指す。
例示的なオーディオ・デコーダを示す図である。
例示的なオーディオ・エンコーダを示す図である。
例示的なダイナミックレンジ圧縮曲線を示す図である。
例示的なダイナミックレンジ圧縮曲線を示す図である。
組み合わされたDRCおよび制限利得の決定/計算の例示的な処理論理を示す図である。
利得の例示的な差分符号化を示す図である。
オーディオ・エンコーダおよびオーディオ・デコーダを有する例示的なコーデック・システムを示す図である。
例示的なプロセス・フローを示す図である。
例示的なプロセス・フローを示す図である。
例示的なプロセス・フローを示す図である。
例示的なプロセス・フローを示す図である。
本稿に記載されるコンピュータまたはコンピューティング装置が実装されうる例示的なハードウェア・プラットフォームを示す図である。
【発明を実施するための形態】
【0006】
ダイナミックレンジ制御および他の型のオーディオ処理動作を幅広い多様な再生環境のうちの任意のものにおいてオーディオ信号に適用することに関する例示的実施形態が本稿で記述される。以下の記述では、説明の目的のため、本発明の十全な理解を提供するために、説明の目的で数多くの個別的詳細が記載される。しかしながら、本発明がそうした個別的詳細なしでも実施されうることは明白であろう。他方、本発明を無用に隠蔽し、かすませ、あるいは埋没させるのを避けるために、よく知られた構造および装置は網羅的な詳細さでは記述されない。
【0007】
例示的実施形態は本稿では以下のアウトラインに従って記述される。
1.全般的概観
2.ダイナミックレンジ制御
3.オーディオ・デコーダ
4.オーディオ・エンコーダ
5.ダイナミックレンジ圧縮曲線
6.DRC利得、利得制限および利得平滑化
7.入力平滑化および利得平滑化
8.複数周波数帯域にわたるDRC
9.ラウドネス領域でのボリューム調整
10.ダウンミックス・ラウドネス調整
11.利得に関係した追加的動作
12.特定的およびブロードバンド(または広帯域)のラウドネス・レベル
13.チャネルの個々の部分集合のための個々の利得
14.聴覚シーン解析
15.ラウドネス・レベル遷移
16.リセット
17.エンコーダによって提供される利得
18.例示的なシステムおよびプロセス・フロー
19.実装機構――ハードウェアの概観
20.等価物、拡張、代替その他。
【0008】
〈1.全般的概観〉
この概観は、本発明の実施形態のいくつかの側面の基本的な記述を提示する。この概観は該実施形態の諸側面の包括的ないし網羅的な要約ではないことは注意しておくべきである。さらに、この概観は、該実施形態の何らかの特に有意な側面もしくは要素を特定するものと理解されることも、一般には本発明の、特に該実施形態の何らかの範囲を画定するものと理解されることも、意図されていないことを注意しておくべきである。この概観は単に、その例示的実施形態に関係するいくつかの概念を凝縮された単純化された形式で提示するものであり、単に後続の例示的な諸実施形態のより詳細な説明への概念的な導入部として理解されるべきである。別個の諸実施形態が本稿において論じられるが、本稿で論じられる実施形態および/または部分実施形態の任意の組み合わせがさらなる実施形態をなすよう組み合わされてもよいことを注意しておく。
【0009】
いくつかのアプローチでは、エンコーダは、ダイナミックレンジ制御の目的のためにオーディオ・コンテンツが特定の環境のためにエンコードされていることを想定し、その特定の環境のために、ダイナミックレンジ制御などのための利得のようなオーディオ処理パラメータを決定する。これらのアプローチのもとでエンコーダによって決定される利得は、典型的には、何らかの時定数をもって(たとえば指数関数型減衰関数などにおいて)、何らかの時間区間にわたってなどで平滑化されたものである。さらに、これらのアプローチのもとでエンコーダによって決定される利得は、想定される環境についてラウドネス・レベルがクリッピング・レベルを上回らないことを保証する利得制限のために組み込まれたものであってもよい。よって、これらのアプローチのもとでエンコーダによってオーディオ情報とともにオーディオ信号中にエンコードされる利得は、多くの異なる影響の結果であり、不可逆である。これらのアプローチのもとで利得を受け取るデコーダは、利得のどの部分がダイナミックレンジ制御のためで、利得のどの部分が利得平滑化のためで、利得のどの部分が利得制限のためであるかなどを区別できないであろう。
【0010】
本稿に記載される技法のもとでは、オーディオ・エンコーダは、オーディオ・デコーダにおける特定の再生環境がサポートされるだけでよいとは想定しない。ある実施形態では、オーディオ・エンコーダは、(たとえばクリッピングなどのない)正しいラウドネス・レベルが決定できるもとになるオーディオ・コンテンツをもつエンコードされたオーディオ信号を送信する。オーディオ・エンコーダは一つまたは複数のダイナミックレンジ圧縮曲線もオーディオ・デコーダに送信してもよい。該一つまたは複数のダイナミックレンジ圧縮曲線のいずれも、標準ベースのものでも、独自のものでも、カスタマイズされたものでも、コンテンツ・プロバイダー固有のものなどでもよい。参照ラウドネス・レベル、アタック時間、リリース時間などがオーディオ・エンコーダによって、前記一つまたは複数のダイナミックレンジ圧縮曲線の一部としてまたは前記一つまたは複数のダイナミックレンジ圧縮曲線との関連で送信されてもよい。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
携帯端末保持具
1か月前
個人
音響装置
1か月前
日本精機株式会社
投影システム
1か月前
日本無線株式会社
音声通信方式
1か月前
キヤノン株式会社
撮像装置
1日前
キヤノン株式会社
通信装置
1か月前
日本精機株式会社
車両用表示装置
1か月前
ヤマハ株式会社
音響出力装置
1か月前
個人
補聴器のイヤピース耳穴挿入具
1か月前
キヤノン電子株式会社
画像読取装置
1か月前
ヤマハ株式会社
音響出力装置
1か月前
電気興業株式会社
無線中継器
8日前
ヤマハ株式会社
信号処理装置
1日前
キヤノン電子株式会社
画像読取装置
1か月前
キヤノン株式会社
画像読取装置
2か月前
株式会社ヴィーネックス
カメラ
1か月前
キヤノン株式会社
撮影システム
1か月前
キヤノン株式会社
画像処理装置
25日前
キヤノン株式会社
通信システム
16日前
キヤノン株式会社
映像表示装置
2か月前
日本放送協会
映像伝送システム
1か月前
リオン株式会社
電気機械変換器
1か月前
オムロン株式会社
スレーブ装置
2か月前
キヤノン株式会社
画像処理装置
1か月前
株式会社シグマ
撮像素子及び撮像装置
1か月前
キヤノン株式会社
画像表示装置
21日前
シャープ株式会社
電子機器
1か月前
キヤノン電子株式会社
画像読取システム
17日前
エルメック株式会社
信号伝送回路
18日前
シャープ株式会社
表示装置
29日前
株式会社クーネル
音響装置
24日前
個人
外部ヘッダ変換通信装置および通信網
1日前
株式会社バッファロー
無線通信装置
1か月前
アイホン株式会社
インターホン機器
2か月前
株式会社ニコン
カメラボディ
2か月前
株式会社国際電気
無線通信システム
1か月前
続きを見る