TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025098213
公報種別公開特許公報(A)
公開日2025-07-01
出願番号2025054687,2023173392
出願日2025-03-28,2018-03-19
発明の名称オーディオ信号の高周波再構成のための高調波転換器の後方互換な統合
出願人ドルビー・インターナショナル・アーベー
代理人弁理士法人ITOH
主分類G10L 21/0388 20130101AFI20250624BHJP(楽器;音響)
要約【課題】スペクトル・バンド複製を改善するための符号化された音声ビットストリームをデコードする方法及び記憶媒体を提供する。
【解決手段】方法は、エンコードされたオーディオ・ビットストリームを受領し、オーディオ・データをデコードして、デコードされた低域オーディオ信号を生成することを含む。方法はまた、高周波再構成メタデータを抽出し、デコードされた低域オーディオ信号を分解フィルタバンクでフィルタリングして、フィルタリングされた低域オーディオ信号を生成することを含む。方法はさらに、スペクトル並進または高調波転換のどちらが前記オーディオ・データに対して実行されるべきかを示すフラグを抽出し、該フラグに従って、前記フィルタリングされた低域オーディオ信号および前記高周波再構成メタデータを使って前記オーディオ信号の高域部分を再生成することを含む。
【選択図】なし
特許請求の範囲【請求項1】
エンコードされたオーディオ・ビットストリームをデコードする方法であって、当該方法は:
エンコードされたオーディオ・ビットストリームを受領する段階であって、前記エンコードされたオーディオ・ビットストリームはオーディオ信号の低域部分を表わすオーディオ・データを含む、段階と;
前記オーディオ・データをデコードして、デコードされた低域オーディオ信号を生成する段階と;
前記エンコードされたオーディオ・ビットストリームから、高周波再構成メタデータを抽出する段階であって、前記高周波再構成メタデータは、前記オーディオ信号の低域部分から、連続するいくつかのサブバンドを前記オーディオ信号の高域部分に線形並進する高周波再構成プロセスのためにチューニングされた線形並進動作パラメータを含み、前記線形並進動作パラメータは、正弦波追加情報を含む、段階と;
前記デコードされた低域オーディオ信号を分解フィルタバンクでフィルタリングして、フィルタリングされた低域オーディオ信号を生成する段階と;
前記エンコードされたオーディオ・ビットストリームから、線形並進または高調波転換のどちらが前記オーディオ・データに対して実行されるべきかを示すフラグを抽出する段階と;
前記フラグが、高調波転換が前記オーディオ・データに対して実行されるべきであることを示す場合:
前記フィルタリングされた低域オーディオ信号および前記正弦波追加情報を含む前記高周波再構成メタデータを使って高調波転換を実行することによって、前記オーディオ信号の高域部分を再生成する段階であって、前記正弦波追加情報は、線形並進処理のためにエンコードされたものであるにもかかわらず高調波転換のために再利用される、段階と;
合成フィルタバンクを使って、前記フィルタリングされた低域オーディオ信号および再生成された高域部分を組み合わせて、広帯域オーディオ信号を形成する段階とを含み、
前記分解フィルタバンクが、
TIFF
2025098213000014.tif
12
170
に基づく、プロトタイプ・フィルタp
0
(n)の変調されたバージョンである分解フィルタh
k
(n)を含み、p
0
(n)は実数値の対称または非対称プロトタイプ・フィルタであり、Mは前記分解フィルタバンクにおけるチャネル数であり、Nはプロトタイプ・フィルタ次数であり、
前記分解フィルタバンクにおけるチャネル数は前記合成フィルタバンクにおけるチャネル数とは異なる、
方法。
続きを表示(約 1,200 文字)【請求項2】
プロセッサによって実行されたときに前記プロセッサに請求項1記載の方法を実行させる命令を有するコンピュータ・プログラム。
【請求項3】
エンコードされたオーディオ・ビットストリームをデコードするためのデコーダであって、当該デコーダは:
エンコードされたオーディオ・ビットストリームを受領するための入力インターフェースであって、該エンコードされたオーディオ・ビットストリームは、オーディオ信号の低域部分を表わすオーディオ・データを含む、入力インターフェースと;
前記オーディオ・データをデコードして、デコードされた低域オーディオ信号を生成するコア・デコーダと;
前記エンコードされたオーディオ・ビットストリームから、高周波再構成メタデータを抽出するためのフォーマット解除器であって、前記高周波再構成メタデータは、前記オーディオ信号の低域部分から、連続するいくつかのサブバンドを前記オーディオ信号の高域部分に線形並進する高周波再構成プロセスのためにチューニングされた線形並進動作パラメータを含み、前記線形並進動作パラメータは、正弦波追加情報を含む、フォーマット解除器と;
前記デコードされた低域オーディオ信号をフィルタリングして、フィルタリングされた低域オーディオ信号を生成する分解フィルタバンクと;
前記エンコードされたオーディオ・ビットストリームから、線形並進または高調波転換のどちらが前記オーディオ・データに対して実行されるべきかを示すフラグを抽出するフォーマット解除器と;
前記フラグが、高調波転換が前記オーディオ・データに対して実行されるべきであることを示す場合、前記フィルタリングされた低域オーディオ信号および前記正弦波追加情報を含む前記高周波再構成メタデータを使って高調波転換を実行することによって、前記オーディオ信号の高域部分を再生成する高周波再生成器であって、であって、前記正弦波追加情報は、線形並進処理のためにエンコードされたものであるにもかかわらず高調波転換のために再利用される、高調波再生器と;
前記フィルタリングされた低域オーディオ信号および再生成された高域部分を組み合わせて、広帯域オーディオ信号を形成する合成フィルタバンクとを有しており、
前記分解フィルタバンクが、
TIFF
2025098213000015.tif
12
170
に基づく、プロトタイプ・フィルタp
0
(n)の変調されたバージョンである分解フィルタh
k
(n)を含み、p
0
(n)は実数値の対称または非対称プロトタイプ・フィルタであり、Mは前記分解フィルタバンクにおけるチャネル数であり、Nはプロトタイプ・フィルタ次数であり、
前記分解フィルタバンクにおけるチャネル数は前記合成フィルタバンクにおけるチャネル数とは異なる、
デコーダ。

発明の詳細な説明【技術分野】
【0001】
実施形態はオーディオ信号処理に関し、より詳細には高周波再構成(HFR: high frequency reconstruction)の基本形またはHFRの向上形のいずれかがオーディオ・データに対して実行されるべきであることを指定する制御データをもつオーディオ・ビットストリームのエンコード、デコードまたはトランスコードに関する。
続きを表示(約 3,500 文字)【背景技術】
【0002】
典型的なオーディオ・ビットストリームは、オーディオ・コンテンツの一つまたは複数のチャネルを示すオーディオ・データ(たとえばエンコードされたオーディオ・データ)と、前記オーディオ・データまたはオーディオ・コンテンツの少なくとも一つの特性を示すメタデータとの両方を含む。エンコードされたオーディオ・ビットストリームを生成するための一つのよく知られたフォーマットは、MPEG規格ISO/IEC14496-3:2009に記載されるMPEG-4先進オーディオ符号化(AAC: Advanced Audio Coding)フォーマットである。MPEG-4規格では、AACは「advanced audio coding(先進オーディオ符号化)」を表わし、HE-AACは「high-efficiency advanced audio coding(高効率先進オーディオ符号化)」を表わす。
【0003】
MPEG-4 AAC規格はいくつかのオーディオ・プロファイルを定義しており、それらのオーディオ・プロファイルが、準拠エンコーダまたはデコーダにおいてどのオブジェクトおよび符号化ツールが存在しているかを決める。これらのオーディオ・プロファイルのうちの三つは、(1)AACプロファイル、(2)HE-AACプロファイルおよび(3)HE-AAC v2プロファイルである。AACプロファイルはAAC低計算量(AAC low complexity)(または「AAC-LC」)オブジェクト型を含む。AAC-LCオブジェクトは、若干の調整はあるがMPEG-2 AAC低計算量プロファイルに対応するものであり、スペクトル帯域複製(spectral band replication)(「SBR」)オブジェクト型もパラメトリック・ステレオ(parametric stereo)(「PS」)オブジェクト型も含まない。HE-AACプロファイルはAACプロファイルの上位集合であって、追加的にSBRオブジェクト型を含む。HE-AAC v2プロファイルはHE-AACプロファイルの上位集合であって、追加的にPSオブジェクト型を含む。
【0004】
SBRオブジェクト型は、スペクトル帯域複製ツールを含む。これは、知覚的オーディオ・コーデックの圧縮効率を著しく改善する重要な高周波再構成(「HFR」)符号化ツールである。SBRは受信器側で(たとえばデコーダにおいて)オーディオ信号の高周波数成分を再構成する。そのため、エンコーダは低周波数成分をエンコードして伝送するだけでよく、低データ・レートにおいてずっと高いオーディオ品質を許容する。SBRは、データ・レートを削減するために以前に打ち切りされた高調波のシーケンスを、エンコーダから得られる利用可能な帯域幅制限された信号および制御データから複製することに基づく。トーン様成分とノイズ様成分の間の比は適応的な逆フィルタリングならびにノイズおよび正弦波の任意的な追加によって維持される。MPEG-4 AAC規格では、SBRツールは、いくつかの連続する直交ミラー・フィルタ(QMF)サブバンドがオーディオ信号の伝送された低域部分から、デコーダにおいて生成されるオーディオ信号の高域部分にコピーされる(または「パッチ」される)、スペクトル・パッチング(spectral patching)(線形並進(linear translation)またはスペクトル並進(spectral translation)とも呼ばれる)を実行する。
【先行技術文献】
【非特許文献】
【0005】
MPEG規格ISO/IEC14496-3:2009
【発明の概要】
【発明が解決しようとする課題】
【0006】
スペクトル・パッチングまたは線形並進は、比較的低いクロスオーバー周波数をもつ音楽コンテンツのようなある種のオーディオ型については理想的ではないことがある。したがって、スペクトル帯域複製を改善するための技法が必要とされている。
【課題を解決するための手段】
【0007】
第一のクラスの実施形態は、エンコードされたオーディオ・ビットストリームをデコードする方法に関する。本方法は、エンコードされたオーディオ・ビットストリームを受領し、オーディオ・データをデコードして、デコードされた低域オーディオ信号を生成することを含む。本方法はさらに、高周波再構成メタデータを抽出し、デコードされた低域オーディオ信号を分解フィルタバンクでフィルタリングして、フィルタリングされた低域オーディオ信号を生成することを含む。本方法はさらに、スペクトル並進または高調波転換のどちらが前記オーディオ・データに対して実行されるべきかを示すフラグを抽出し、該フラグに従って、前記フィルタリングされた低域オーディオ信号および前記高周波再構成メタデータを使って前記オーディオ信号の高域部分を再生成することを含む。最後に、本方法は、前記フィルタリングされた低域オーディオ信号および再生成された高域部分を組み合わせて、広帯域オーディオ信号を形成することを含む。
【0008】
第二のクラスの実施形態は、エンコードされたオーディオ・ビットストリームをデコードするためのオーディオ・デコーダに関する。本デコーダは、エンコードされたオーディオ・ビットストリームを受領するための入力インターフェースであって、該エンコードされたオーディオ・ビットストリームは、オーディオ信号の低域部分を表わすオーディオ・データを含む、入力インターフェースと、前記オーディオ・データをデコードして、デコードされた低域オーディオ信号を生成するコア・デコーダとを含む。本デコーダはまた、前記エンコードされたオーディオ・ビットストリームから高周波再構成メタデータを抽出するためのデマルチプレクサであって、前記高周波再構成メタデータは、前記オーディオ信号の低域部分から、連続するいくつかのサブバンドを前記オーディオ信号の高域部分に線形に並進させる高周波再構成プロセスのための動作パラメータを含む、デマルチプレクサと、前記デコードされた低域オーディオ信号をフィルタリングして、フィルタリングされた低域オーディオ信号を生成する分解フィルタバンクとを含む。本デコーダはさらに、前記エンコードされたオーディオ・ビットストリームから、線形並進または高調波転換のどちらが前記オーディオ・データに対して実行されるべきかを示すフラグを抽出するデマルチプレクサと、該フラグに従って、前記フィルタリングされた低域オーディオ信号および前記高周波再構成メタデータを使って前記オーディオ信号の高域部分を再生成する高周波再生成器とを含む。最後に、本デコーダは、前記フィルタリングされた低域オーディオ信号および再生成された高域部分を組み合わせて、広帯域オーディオ信号を形成する合成フィルタバンクを含む。
【0009】
他のクラスの実施形態は、向上スペクトル帯域複製(eSBR: enhanced spectral band replication)処理が実行されるべきかどうかを同定するメタデータを含むオーディオ・ビットストリームをエンコードおよびトランスコードすることに関する。
【図面の簡単な説明】
【0010】
本発明の方法のある実施形態を実行するよう構成されうるシステムの実施形態のブロック図である。
本発明のオーディオ処理ユニットの実施形態であるエンコーダのブロック図である。
本発明のオーディオ処理ユニットの実施形態であるデコーダと、任意的にはそれに結合された後処理器をも含むシステムのブロック図である。
本発明のオーディオ処理ユニットの実施形態であるデコーダのブロック図である。
本発明のオーディオ処理ユニットのもう一つの実施形態であるデコーダのブロック図である。
本発明のオーディオ処理ユニットのもう一つの実施形態のブロック図である。
分割されたセグメントを含むMPEG-4 AACビットストリームのブロックを示す図である。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

NOK株式会社
吸音構造体
23日前
三井化学株式会社
遮音構造体
今日
三井化学株式会社
遮音構造体
今日
個人
弦楽器用押弦補助具及び弦楽器
今日
三井化学株式会社
遮音構造体
7日前
林テレンプ株式会社
防音カバー
今日
株式会社ドクター中松創研
歌及び歌の制作方法
10日前
株式会社ワコール
繊維構造体
22日前
株式会社JVCケンウッド
車載装置
1日前
株式会社大同工業所
警報器及び警報システム
23日前
個人
電気自動車等の「接近音」における最適な「音の種類」
3日前
株式会社HOWA
遮音構造
7日前
カシオ計算機株式会社
楽器
7日前
株式会社第一興商
カラオケ装置
24日前
個人
電子管楽器
今日
TDK株式会社
振動デバイスおよびその振動方法
27日前
川上産業株式会社
吸音シート
14日前
ヤマハ株式会社
発音制御装置
1日前
ヤマハ株式会社
鍵盤装置用の鍵
16日前
AOBAENERGY株式会社
サービス提供機器
今日
トヨタ自動車株式会社
電気自動車
2日前
株式会社エクサウィザーズ
情報処理方法、プログラム及び情報処理システム
23日前
株式会社エクシング
携帯端末用プログラム、及び、カラオケシステム
22日前
トヨタ自動車株式会社
車両用ホーンシステム
28日前
トヨタ自動車株式会社
音響式遮音材の製造方法
1日前
株式会社パトライト
メール読み上げテキスト生成プログラム
14日前
ヤマハ株式会社
音響測定装置、音響測定方法および音響測定プログラム
1日前
ソニーグループ株式会社
情報処理装置、情報処理方法、およびプログラム
16日前
カシオ計算機株式会社
音響処理装置、音響処理システム、音響処理方法及びプログラム
8日前
トヨタ自動車株式会社
車両管理システム及び電気自動車
2日前
ピクシーダストテクノロジーズ株式会社
遮音システムおよび区画設備
16日前
ヤマハ株式会社
音響処理方法、音響処理システムおよびプログラム
14日前
株式会社ブリヂストン
情報処理装置及びその制御方法、並びに、プログラム
8日前
株式会社ブリヂストン
情報処理装置及びその制御方法、並びに、プログラム
8日前
株式会社ブリヂストン
情報処理装置及びその制御方法、並びに、プログラム
8日前
Strings Audio Lab合同会社
弦楽器保持装置及び単数又は複数弦楽器の配置方法
27日前
続きを見る