TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025098212
公報種別
公開特許公報(A)
公開日
2025-07-01
出願番号
2025054686,2023173392
出願日
2025-03-28,2018-03-19
発明の名称
オーディオ信号の高周波再構成のための高調波転換器の後方互換な統合
出願人
ドルビー・インターナショナル・アーベー
代理人
弁理士法人ITOH
主分類
G10L
21/0388 20130101AFI20250624BHJP(楽器;音響)
要約
【課題】スペクトル・バンド複製を改善するための符号化された音声ビットストリームをデコードする方法及び記憶媒体を提供する。
【解決手段】方法は、エンコードされたオーディオ・ビットストリームを受領し、オーディオ・データをデコードして、デコードされた低域オーディオ信号を生成することを含む。方法はまた、高周波再構成メタデータを抽出し、デコードされた低域オーディオ信号を分解フィルタバンクでフィルタリングして、フィルタリングされた低域オーディオ信号を生成することを含む。方法はさらに、スペクトル並進または高調波転換のどちらが前記オーディオ・データに対して実行されるべきかを示すフラグを抽出し、該フラグに従って、前記フィルタリングされた低域オーディオ信号および前記高周波再構成メタデータを使って前記オーディオ信号の高域部分を再生成することを含む。
【選択図】なし
特許請求の範囲
【請求項1】
エンコードされたオーディオ・ビットストリームをデコードする方法であって、当該方法は:
エンコードされたオーディオ・ビットストリームを受領する段階であって、前記エンコードされたオーディオ・ビットストリームはオーディオ信号の低域部分を表わすオーディオ・データを含み、前記エンコードされたオーディオ・ビットストリームがさらに充填要素を含み、該充填要素は、該充填要素の先頭を示す識別子と、該識別子の後の充填データとをもち、前記識別子が、0x6の値をもつ、三ビットの、最上位ビットが最初に伝送される符号なし整数であり、前記充填データが拡張ペイロードを含み、前記拡張ペイロードがスペクトル帯域複製拡張データを含み、前記拡張ペイロードは、「1101」または「1110」の値をもつ、四ビットの、最上位ビットが最初に伝送される符号なし整数を用いて同定される、段階と;
前記オーディオ・データをデコードして、デコードされた低域オーディオ信号を生成する段階と;
前記エンコードされたオーディオ・ビットストリームから、高周波再構成メタデータを抽出する段階であって、前記高周波再構成メタデータは、前記オーディオ信号の低域部分から、連続するいくつかのサブバンドを前記オーディオ信号の高域部分に線形並進する高周波再構成プロセスのためにチューニングされた線形並進動作パラメータを含み、前記線形並進動作パラメータは、正弦波追加情報を含む、段階と;
前記デコードされた低域オーディオ信号を分解フィルタバンクでフィルタリングして、フィルタリングされた低域オーディオ信号を生成する段階と;
前記エンコードされたオーディオ・ビットストリームから、線形並進または高調波転換のどちらが前記オーディオ・データに対して実行されるべきかを示すフラグを抽出する段階と;
前記フラグが、高調波転換が前記オーディオ・データに対して実行されるべきであることを示す場合:
前記フィルタリングされた低域オーディオ信号および前記正弦波追加情報を含む前記高周波再構成メタデータを使って高調波転換を実行することによって、前記オーディオ信号の高域部分を再生成する段階であって、前記正弦波追加情報は、線形並進処理のためにエンコードされたものであるにもかかわらず高調波転換のために再利用される、段階と;
前記フィルタリングされた低域オーディオ信号および再生成された高域部分を組み合わせて、広帯域オーディオ信号を形成する段階とを含み、
前記分解フィルタバンクが、
TIFF
2025098212000014.tif
12
170
に基づく、プロトタイプ・フィルタp
0
(n)の変調されたバージョンである分解フィルタh
k
(n)を含み、p
0
(n)は実数値の対称または非対称プロトタイプ・フィルタであり、Mは前記分解フィルタバンクにおけるチャネル数であり、Nはプロトタイプ・フィルタ次数である、
方法。
続きを表示(約 1,400 文字)
【請求項2】
プロセッサによって実行されたときに前記プロセッサに請求項1記載の方法を実行させる命令を有するコンピュータ・プログラム。
【請求項3】
エンコードされたオーディオ・ビットストリームをデコードするためのデコーダであって、当該デコーダは:
エンコードされたオーディオ・ビットストリームを受領するための入力インターフェースであって、該エンコードされたオーディオ・ビットストリームは、オーディオ信号の低域部分を表わすオーディオ・データを含み、前記エンコードされたオーディオ・ビットストリームがさらに充填要素を含み、該充填要素は、該充填要素の先頭を示す識別子と、該識別子の後の充填データとをもち、前記識別子が、0x6の値をもつ、三ビットの、最上位ビットが最初に伝送される符号なし整数であり、前記充填データが拡張ペイロードを含み、前記拡張ペイロードがスペクトル帯域複製拡張データを含み、前記拡張ペイロードは、「1101」または「1110」の値をもつ、四ビットの、最上位ビットが最初に伝送される符号なし整数を用いて同定される、入力インターフェースと;
前記オーディオ・データをデコードして、デコードされた低域オーディオ信号を生成するコア・デコーダと;
前記エンコードされたオーディオ・ビットストリームから、高周波再構成メタデータを抽出するためのフォーマット解除器であって、前記高周波再構成メタデータは、前記オーディオ信号の低域部分から、連続するいくつかのサブバンドを前記オーディオ信号の高域部分に線形並進する高周波再構成プロセスのためにチューニングされた線形並進動作パラメータを含み、前記線形並進動作パラメータは、正弦波追加情報を含む、フォーマット解除器と;
前記デコードされた低域オーディオ信号をフィルタリングして、フィルタリングされた低域オーディオ信号を生成する分解フィルタバンクと;
前記エンコードされたオーディオ・ビットストリームから、線形並進または高調波転換のどちらが前記オーディオ・データに対して実行されるべきかを示すフラグを抽出するフォーマット解除器と;
前記フラグが、高調波転換が前記オーディオ・データに対して実行されるべきであることを示す場合、前記フィルタリングされた低域オーディオ信号および前記正弦波追加情報を含む前記高周波再構成メタデータを使って高調波転換を実行することによって、前記オーディオ信号の高域部分を再生成する高周波再生成器であって、であって、前記正弦波追加情報は、線形並進処理のためにエンコードされたものであるにもかかわらず高調波転換のために再利用される、高調波再生器と;
前記フィルタリングされた低域オーディオ信号および再生成された高域部分を組み合わせて、広帯域オーディオ信号を形成する合成フィルタバンクとを有しており、
前記分解フィルタバンクが、
TIFF
2025098212000015.tif
12
170
に基づく、プロトタイプ・フィルタp
0
(n)の変調されたバージョンである分解フィルタh
k
(n)を含み、p
0
(n)は実数値の対称または非対称プロトタイプ・フィルタであり、Mは前記分解フィルタバンクにおけるチャネル数であり、Nはプロトタイプ・フィルタ次数である、
デコーダ。
発明の詳細な説明
【技術分野】
【0001】
実施形態はオーディオ信号処理に関し、より詳細には高周波再構成(HFR: high frequency reconstruction)の基本形またはHFRの向上形のいずれかがオーディオ・データに対して実行されるべきであることを指定する制御データをもつオーディオ・ビットストリームのエンコード、デコードまたはトランスコードに関する。
続きを表示(約 3,500 文字)
【背景技術】
【0002】
典型的なオーディオ・ビットストリームは、オーディオ・コンテンツの一つまたは複数のチャネルを示すオーディオ・データ(たとえばエンコードされたオーディオ・データ)と、前記オーディオ・データまたはオーディオ・コンテンツの少なくとも一つの特性を示すメタデータとの両方を含む。エンコードされたオーディオ・ビットストリームを生成するための一つのよく知られたフォーマットは、MPEG規格ISO/IEC14496-3:2009に記載されるMPEG-4先進オーディオ符号化(AAC: Advanced Audio Coding)フォーマットである。MPEG-4規格では、AACは「advanced audio coding(先進オーディオ符号化)」を表わし、HE-AACは「high-efficiency advanced audio coding(高効率先進オーディオ符号化)」を表わす。
【0003】
MPEG-4 AAC規格はいくつかのオーディオ・プロファイルを定義しており、それらのオーディオ・プロファイルが、準拠エンコーダまたはデコーダにおいてどのオブジェクトおよび符号化ツールが存在しているかを決める。これらのオーディオ・プロファイルのうちの三つは、(1)AACプロファイル、(2)HE-AACプロファイルおよび(3)HE-AAC v2プロファイルである。AACプロファイルはAAC低計算量(AAC low complexity)(または「AAC-LC」)オブジェクト型を含む。AAC-LCオブジェクトは、若干の調整はあるがMPEG-2 AAC低計算量プロファイルに対応するものであり、スペクトル帯域複製(spectral band replication)(「SBR」)オブジェクト型もパラメトリック・ステレオ(parametric stereo)(「PS」)オブジェクト型も含まない。HE-AACプロファイルはAACプロファイルの上位集合であって、追加的にSBRオブジェクト型を含む。HE-AAC v2プロファイルはHE-AACプロファイルの上位集合であって、追加的にPSオブジェクト型を含む。
【0004】
SBRオブジェクト型は、スペクトル帯域複製ツールを含む。これは、知覚的オーディオ・コーデックの圧縮効率を著しく改善する重要な高周波再構成(「HFR」)符号化ツールである。SBRは受信器側で(たとえばデコーダにおいて)オーディオ信号の高周波数成分を再構成する。そのため、エンコーダは低周波数成分をエンコードして伝送するだけでよく、低データ・レートにおいてずっと高いオーディオ品質を許容する。SBRは、データ・レートを削減するために以前に打ち切りされた高調波のシーケンスを、エンコーダから得られる利用可能な帯域幅制限された信号および制御データから複製することに基づく。トーン様成分とノイズ様成分の間の比は適応的な逆フィルタリングならびにノイズおよび正弦波の任意的な追加によって維持される。MPEG-4 AAC規格では、SBRツールは、いくつかの連続する直交ミラー・フィルタ(QMF)サブバンドがオーディオ信号の伝送された低域部分から、デコーダにおいて生成されるオーディオ信号の高域部分にコピーされる(または「パッチ」される)、スペクトル・パッチング(spectral patching)(線形並進(linear translation)またはスペクトル並進(spectral translation)とも呼ばれる)を実行する。
【先行技術文献】
【非特許文献】
【0005】
MPEG規格ISO/IEC14496-3:2009
【発明の概要】
【発明が解決しようとする課題】
【0006】
スペクトル・パッチングまたは線形並進は、比較的低いクロスオーバー周波数をもつ音楽コンテンツのようなある種のオーディオ型については理想的ではないことがある。したがって、スペクトル帯域複製を改善するための技法が必要とされている。
【課題を解決するための手段】
【0007】
第一のクラスの実施形態は、エンコードされたオーディオ・ビットストリームをデコードする方法に関する。本方法は、エンコードされたオーディオ・ビットストリームを受領し、オーディオ・データをデコードして、デコードされた低域オーディオ信号を生成することを含む。本方法はさらに、高周波再構成メタデータを抽出し、デコードされた低域オーディオ信号を分解フィルタバンクでフィルタリングして、フィルタリングされた低域オーディオ信号を生成することを含む。本方法はさらに、スペクトル並進または高調波転換のどちらが前記オーディオ・データに対して実行されるべきかを示すフラグを抽出し、該フラグに従って、前記フィルタリングされた低域オーディオ信号および前記高周波再構成メタデータを使って前記オーディオ信号の高域部分を再生成することを含む。最後に、本方法は、前記フィルタリングされた低域オーディオ信号および再生成された高域部分を組み合わせて、広帯域オーディオ信号を形成することを含む。
【0008】
第二のクラスの実施形態は、エンコードされたオーディオ・ビットストリームをデコードするためのオーディオ・デコーダに関する。本デコーダは、エンコードされたオーディオ・ビットストリームを受領するための入力インターフェースであって、該エンコードされたオーディオ・ビットストリームは、オーディオ信号の低域部分を表わすオーディオ・データを含む、入力インターフェースと、前記オーディオ・データをデコードして、デコードされた低域オーディオ信号を生成するコア・デコーダとを含む。本デコーダはまた、前記エンコードされたオーディオ・ビットストリームから高周波再構成メタデータを抽出するためのデマルチプレクサであって、前記高周波再構成メタデータは、前記オーディオ信号の低域部分から、連続するいくつかのサブバンドを前記オーディオ信号の高域部分に線形に並進させる高周波再構成プロセスのための動作パラメータを含む、デマルチプレクサと、前記デコードされた低域オーディオ信号をフィルタリングして、フィルタリングされた低域オーディオ信号を生成する分解フィルタバンクとを含む。本デコーダはさらに、前記エンコードされたオーディオ・ビットストリームから、線形並進または高調波転換のどちらが前記オーディオ・データに対して実行されるべきかを示すフラグを抽出するデマルチプレクサと、該フラグに従って、前記フィルタリングされた低域オーディオ信号および前記高周波再構成メタデータを使って前記オーディオ信号の高域部分を再生成する高周波再生成器とを含む。最後に、本デコーダは、前記フィルタリングされた低域オーディオ信号および再生成された高域部分を組み合わせて、広帯域オーディオ信号を形成する合成フィルタバンクを含む。
【0009】
他のクラスの実施形態は、向上スペクトル帯域複製(eSBR: enhanced spectral band replication)処理が実行されるべきかどうかを同定するメタデータを含むオーディオ・ビットストリームをエンコードおよびトランスコードすることに関する。
【図面の簡単な説明】
【0010】
本発明の方法のある実施形態を実行するよう構成されうるシステムの実施形態のブロック図である。
本発明のオーディオ処理ユニットの実施形態であるエンコーダのブロック図である。
本発明のオーディオ処理ユニットの実施形態であるデコーダと、任意的にはそれに結合された後処理器をも含むシステムのブロック図である。
本発明のオーディオ処理ユニットの実施形態であるデコーダのブロック図である。
本発明のオーディオ処理ユニットのもう一つの実施形態であるデコーダのブロック図である。
本発明のオーディオ処理ユニットのもう一つの実施形態のブロック図である。
分割されたセグメントを含むMPEG-4 AACビットストリームのブロックを示す図である。
【発明を実施するための形態】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
弦楽器用押弦補助具及び弦楽器
20日前
三井化学株式会社
遮音構造体
20日前
三井化学株式会社
遮音構造体
20日前
三井化学株式会社
吸音構造体
15日前
林テレンプ株式会社
防音カバー
20日前
株式会社JVCケンウッド
車載装置
21日前
株式会社総合車両製作所
吸音パネル
14日前
個人
電気自動車等の「接近音」における最適な「音の種類」
23日前
株式会社レゾナック
吸音材及び車両部材
7日前
株式会社JVCケンウッド
情報処理装置及び情報処理方法
15日前
個人
電子管楽器
20日前
株式会社第一興商
カラオケ装置
15日前
株式会社第一興商
カラオケ装置
14日前
株式会社コルグ
電子楽器用アナログエフェクタ
13日前
ヤマハ株式会社
連打判定装置および方法、プログラム
1日前
ヤマハ株式会社
発音制御装置
21日前
AOBAENERGY株式会社
サービス提供機器
20日前
トヨタ自動車株式会社
電気自動車
22日前
トヨタ自動車株式会社
音響式遮音材の製造方法
21日前
井関農機株式会社
作業車の操縦者用騒音低減装置
14日前
ローランド株式会社
鍵盤装置および鍵の揺動の規制方法
15日前
ローランド株式会社
鍵盤装置および押鍵情報の検出方法
15日前
日本電波工業株式会社
音声再生装置及び音声再生方法
14日前
ローランド株式会社
鍵盤装置および押鍵情報の検出方法
15日前
ヤマハ株式会社
音響測定装置、音響測定方法および音響測定プログラム
21日前
ブラザー工業株式会社
カラオケシステム、及び、カラオケ装置
15日前
トヨタ自動車株式会社
車両管理システム及び電気自動車
22日前
株式会社丸高工業
防音板及びその附属品
15日前
ブラザー工業株式会社
カラオケシステム、カラオケ装置、及びカラオケ装置用のプログラム
14日前
株式会社石森管楽器
リガチャーおよび楽器
13日前
株式会社イノアックコーポレーション
消音器、シールプレート及びフェンダーライナー
13日前
ブラザー工業株式会社
端末装置用のカラオケプログラム、端末装置の制御方法、及び端末装置
14日前
カシオ計算機株式会社
プログラム、情報処理装置、電子楽器及び表示方法
20日前
ヤマハ株式会社
演奏操作装置
6日前
エルジー ディスプレイ カンパニー リミテッド
ノイズキャンセリングシステム
20日前
ヤマハ株式会社
加振装置及び加振システム
13日前
続きを見る
他の特許を見る