TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025026913
公報種別
公開特許公報(A)
公開日
2025-02-26
出願番号
2024197887,2024101600
出願日
2024-11-13,2019-01-28
発明の名称
オーディオ信号の高周波再構成を行う方法及びオーディオ処理ユニット
出願人
ドルビー・インターナショナル・アーベー
代理人
弁理士法人ITOH
主分類
G10L
21/0388 20130101AFI20250218BHJP(楽器;音響)
要約
【課題】スペクトル・バンド複製を改善するための符号化された音声ビットストリームをデコードする方法及びオーディオ処理ユニットを提供する。
【解決手段】方法は、配信サブシステムがエンコーダで符号化された音声ビットストリームを受信するステップと、デコーダが復号化されたローバンド音声信号を生成するために音声データを復号化するステップと、後処理ユニットが、デコーダからのデコードされたオーディオ・データのストリームを受け入れ、それに対して後処理を実行し、かつ、後処理されたオーディオ・コンテンツを、1つ以上のスピーカによる再生のためにレンダリングするステップと、を含む。
【選択図】図1
特許請求の範囲
【請求項1】
オーディオ信号の高周波再構成を実行する方法であって:
エンコードされたオーディオ・ビットストリームを受信するステップであって、前記エンコードされたオーディオ・ビットストリームは前記オーディオ信号のローバンド部分を表すオーディオ・データと高周波再構成メタデータとを含む、ステップ;
デコードされたローバンド・オーディオ信号を生成するために前記オーディオ・データをデコードするステップ;
前記高周波再構成メタデータを前記エンコードされたオーディオ・ビットストリームから抽出するステップであって、前記高周波再構成メタデータは、高周波再構成プロセスの動作パラメータを含み、前記動作パラメータは、前記エンコードされたオーディオ・ビットストリームの後方互換性のある拡張コンテナ内に位置するパッチ処理モード・パラメータを含み、第1値の前記パッチ処理モード・パラメータはスペクトル変換を示し、第2値の前記パッチ処理モード・パラメータは位相ボコーダ周波数拡散によるハーモニック・トランスポジションを示す、ステップ;
フィルタリングされたローバンド・オーディオ信号を生成するために、前記デコードされたローバンド・オーディオ信号をフィルタリングするステップ;及び
前記フィルタリングされたローバンド・オーディオ信号及び前記高周波再構成メタデータを利用して前記オーディオ信号のハイバンド部分を再生成するステップであって、前記再生成は前記パッチ処理モード・パラメータが前記第1値である場合にはスペクトル変換を含み、前記再生成は前記パッチ処理モード・パラメータが前記第2値である場合には位相ボコーダ周波数拡散によるハーモニック・トランスポジションを含む、ステップ;
を含み、前記後方互換性のある拡張コンテナにおいて制御データの特定の要素がサイマルキャストされ、前記制御データの特定の要素は、信号を再生成する際に使用するためのインバース・フィルタリング制御データ、ノイズ・フロア制御データ、及び欠落高調波制御データのうちの少なくとも1つを含む、方法。
続きを表示(約 1,200 文字)
【請求項2】
前記後方互換性のある拡張コンテナは、前記パッチ処理モード・パラメータが前記第2値に等しい場合に使用されるべきインバース・フィルタリング制御データを含む、請求項1に記載の方法。
【請求項3】
前記後方互換性のある拡張コンテナは、前記パッチ処理モード・パラメータが前記第2値に等しい場合に使用されるべき欠落高調波制御データを更に含む、請求項1に記載の方法。
【請求項4】
位相シフトは、前記フィルタリングの後に、前記フィルタリングされたローバンド・オーディオ信号に付加され、本方法の複雑性を減らすために合成の前に補償される、請求項1に記載の方法。
【請求項5】
プロセッサにより実行されると請求項1に記載の方法を実行させる命令を含む非一時的なコンピュータ読み取り可能な記憶媒体。
【請求項6】
オーディオ信号の高周波再構成を実行するオーディオ処理ユニットであって:
エンコードされたオーディオ・ビットストリームを受信する入力インターフェースであって、前記エンコードされたオーディオ・ビットストリームは前記オーディオ信号のローバンド部分を表すオーディオ・データと高周波再構成メタデータとを含む、入力インターフェース;
デコードされたローバンド・オーディオ信号を生成するために前記オーディオ・データをデコードするコア・オーディオ・デコーダ;
前記高周波再構成メタデータを前記エンコードされたオーディオ・ビットストリームから抽出するデフォーマッタであって、前記高周波再構成メタデータは、高周波再構成プロセスの動作パラメータを含み、前記動作パラメータは、フィル要素であって前記フィル要素の始まりを示す識別子を有するものと前記識別子の後にあるフィル・データとを含む、デフォーマッタ;
フィルタリングされたローバンド・オーディオ信号を生成するために、前記デコードされたローバンド・オーディオ信号をフィルタリングする分析フィルタバンク;及び
前記フィルタリングされたローバンド・オーディオ信号及び前記高周波再構成メタデータを利用して前記オーディオ信号のハイバンド部分を再生成する高周波再生成部であって、前記再生成は前記パッチ処理モード・パラメータが前記第1値である場合にはスペクトル変換を含み、前記再生成は前記パッチ処理モード・パラメータが前記第2値である場合には位相ボコーダ周波数拡散によるハーモニック・トランスポジションを含む、高周波再生成部;
を含み、前記後方互換性のある拡張コンテナにおいて制御データの特定の要素がサイマルキャストされ、前記制御データの特定の要素は、信号を再生成する際に使用するためのインバース・フィルタリング制御データ、ノイズ・フロア制御データ、及び欠落高調波制御データのうちの少なくとも1つを含む、オーディオ処理ユニット。
発明の詳細な説明
【背景技術】
【0001】
関連出願の相互参照
本願は以下の出願に基づく優先権を主張しており、これは本願で援用されている:2018年1月26日付で出願された米国仮出願第62/622,205号。
続きを表示(約 3,300 文字)
【0002】
技術分野
実施形態はオーディオ信号処理に関連し、より具体的には、高周波再構成(HFR)のベーシック形式又はHFRのエンハンスト形式の何れかがオーディオ・データに関して実行されるべきことを指定する制御データによるオーディオ・ビットストリームのエンコーディング、デコーディング、又はトランスコーディングに関連する。
【0003】
発明の背景
典型的なオーディオ・ビットストリームは、オーディオ・コンテンツの1つ以上のチャネルを示すオーディオ・データ(例えば、符号化されたオーディオ・データ)と、オーディオ・データ又はオーディオ・コンテンツの少なくとも1つの特徴を示すメタデータとの両方を含む。符号化されたオーディオ・ビットストリームを生成するためのよく知られたフォーマットの1つは、MPEG-4アドバンスト・オーディオ・コーディング(AAC)フォーマットであり、これはMPEG規格ISO/IEC14496-3:2009に記載されている。MPEG4規格では、AACは「アドバンスト・オーディオ・コーディング」を意味し、HE-AACは「高効率アドバンスト・オーディオ・コーディング」を意味する。
【0004】
MPEG-4AAC規格は、オブジェクト及び符号化ツールが準拠するエンコーダ又はデコーダに存在することを判定する幾つかのオーディオ・プロファイルを定義している。これらのオーディオ・プロファイルのうちの3つは、(1)AACプロファイル、(2)HE-AACプロファイル、及び(3)HE-AAC v2プロファイルである。AACプロファイルは、AAC低複雑性(又は「AAC-LC」)オブジェクト・タイプを含む。AAC-LCオブジェクトは、若干の調整を伴うMPEG-2AAC低複雑性プロファイルに対応するものであり、スペクトル・バンド複製(「SBR」)オブジェクト・タイプもパラメトリック・ステレオ(「PS」)オブジェクト・タイプも含まない。HE-AACプロファイルは、AACプロファイルのスーパーセットであり、SBRオブジェクト・タイプを追加的に含む。HE-AACv2プロファイルは、HE-AACプロファイルのスーパーセットであり、PSオブジェクト・タイプを追加的に含む。
【0005】
SBRオブジェクト・タイプはスペクトル・バンド複製ツールを含み、これは知覚音声コーデックの圧縮効率を著しく改善する重要な高周波再構成(「HFR」)符号化ツールである。SBRは、受信機側で(例えば、デコーダにおいて)オーディオ信号の高周波成分を再構成する。従って、エンコーダは、低周波成分を符号化し、送信することだけを必要とし、低いデータ・レートで非常に高いオーディオ品質を可能にする。SBRは、エンコーダから得られる制御データ及び利用可能な帯域幅制限信号から、データ・レートを低減するために事前に打ち切られた高調波のシーケンスを複製することに基づいている。トーン成分(tonal)及びノイズ成分の間の比率は、ノイズと正弦波の選択的な付加に加えて、適応逆フィルタリングによって維持される。MPEG-4AAC規格では、SBRツールはスペクトル・パッチ処理(線形変換又はスペクトル変換とも呼ばれる)を実行し、この場合、多数の連続した直交ミラー・フィルタ(QMF)サブバンドが、デコーダで生成された、オーディオ信号の送信されたローバンド部分から、オーディオ信号のハイバンド部分へコピーされる(又は「パッチ」される)。
【0006】
スペクトル・パッチ処理又は線形変換は、比較的低いクロスオーバー周波数を伴う音楽コンテンツのような特定のオーディオ・タイプには理想的ではないかもしれない。従って、スペクトル・バンド複製を改善するための技術が必要とされる。
【発明の概要】
【0007】
第1クラスの実施形態に関し、符号化されたオーディオ・ビットストリームをデコードするための方法が開示される。方法は、符号化されたオーディオ・ビットストリームを受信するステップと、デコードされたローバンド・オーディオ信号を生成するためにオーディオ・データをデコードするステップとを含む。方法は、更に、高周波再構成メタデータを抽出するステップと、デコードされたローバンド・オーディオ信号を分析フィルタバンクでフィルタリングして、フィルタリングされたローバンド・オーディオ信号を生成するステップとを含む。方法は、オーディオ・データに対してスペクトル変換又は高調波トランスポジションのいずれが実行されるべきかを示すフラグを抽出するステップと、フラグに従って高周波再構成メタデータ及びフィルタリングされたローバンド・オーディオ信号を用いてオーディオ信号のハイバンド部分を再生成するステップとを更に含む。最後に、方法は、フィルタリングされたローバンド・オーディオ信号と再生成されたハイバンド部分とを組み合わせて広帯域オーディオ信号を形成するステップを含む。
【0008】
第2クラスの実施形態は、符号化されたオーディオ・ビットストリームを復号化するためのオーディオ・デコーダに関する。デコーダは、符号化されたオーディオ・ビットストリームを受信するための入力インターフェース(符号化されたオーディオ・ビットストリームは、オーディオ信号のローバンド部分を表すオーディオ・データを含む)と、デコードされたローバンド・オーディオ信号を生成するためにオーディオ・データをデコードするコア・デコーダとを含む。デコーダはまた、符号化されたオーディオ・ビットストリーム高周波再構成メタデータから抽出するためのデマルチプレクサ(高周波再構成メタデータは、オーディオ信号のローバンド部分からオーディオ信号のハイバンド部分へ、連続する数のサブバンドを線形に変換する高周波再構成プロセスのための動作パラメータを含む)と、デコードされたローバンド・オーディオ信号をフィルタリングして、フィルタリングされたローバンド・オーディオ信号を生成するための分析フィルタバンクとを含む。デコーダは更に、オーディオ・データに対して線形変換又は高調波トランスポジションのいずれが実行されるべきかを示すフラグを、符号化されたオーディオ・ビットストリームから抽出するためのデマルチプレクサと、フラグに従って高周波再構成メタデータ及びフィルタリングされたローバンド・オーディオ信号を使用してオーディオ信号のハイバンド部分を再生成するための高周波再生器とを含む。最後に、デコーダは、広帯域オーディオ信号を形成するために、フィルタリングされたローバンド・オーディオ信号と再生成されたハイバンド部分とを組み合わせるための合成フィルタバンクを含む。
【0009】
他のクラスの実施形態は、強化されたスペクトル・バンド複製(eSBR)処理が実行されるべきかどうかを識別するメタデータを含むオーディオ・ビットストリームをエンコード及びトランスコーディングすることに関する。
【図面の簡単な説明】
【0010】
本発明の方法の実施形態を実施するように構成される可能性のあるシステムの実施形態のブロック図である。
本発明のオーディオ処理ユニットの実施形態であるエンコーダのブロック図である。
本発明のオーディオ処理ユニットの実施形態であるデコーダと、オプションとしてそれに結合されたポスト・プロセッサとを含むシステムのブロック図である。
本発明のオーディオ処理ユニットの実施形態であるデコーダのブロック図である。
本発明のオーディオ処理ユニットの別の実施形態であるデコーダのブロック図である。
本発明のオーディオ処理ユニットの別の実施形態のブロック図である。
分割されたセグメントを含むMPEG-4AACビットストリームのブロックの図を示す。
【発明を実施するための形態】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
アクセサリー型集音器
今日
横浜ゴム株式会社
音響材
7日前
横浜ゴム株式会社
音響材
7日前
横浜ゴム株式会社
音響材
7日前
横浜ゴム株式会社
水中音響材
10日前
ヤマハ株式会社
ヘルムホルツ共鳴器
1か月前
大和ハウス工業株式会社
音再現設備
14日前
岡山県
吸音構造
7日前
セイコーエプソン株式会社
吸音ボード
28日前
日産自動車株式会社
防音構造体
28日前
株式会社第一興商
カラオケ装置
6日前
株式会社第一興商
カラオケ装置
1か月前
株式会社第一興商
カラオケ装置
14日前
コスモネクスト株式会社
入力支援プログラム及び入力支援方法
21日前
京セラ株式会社
音出力装置及び音出力方法
28日前
日本放送協会
音声認識装置およびプログラム
28日前
本田技研工業株式会社
能動型騒音低減装置
6日前
本田技研工業株式会社
能動型騒音低減装置
6日前
本田技研工業株式会社
能動型騒音低減装置
28日前
本田技研工業株式会社
能動型騒音低減装置
1か月前
個人
発音体モジュール
1日前
カシオ計算機株式会社
楽器用電子機器
6日前
株式会社アナザーウェア
鍵盤画面表示プログラム及びそのシステム
1か月前
トヨタ自動車株式会社
異音診断システム
1か月前
株式会社永セ仁
「パワハラ」等ハラスメント発言に係る職場環境測定システム
10日前
株式会社コルグ
音波生成装置、音波生成方法、プログラム
21日前
ソフトバンクグループ株式会社
行動制御システム
21日前
株式会社AZSTOKE
調整装置、およびプログラム
6日前
本田技研工業株式会社
音声認識装置、音声認識方法、およびプログラム
13日前
永楽電気株式会社
放送音声文字化システム及び放送設備における故障診断方法
28日前
ヤマハ株式会社
響板、その製造方法および響板を備える楽器
13日前
東日本電信電話株式会社
演奏補助装置、演奏補助方法、及び、演奏補助プログラム
13日前
パイオニア株式会社
情報処理装置
15日前
ドーナッツロボティクス株式会社
音声処理システム、音声処理方法
21日前
ヤマハ株式会社
信号生成方法、表示制御方法およびプログラム
7日前
株式会社イノアックコーポレーション
防音カバー
6日前
続きを見る
他の特許を見る