TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024056001
公報種別公開特許公報(A)
公開日2024-04-19
出願番号2024033809,2022196162
出願日2024-03-06,2011-04-06
発明の名称デコーダシステム、デコーディング方法及びコンピュータプログラム
出願人ドルビー・インターナショナル・アーベー
代理人個人,個人,個人
主分類G10L 19/008 20130101AFI20240412BHJP(楽器;音響)
要約【課題】高ビットレートレンジにおいても計算効率の高いステレオ符号化をする方法と装置を提供する。
【解決手段】
本発明は、周波数領域における複素予測を用いたステレオ符号化及び復号の方法及び装置を提供する。一実施形態において、複素予測符号化によりエンコードされた、2つの入力チャンネルを表す第1の周波数領域表示を有する入力ステレオ信号から出力ステレオ信号を求める復号方法は、(i)第1の入力チャンネルの第2の周波数領域表示を計算するアップミキシングステップと、(ii)前記第1の入力チャンネルの第1と第2の周波数領域表示と、前記第2の入力チャンネルの第1の周波数領域表示と、複素予測係数とに基づいて、出力チャンネルを計算するアップミキシングステップとを有する。アップミキシングは制御データに応じて中断できる。
【選択図】図2
特許請求の範囲【請求項1】
複素予測ステレオコーディングによってステレオ信号を提供するためのデコーダシステムであって、
ダウンミックス信号および残差信号の第1の周波数領域表現に基づいて前記ステレオ信号を生成するように適合されたアップミックス段階であって、前記第1の周波数領域表現の各々は、多次元空間の第1の部分空間において表現される対応する信号のスペクトルコンテンツを表す第1のスペクトル成分を含む、アップミックス段階を有し、前記アップミックス段階は、
前記ダウンミックス信号の前記第1の周波数領域表現に基づいて前記ダウンミックス信号の第2の周波数領域表現を計算するモジュールであって、前記第2の周波数領域表現は、前記第1の部分空間に含まれない前記多次元空間の一部を含む前記多次元空間の第2の部分空間において表現される前記信号のスペクトルコンテンツを表す第2のスペクトル成分を含み、前記モジュールは、前記ダウンミックス信号の前記第1のスペクトル成分に有限インパルス応答フィルタを適用することによって前記ダウンミックス信号の前記第2のスペクトル成分を決定するように適合される、モジュールと、
前記ダウンミックス信号の前記第1および第2の周波数領域表現、前記残差信号の前記第1の周波数領域表現、および前記デコーダシステムによって受信されたビットストリーム信号において符号化された複素予測係数に基づいて、サイド信号の第1の周波数領域表現を計算する重み付き加算器であって、前記サイド信号の前記第1の周波数領域表現は、前記多次元空間の前記第1の部分空間において表現された前記サイド信号のスペクトルコンテンツを表す第1のスペクトル成分を含み、各スペクトル成分は周波数の範囲を表し、前記サイド信号の前記第1のスペクトル成分の各々は、前記サイド信号の前記第1のスペクトル成分と同じ周波数の範囲を表す前記ダウンミックス信号および前記残差信号のスペクトル成分から決定される、重み付き加算器と、
前記ダウンミックス信号の前記第1の周波数領域表現と前記サイド信号とに基づいて前記ステレオ信号を計算する和・差段階と
を有し、
前記アップミックス段階は、前記ダウンミックス信号および前記残差信号に対して独立した帯域幅制限を適用するように適合されている、
デコーダシステム。
続きを表示(約 1,400 文字)【請求項2】
適用される前記帯域幅制限は、前記信号の各々について、デコードされるべき最高周波数帯域を示す2つのデータフィールドによってシグナリングされる、
請求項1に記載のデコーダシステム。
【請求項3】
前記データフィールドの各々がmax_sfbの値として符号化されているMPEGビットストリームを受信するように適合されている、
請求項2に記載のデコーダシステム。
【請求項4】
前記ダウンミックス信号の第2の周波数領域表現を計算する前記モジュールは、少なくとも2つの時間的に隣接するおよび/または周波数的に隣接する第1のスペクトル成分の組み合わせによって決定される近似的な第2のスペクトル成分を含む近似的な第2のスペクトル表現を計算するように適合されている、
請求項1ないし3いずれか一項に記載のデコーダシステム。
【請求項5】
入力ステレオ信号を複素予測ステレオコーディングにより出力ステレオ信号にアップミックスするデコーディング方法であって
前記入力ステレオ信号は、ダウンミックス信号の第1の周波数領域表現と、残差信号と、複素予測係数とを含み、
前記第1の周波数領域表現の各々は、多次元空間の第1の部分空間において表現される対応する信号のスペクトルコンテンツを表す第1のスペクトル成分を含み、
前記デコーディング方法は、アップミックス段階によって実行され、
前記ダウンミックス信号の前記第1の周波数領域表現に基づいて前記ダウンミックス信号の第2の周波数領域表現を計算するステップであって、前記第2の周波数領域表現は、前記第1の部分空間に含まれない前記多次元空間の一部を含む前記多次元空間の第2の部分空間において表現される前記信号のスペクトルコンテンツを表す第2のスペクトル成分を含み、前記ダウンミックス信号の第2の周波数領域表現を計算することは、前記ダウンミックス信号の前記第1のスペクトル成分に有限インパルス応答フィルタを適用することによって前記ダウンミックス信号の前記第2のスペクトル成分を決定することを含む、ステップと、
前記ダウンミックス信号の前記第1および第2の周波数領域表現、前記残差信号の前記第1の周波数領域表現、および前記複素予測係数に基づいて、サイド信号の第1の周波数領域表現を計算するステップであって、前記サイド信号の前記第1の周波数領域表現は、前記多次元空間の前記第1の部分空間において表現される前記サイド信号のスペクトルコンテンツを表す第1のスペクトル成分を含み、各スペクトル成分は周波数の範囲を表し、前記サイド信号の前記第1のスペクトル成分の各々は、前記サイド信号の前記第1のスペクトル成分と同じ周波数の範囲を表す前記ダウンミックス信号および前記残差信号のスペクトル成分から決定される、ステップと
を含み、
前記ダウンミックス信号および前記残差信号に対して独立した帯域幅制限が適用される、
デコーディング方法。
【請求項6】
プロセッサ上での実行に適合され、コンピューティングデバイス上で実行されると、請求項5に記載の方法ステップを実行させるソフトウェアプログラムを含む記憶媒体。
【請求項7】
コンピュータ上で実行されると、請求項5に記載の方法を実行させる実行可能命令を含むコンピュータプログラム。

発明の詳細な説明【技術分野】
【0001】
ここに開示する発明は概してステレオオーディオ符号化に関し、より詳しくは周波数領域における複素予測を用いるステレオ符号化の手法に関する。
続きを表示(約 3,400 文字)【背景技術】
【0002】
ステレオ信号の左(L)チャンネルと右(R)チャンネルの同時符号化(joint coding)により、LとRを独立に符号化するのと比較して、符号化が効率的になる。同時ステレオ符号化に対する一般的なアプローチはミッド/サイド(M/S)符号化である。ここで、ミッド(M)信号はL信号とR信号を加えることにより構成され、例えばM信号は
TIFF
2024056001000002.tif
9
170
により得られる。また、サイド(S)信号は2つのチャンネルLRを引くことにより構成され、例えばS信号は
TIFF
2024056001000003.tif
9
170
により得られる。M/S符号化の場合、L信号とR信号ではなく、M信号とS信号が符号化される。
【0003】
MPEG(Moving Picture Experts Group)のAAC(Advanced Audio Coding)標準(標準文書ISO/IEC 13818-7を参照)では、時間および周波数可変で、L/Rステレオ符号化とM/Sステレオ符号化を選択できる。このように、ステレオエンコーダは、ステレオ信号のある周波数帯域にL/R符号化を適用でき、そのステレオ信号の他の周波数帯域のエンコードにはM/S符号化が使われる(周波数可変)。さらに、エンコーダは時間的にL/R符号化とM/S符号化を切り替えられる(時間可変)。MPEG AACでは、ステレオエンコーディングは周波数領域で、より具体的にはMDCT(修正離散余弦変換)領域で行われる。これにより、周波数的および時間的に可変に、L/R符号化またはM/S符号化のいずれかを適応的に選択できる。
【0004】
パラメトリックステレオ符号化は、ステレオオーディオ信号を、モノラル信号と、ステレオパラメータとなる少量のサイド情報として、効率的に符号化する手法である。これはMPEG-4オーディオ標準(標準文書ISO/IEC14496-3を参照)の一部である。モノラル信号はどのオーディオ符号化器を用いてもエンコードできる。ステレオパラメータはモノビットストリーム(mono bit stream)の付属部分に組み込まれるので、完全に前方互換かつ後方互換となる。デコーダでは、モノラル信号が最初に復号され、その後にステレオパラメータを用いてステレオ信号が再構成される。復号されたモノ信号を無相関化した信号(decorrelated version)は、モノ信号との相互相関がゼロである。この無相関化信号を、無相関化器(decorrelator)により、例えば遅延ラインを含む適当なオールパスフィルタ(all-pass filter)により生成する。基本的に、無相関化信号はモノ信号と同じスペクトル的・時間的エネルギー分布を有する。モノラル信号は無相関化信号とともにアップミックスプロセスに入力される。このプロセスは、ステレオパラメータにより制御され、ステレオ信号を再構成する。さらに詳しい情報は、非特許文献1を参照されたい。
【0005】
MPEGサラウンド(MPS;ISO/IEC 23003-1及び非特許文献2を参照)は、パラメトリックステレオ符号化の原理に残差符号化の原理を組み合わせるものであり、無相関化信号を送信される残差で置き換え、知覚できる音質を改善している。残差符号化は、マルチチャンネル信号をダウンミックスし、任意的に空間的キューを抽出することにより行われる。ダウンミックスプロセスにおいて、エラー信号を表す残差信号が計算され、エンコードされて送信される。残差信号はデコーダにおいて無相関化信号の代わりになる。ハイブリッドアプローチでは、残差信号は一定の周波数帯域において、好ましくは比較的低い帯域において、無相関化信号に取って代わる。
【0006】
現在のMPEG Unified Speech and Audio Coding(USAC)システムは、図1に2つの例を示したが、デコーダはコアデコーダの下流に位置する複素値直交ミラーフィルタ(QMF)バンクを有する。このフィルタバンクの出力として得られるQMF表現は、複素値であり、それゆえ2倍にオーバーサンプルされており、ダウンミックス信号(すなわちミッド信号)Mと残差信号Dとして構成できる。これには複素値成分を有するアップミックス行列を使うことができる。(QMF領域の)L信号とR信号は
TIFF
2024056001000004.tif
13
170
として得られる。ここで、gは実数値のゲインファクタであり、αは複素値の予測係数である。αは残差信号Dのエネルギーが最小になるように選択するのが好ましい。ゲインファクタは規格化により、すなわち和信号のパワーが左右信号のパワーの和と等しくなるようにして決定できる。L信号とR信号それぞれの実部と虚部は互いに冗長性があり、原理的には一方を他方に基づき計算できる。しかし、後で可聴なエイリアシングアーティファクトを生ぜずにスペクトル帯域レプリケーション(SBR)デコーダを使えるという利益がある。モノ・ステレオアップミックスなどその他の時間または周波数適応的信号処理(図示せず)と関連するアーティファクトを防止する目的で、オーバーサンプルされた信号表現の利用も同様の理由で選択される。逆QMFフィルタリングがデコーダにおける最後の処理ステップである。信号の帯域制限的QMF表現により、帯域制限残差手法と「残差フィル」手法が使える。これらの手法をこのタイプのデコーダに組み込むことができる。
【0007】
上記の符号化構成は低ビットレートの場合、一般的には80kb/s未満の場合には良く適合するが、計算複雑性の点で高ビットレートの場合には最適なものではない。より詳しく言うと、高ビットレートでは、一般的にSBRツールは(符号化効率の改善にならないので)使われない次に、SBR段階を有さないデコーダでは、複素値アップミックス行列があるが故にQMFフィルタバンクを使うが、これは計算量が多く遅延を生じる(1024サンプルのフレーム長では、QMF分析/合成フィルタバンクにより961サンプルの遅延が生じる)。これは、もっと効率的な符号化構成の必要性を明らかに示している。
【先行技術文献】
【非特許文献】
【0008】
H. Purnhagen著「Low Complexity Parametric Stereo Coding in MPEG-4」, Proc. of the 7th Int. Conference on Digital Audio Effects (DAFx'04), Naples, Italy, October 5-8, 2004, pages 163-168
J. Herre et al.著「MPEG Surround - The ISO/MPEG Standard for Efficient and Compatible Multi- Channel Audio Coding」, Audio Engineering Convention Paper 7084, 122<nd> Convention, May 5-8, 2007
【発明の概要】
【課題を解決するための手段】
【0009】
本発明の一目的は、高ビットレートレンジにおいても計算効率の高いステレオ符号化をする方法と装置を提供することである。
【0010】
本発明は、独立請求項に規定した、符号化及び復号をするための、それぞれコーダ及びデコーダ、コーディング及びデコーディング方法、及びコンピュータプログラム製品を提供することにより、この目的を達成する。従属項は本発明の実施形態を規定している。
(【0011】以降は省略されています)

特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する

関連特許

株式会社フジコー
吸音材
19日前
個人
歌唱補助マスク
3日前
三井化学株式会社
防音構造体
23日前
株式会社JVCケンウッド
情報処理装置
9日前
株式会社フェルナンデス
電気ギター用弦振動持続装置
9日前
ヤマハ株式会社
管楽器用スワブ
17日前
株式会社レゾナック
吸音材及び車両部材
10日前
株式会社河合楽器製作所
自動演奏装置及び自動演奏プログラム
19日前
TDK株式会社
振動デバイス及びこれを備えるICカード
23日前
トヨタ自動車株式会社
車室の床下構造
17日前
富士通株式会社
評価プログラム、評価方法、評価装置
11日前
株式会社NTTドコモ
発話スタイル改善支援装置
16日前
株式会社河合楽器製作所
鍵盤楽器の鍵盤装置
23日前
株式会社河合楽器製作所
鍵盤楽器の鍵盤装置
18日前
株式会社河合楽器製作所
鍵盤楽器の鍵盤装置
18日前
株式会社河合楽器製作所
鍵盤楽器の鍵盤装置
23日前
株式会社河合楽器製作所
鍵盤楽器の鍵盤装置
23日前
ヤマハ株式会社
音響モデルの訓練方法
18日前
日産自動車株式会社
対話装置及び対話制御方法
17日前
ヤマハ株式会社
音響モデルの訓練方法
18日前
ヤマハ株式会社
楽曲生成方法、およびプログラム
16日前
ヤマハ株式会社
音波形の特性分布に係る表示方法
18日前
福井経編興業株式会社
吸音体
22日前
ヤマハ株式会社
音響モデルの訓練システム及び方法
18日前
福井経編興業株式会社
吸音体
22日前
ヤマハ株式会社
プログラム、音響処理方法および音響処理システム
10日前
カシオ計算機株式会社
情報処理装置、電子楽器、制御方法及びプログラム
16日前
ヤマハ株式会社
演奏操作装置
22日前
カシオ計算機株式会社
電子機器、電子楽器システム、再生制御方法及びプログラム
18日前
学校法人日本大学
防音材の設計方法、製造方法、設計装置及び設計用プログラム
16日前
カシオ計算機株式会社
練習システム、練習方法、及びプログラム、並びに指導者端末装置
17日前
株式会社毎日放送
コンテンツ再生制御システム
9日前
ヤマハ株式会社
鍵盤装置の鍵の支持構造、鍵盤装置及び電子楽器
22日前
三菱ケミカル株式会社
共振シート部材、これを用いた共振構造体、および共振シート部材の製造方法
18日前
ソニーグループ株式会社
情報処理装置及び情報処理方法、コンピュータプログラム、音生成システム、並びに情報端末
9日前
ドルビー・インターナショナル・アーベー
デコーダシステム、デコーディング方法及びコンピュータプログラム
15日前
続きを見る