TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025032135
公報種別公開特許公報(A)
公開日2025-03-11
出願番号2024200650,2022130470
出願日2024-11-18,2015-07-23
発明の名称スムーズな遷移を取得するために、ゼロ入力応答を用いるオーディオデコーダ、方法及びコンピュータプログラム
出願人フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
代理人弁理士法人岡田特許事務所
主分類G10L 19/20 20130101AFI20250304BHJP(楽器;音響)
要約【課題】異なる符号化モードの間でのスイッチングのために改善された特性を備えるオーディオデコーダを提供する。
【解決手段】オーディオデコーダは、線形予測領域において符号化されるオーディオフレームに基づいて第1の復号化オーディオ情報を提供する線形予測領域デコーダと、周波数領域において符号化されるオーディオフレームに基づいて第2の復号化オーディオ情報を提供する周波数領域デコーダと、線形予測フィルタリングのゼロ入力応答を取得する遷移処理装置と、を備える。線形予測フィルタリングの初期状態は、第1の復号化オーディオ情報及び第2の復号化オーディオ情報に従って定義され、第2の復号化オーディオ情報はゼロ入力応答に依存して修正される。
【選択図】図1
特許請求の範囲【請求項1】
符号化オーディオ情報(110;210;310)に基づいて復号化オーディオ情報(112;212;312)を提供するオーディオデコーダ(100;200;300)であって、前記オーディオデコーダは、
線形予測領域において符号化されるオーディオフレームに基づいて第1の復号化オーディオ情報(122;222;322;S
C
(n))を提供するように構成される線形予測領域デコーダ(120;220;320)と、
周波数領域において符号化されるオーディオフレームに基づいて第2の復号化オーディオ情報(132;232;332;S
M
(n))を提供するように構成される周波数領域デコーダ(130;230;330)と、
遷移処理装置(140;240;340)と、を備え、
前記遷移処理装置は、線形予測フィルタリング(148;254;346)のゼロ入力応答(150;256;348)を取得するように構成され、前記線形予測フィルタリングの初期状態(146;252;344)は、前記第1の復号化オーディオ情報及び前記第2の復号化オーディオ情報に依存して定義され、且つ
JPEG
2025032135000027.jpg
33
169
続きを表示(約 2,200 文字)【請求項2】
請求項1に記載のオーディオデコーダであって、
JPEG
2025032135000028.jpg
121
170
【請求項3】
請求項1又は2に記載のオーディオデコーダ(100;200;300)であって、前記第2の復号化オーディオ情報(132;232;332)がエイリアシングを含むように、前記周波数領域デコーダ(130;230;330)は、逆重複変換を実行するように構成される、オーディオデコーダ。
【請求項4】
請求項1若しくは2又は3に記載のオーディオデコーダ(100;200;300)であって、前記線形予測領域デコーダ(120;220;320)が第1の復号化オーディオ情報(122;222;322)を備えるために、前記第2の復号化オーディオ情報(132;232;332)が時間部と時間的に重複する時間部においてエイリアシングを備えるように、且つ前記線形予測領域デコーダが第1の復号化オーディオ情報を提供するために、前記第2の復号化オーディオ情報が時間部の後に続く前記時間部のためにエイリアシングがないように、前記周波数領域デコーダ(130;230;330)は、逆重複変換を実行するように構成される、オーディオデコーダ。
【請求項5】
JPEG
2025032135000029.jpg
26
170
【請求項6】
JPEG
2025032135000030.jpg
31
169
【請求項7】
請求項1~6の1つに記載のオーディオデコーダ(100;200;300)であって、前記遷移処理装置(140;240;340)は、
JPEG
2025032135000031.jpg
125
170
mは、実行(running)変数を示し、
Mは、線形予測フィルタのフィルタ長を示し、

m
は、線形予測フィルタのフィルタ係数を示し、

C
(n)は、時間インデックスnに対する前記第1の復号化オーディオ情報(122;222;322)の以前に復号化された値を示し、
Nは、処理長を示す、オーディオデコーダ。
【請求項8】
請求項1~7の1に記載のオーディオデコーダ(100;200;300)であって、前記遷移処理装置(140;240;340)は、第1のウィンドウ処理((w(-n-1)w(-n-1))を前記第1の復号化オーディオ情報(122;222;322;S
C
(n))に適用して前記第1の復号化オーディオ情報のウィンドウ処理バージョンを取得するように構成され、且つ第2のウィンドウ処理(w(n+L)w(-n-1))を前記第1の復号化オーディオ情報(122;222;322;S
C
(n))の前記時間鏡映バージョン(S
C
(-n-L-1))に適用して前記第1の復号化オーディオ情報の時間鏡映バージョンのウィンドウ処理バージョンを取得するように構成され、且つ
JPEG
2025032135000032.jpg
24
170
【請求項9】
請求項1~8の1つに記載のオーディオデコーダであって、
前記遷移処理装置(140;240;340)は、
JPEG
2025032135000033.jpg
33
169
nは、時間インデックスを示し、
w(-n-1)は、時間インデックス(-n-1)に対するウィンドウ関数の値を示し、
w(n+L)は、時間インデックス(n+L)に対するウィンドウ関数の値を示し、
S
c
(n)は、時間インデックス(n)に対する前記第1の復号化オーディオ情報(122;222;322)の以前に復号化された値を示し、

C
(-n-L-1)は、時間インデックス(-n-L-1)に対する前記第1の復号化オーディオ情報の以前に復号化された値を示し、

M
(n)は、時間インデックスnに対する前記第2の復号化オーディオ情報(132;232;332)の復号化された値を示し、且つ
Lは、ウィンドウ長を示す、オーディオデコーダ。
【請求項10】
請求項1~9の1つに記載のオーディオデコーダ(100;200;300)であって、前記遷移処理装置(140;240;340)は、
JPEG
2025032135000034.jpg
108
169
mは、実行変数を示し、
Mは、前記線形予測フィルタ(148;254;346)のフィルタ長を示し、

m
は、前記線形予測フィルタのフィルタ係数を示し、
JPEG
2025032135000035.jpg
13
170
Nは、処理長を示す、オーディオデコーダ。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
1.技術分野
本発明に係る実施形態は、符号化オーディオ情報に基づいて復号化オーディオ情報を提供するオーディオデコーダに関する。
続きを表示(約 1,600 文字)【0002】
本発明に係るもう一つの実施形態は、符号化オーディオ情報に基づいて復号化オーディオ情報を提供する方法に関する。
【0003】
本発明に係るもう一つの実施形態は、上述の方法を実行するコンピュータプログラムに関する。
【0004】
概して、本発明に係る実施形態は、スイッチドオーディオ符号化におけるCELPコーデックからMDCTに基づくコーデックまでの遷移を取り扱うことに関する。
【背景技術】
【0005】
2.発明の背景
近年、符号化オーディオ情報を伝送すること及び保存することに対する要求が増加してきている。スピーチ及び一般的なオーディオ(例えば、音楽、背景ノイズ等)の両方を備えるオーディオ信号のオーディオ符号化及びオーディオ復号化に対する要求もまた増加している。
【0006】
符号化品質を改善するために、且つビットレート効率を改善するためにも、例えば、第1の符号化コンセプト(例えば、CELPに基づく符号化コンセプト)を用いて第1のフレームが符号化されるように、且つ異なる第2の符号化コンセプト(例えば、MDCTに基づく符号化コンセプト)を用いて後に続く第2のオーディオフレームが符号化されるように、スイッチド(又はスイッチング)オーディオコーデックは、異なる符号化体系の間での切り替えられることが導入されてきた。換言すれば、これらは、(例えば、CELPに基づく符号化コンセプトを用いる)線形予測符号化領域における符号化と、周波数領域における符号化(例えば、FFT変換、逆FFT変換、MDCT変換又は逆MDCT変換等の時間領域-周波数領域変換又は周波数領域-時間領域変換に基づく符号化)との間での切り替えであり得る。例えば、第1の符号化コンセプトは、CELPに基づく符号化コンセプト、ACELPに基づく符号化コンセプト、変換コード化励起線形予測領域に基づく符号化コンセプト等であり得る。第2の符号化コンセプトは、例えば、FFTに基づく符号化コンセプト、MDCTに基づく符号化コンセプト、AACに基づく符号化コンセプト、又はAACに基づく符号化コンセプトの後継コンセプトとして考慮され得る符号化コンセプトであり得る。
【0007】
以下において、従来のオーディオコーダ(エンコーダ及び/又はデコーダ)の幾つかの例が記述されるであろう。
【0008】
例えば、MPEG USACのようなスイッチドオーディオコーデックは、2つの主たるオーディオ符号化体系に基づく。1つの符号化体系は、例えば、CELPコーデックであり、スピーチ信号を対象とする。他の符号化体系は、例えば、(以下、単にMDCTと呼ばれる)MDCTに基づくコーデックであり、全ての他のオーディオ信号(例えば、音楽、背景ノイズ)を目的とする。混合コンテンツ信号(例えば、音楽でのスピーチ)で、エンコーダは、(及びその結果としてデコーダも、)しばしば2つの符号化体系の間で切り替わる。それ故に、1つのモード(又は符号化体系)からもう一つに切り替わるとき、如何なるアーチファクト(例えば、不連続性に起因するクリック)も回避する必要がある。
【0009】
スイッチドオーディオコーデックは、例えば、CELP-MDCT変換によって引き起こされる問題をかかえ得る。
【0010】
CELP-MDCT変換は、一般に、2つの問題をもたらす。エイリアシングは、欠落した以前のMDCTフレームに起因してもたらされ得る。不連続性は、低い/中位のビットレートで操作する(operating)2つの符号化体系の性質を符号化する完全でない波形に起因して、CELPフレームとMDCTフレームとの間での境界にもたらされ得る。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
アクセサリー型集音器
15日前
JIN株式会社
断熱吸音材
1日前
ヤマハ株式会社
成形体、楽器および楽器部品
1日前
ヤマハ株式会社
楽音発生指示装置およびその製造方法
1日前
ヤマハ株式会社
ノイズ低減装置および楽器
1日前
株式会社第一興商
カラオケ装置
7日前
株式会社第一興商
カラオケ装置
21日前
株式会社コルグ
演奏情報制御装置、プログラム
7日前
日本放送協会
音声認識装置およびプログラム
今日
本田技研工業株式会社
能動型騒音低減装置
21日前
ヤマハ株式会社
入力装置およびその制御方法、プログラム
2日前
個人
発音体モジュール
16日前
カシオ計算機株式会社
無線通信装置
1日前
本田技研工業株式会社
能動型騒音低減装置
21日前
ブラザー工業株式会社
カラオケ装置、及び、カラオケ用プログラム
1日前
ブラザー工業株式会社
カラオケ装置、及び、カラオケ用プログラム
1日前
カシオ計算機株式会社
楽器用電子機器
21日前
株式会社JVCケンウッド
情報処理装置、情報処理方法及びプログラム
1日前
ローランド株式会社
打楽器および楽音の生成方法
1日前
カシオ計算機株式会社
電子楽器、方法およびプログラム
1日前
株式会社奏音楽企画
クラッパーアーム揺動機構及びこれを備える練習用ベル
11日前
カシオ計算機株式会社
電子楽器、方法およびプログラム
1日前
カシオ計算機株式会社
電子楽器、方法およびプログラム
1日前
ヤマハ株式会社
聴取音取得方法および聴取音取得装置
2日前
ヤマハ株式会社
聴取音取得方法および聴取音取得装置
2日前
株式会社バンダイナムコ研究所
処理システム、プログラム及び処理方法
1日前
川崎重工業株式会社
音響構造材及び構造体
2日前
株式会社レゾナック
吸音材
3日前
ヤマハ株式会社
鍵盤装置、音生成方法、及びプログラム
今日
カシオ計算機株式会社
プログラム、情報処理装置、電子楽器及び表示方法
今日
株式会社イノアックコーポレーション
防音カバー
21日前
株式会社イノアックコーポレーション
防音カバー
9日前
株式会社イノアックコーポレーション
防音カバー
21日前
MPLUSPLUS株式会社
演奏差異検出方法、プログラム及びシステム並びに演奏誤り箇所通知方法
7日前
学校法人幾徳学園
学習モデル作成方法、学習モデル作成装置、背景音除去方法、および背景音除去装置
1日前
株式会社東芝
推定装置、推定方法及びプログラム
2日前
続きを見る