TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025014033
公報種別公開特許公報(A)
公開日2025-01-28
出願番号2024190397,2023109830
出願日2024-10-30,2014-07-15
発明の名称変換長切替えをサポートする周波数ドメインオーディオ符号化
出願人フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
代理人弁理士法人野口新生特許事務所,個人
主分類G10L 19/022 20130101AFI20250121BHJP(楽器;音響)
要約【課題】下位互換的に拡張される周波数ドメインオーディオコーデックを提供する。
【解決手段】周波数ドメインオーディオ復号器10は、周波数ドメイン(FD)係数抽出器12、スケーリング係数抽出器14、逆変換器16及び結合器18を備える。それらの入力において、FD係数抽出器及びスケーリング係数抽出器は、入来するデータストリーム20にアクセスする。FD係数抽出器及びスケーリング係数抽出器の出力は、逆変換器の夫々の入力に接続され、逆変換器の出力は、結合器の入力に接続される。結合器は、再構築されたオーディオ信号22を出力する。FD係数抽出器は、データストリームからオーディオ信号のフレーム26のFD係数24を抽出する。FD係数は、様々なスペクトル-時間分解能で夫々のフレーム内のオーディオ信号のスペクトルを記述し、まとめてオーディオ信号のスペクトログラム28を表す。
【選択図】図1
特許請求の範囲【請求項1】
変換長切替えをサポートする周波数ドメインオーディオ復号器であって、
データストリームからオーディオ信号のフレームの周波数ドメイン係数(24)を抽出するように構成されている周波数ドメイン係数抽出器(12)と、
前記データストリームからスケール係数を抽出するように構成されているスケール係数抽出器(14)と、
前記オーディオ信号の時間ドメイン部分を得るために、前記スケール係数に従ってスケーリングされた、前記フレームの前記周波数ドメイン係数を逆変換するように構成されている逆変換器(16)と、
前記オーディオ信号を得るために前記時間ドメイン部分を組み合わせるように構成されている結合器(18)と、を備え、
前記逆変換器は、前記オーディオ信号の前記フレーム内の信号化に応答し、それによって、前記信号化に応じて、
前記スケール係数に従ってスケーリングされた、それぞれのフレームの前記周波数ドメイン係数をデインターリーブされないように連続的に配列することによって1つの変換を形成し、前記1つの変換に第1の変換長の逆変換を行うか、又は
前記スケール係数に従ってスケーリングされた、前記それぞれのフレームの前記周波数ドメイン係数をデインターリーブすることによって2つ以上の変換を形成し、前記2つ以上の変換の各々に、前記第1の変換長よりも短い第2の変換長の逆変換を行い、
前記周波数ドメイン係数抽出器及び前記スケール係数抽出器は前記信号化とは無関係に動作する周波数ドメインオーディオ復号器。
続きを表示(約 2,200 文字)【請求項2】
前記スケール係数抽出器(14)は、前記信号化とは無関係であるスペクトル-時間分解能で前記データストリームから前記スケール係数を抽出するように構成されている請求項1に記載の周波数ドメインオーディオ復号器。
【請求項3】
前記周波数ドメイン係数抽出器(12)は、各周波数ドメイン係数について、前記信号化にかかわらず同じコンテキスト又はコードブックを前記それぞれの周波数ドメイン係数に割り当てることによって、前記データストリームから前記周波数ドメイン係数を抽出するためにコンテキストベース又はコードブックベースのエントロピー復号を使用する請求項1又は2に記載の周波数ドメインオーディオ復号器。
【請求項4】
前記逆変換器は、前記周波数ドメイン係数に、前記信号化とは無関係のスペクト分解能で前記スケール係数によるスケーリングを行うように構成されている請求項1から3のいずれか一項に記載の周波数ドメインオーディオ復号器。
【請求項5】
前記逆変換器は、前記周波数ドメイン係数にノイズ充填を行うように構成されており、前記周波数ドメイン係数はデインターリーブされないように、かつ、前記信号化とは無関係のスペクトル分解能で、連続的に配列されている請求項1から4のいずれか一項に記載の周波数ドメインオーディオ復号器。
【請求項6】
前記逆変換器は、
前記1つの変換の前記形成において、前記周波数ドメイン係数に対して逆テンポラルノイズシェーピングフィルタリングを適用し、ここで、前記周波数ドメイン係数はデインターリーブされないように連続的に配列されており、
前記2つ以上の変換の前記形成において、前記周波数ドメイン係数に対して逆テンポラルノイズシェーピングフィルタリングを適用するように構成されており、ここで、前記周波数ドメイン係数はデインターリーブされるように連続的に配列され、それに従って前記2つ以上の変換がスペクトル的に連結されている請求項1から5のいずれか一項に記載の周波数ドメインオーディオ復号器。
【請求項7】
前記逆変換器は、チャネル間ステレオ予測を用いるか又は用いることなくジョイントステレオ符号化をサポートし、前記チャネル間ステレオ予測の和(中間)スペクトルもしくは差(外側)スペクトル又は予測残差として前記周波数ドメイン係数を使用するように構成されており、前記周波数ドメイン係数は、前記信号化にかかわらず、デインターリーブされないように配列されている請求項1から6のいずれか一項に記載の周波数ドメインオーディオ復号器。
【請求項8】
前記2つ以上の変換の数は2に等しく、前記第1の変換長は前記第2の変換長の2倍である請求項1から7のいずれか一項に記載の周波数ドメインオーディオ復号器。
【請求項9】
前記逆変換は、逆修正離散コサイン変換MDCTである請求項1から8のいずれか一項に記載の周波数ドメインオーディオ復号器。
【請求項10】
変換長切替えをサポートする周波数ドメインオーディオ符号化器であって、
オーディオ信号の時間ドメイン部分を変換して、前記オーディオ信号のフレームの周波数ドメイン係数を得るように構成されている変換器(104)と、
スケール係数に従って前記周波数ドメイン係数を逆スケーリングするように構成されている逆スケーラ(106)と、
スケール係数に従って逆スケーリングされた、前記オーディオ信号の前記フレームの前記周波数ドメイン係数を前記データストリームに挿入するように構成されている周波数ドメイン係数挿入器(108)と、
スケール係数を前記データストリームに挿入するように構成されているスケール係数挿入器(110)と、を備え、
前記変換器は、前記オーディオ信号の前記フレームについて、少なくとも、それぞれのフレームの第1の変換長の1つの変換の実施と、前記それぞれのフレームの、前記第1の変換長よりも短い第2の変換長の2つ以上の変換の実施との間で切り替えるように構成されており、
前記変換器は、前記データストリームの前記フレーム内の信号化によって前記切替えを信号伝達するようにさらに構成されており、
前記周波数ドメイン係数挿入器は、それぞれのフレームについて、スケール係数に従って逆スケーリングされた、前記オーディオ信号の前記それぞれのフレームの前記周波数ドメイン係数の系列を、前記信号化とは無関係に、前記データストリームに挿入するように構成されており、
前記周波数ドメイン係数の系列は、前記信号化に応じて、前記それぞれのフレームについて1つの変換が実施される場合には、それぞれのフレームの前記1つの変換の前記周波数ドメイン係数を、インターリーブされないように連続的に配列することによって、及び 前記それぞれのフレームについて2つ以上の変換が実施される場合には、前記それぞれのフレームの前記2つ以上の変換の前記周波数ドメイン係数をインターリーブすることによって形成され、
前記スケール係数挿入器は、前記信号化とは無関係に動作する周波数ドメインオーディオ符号化器。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本出願は、変換長切替えをサポートする周波数ドメインオーディオ符号化に関する。
続きを表示(約 3,000 文字)【背景技術】
【0002】
IETF[1]、MPEG-4(HE-)AAC[2]、又は、特にMPEG-D xHE-AAC(USAC)[3]のOpus/Celtコーデックのような現代の周波数ドメイン音声/オーディオ符号化システムは、信号の時間的安定性に応じて、1つの長い変換、すなわち長いブロック、又は8つの連続する短い変換、すなわち短いブロックを使用してオーディオフレームを符号化する手段を提供する。
【0003】
雨又は大観衆の拍手のような特定のオーディオ信号については、長いブロックの符号化と短いブロックの符号化のいずれも、低ビットレートにおいて満足のいく品質をもたらさない。これは、そのような録音における顕著な過渡の密度によって説明することができる。すなわち、長いブロックのみによる符号化は、プリエコーとしても知られる、頻繁な、耳に聞こえる符号化エラーの時間的な不鮮明さを引き起こす可能性があり、一方で、短いブロックのみによる符号化は、スペクトルホールがもたらされるデータオーバヘッド増大により一般的に非効率である。
【0004】
したがって、ちょうど概説した種類のオーディオ信号にも適した周波数ドメインオーディオ符号化概念が身近にあることが好ましい。当然ながら、とりわけ、特定の種類のオーディオ信号に適した特定の所望の変換長を包含する変換長セットの間での切替えをサポートする新規の周波数ドメインオーディオコーデックを構築することは実現可能である。しかしながら、市場に採用される新規の周波数ドメインオーディオコーデックを導入することは容易な仕事ではない。周知のコーデックはすでに利用可能であり、頻繁に使用されている。したがって、所望の新たな変換長をさらにサポートするが、それにもかかわらず、既存の符号化器及び復号器との下位互換性を維持するように、既存の周波数ドメインオーディオコーデックが拡張されることを可能にする概念を得ることが可能であることが好ましい。
【先行技術文献】
【非特許文献】
【0005】
[1] Internet Engineering Task Force (IETF), RFC 6716, “Definition of the Opus Audio Codec,” Proposed Standard, Sep. 2012. Available online at http://tools.ietf.org/html/rfc6716.
[2] International Organization for Standardization, ISO/IEC 14496-3:2009, “Information Technology - Coding of audio-visual objects - Part 3: Audio,” Geneva, Switzerland, Aug. 2009.
[3] M. Neuendorf et al., “MPEG Unified Speech and Audio Coding - The ISO/MPEG Standard for High-Efficiency Audio Coding of All Content Types,” in Proc. 132nd Convention of the AES, Budapest, Hungary, Apr. 2012. Also to appear in the Journal of the AES, 2013.
[4] International Organization for Standardization, ISO/IEC 23003-3:2012, “Information Technology - MPEG audio - Part 3: Unified speech and audio coding,” Geneva, Jan. 2012.
[5] J.D.Johnston and A.J.Ferreira, “Sum-Difference Stereo Transform Coding”, in Proc. IEEE ICASSP-92, Vol. 2, March 1992.
[6] N.Rettelbach, et al., European Patent EP2304719A1, “Audio Encoder, Audio Decoder, Methods for Encoding and Decoding an Audio Signal, Audio Stream and Computer Program”, April 2011.
【発明の概要】
【発明が解決しようとする課題】
【0006】
したがって、本発明の目的は、この新たな変換長も含む変換長間で切り替えるように、追加の変換長のサポートに向けて、既存の周波数ドメインオーディオコーデックが下位互換的に拡張されることを可能にする概念を提供することである。
【課題を解決するための手段】
【0007】
この目的は、本明細書に添付の独立請求項の主題によって達成される。
【0008】
本発明は、いずれの変換長が実際に適用されるかについてそれぞれのフレームに対して信号伝達する信号化にかかわりなく、それぞれのフレームの周波数ドメイン係数がインターリーブされるように送信されるとき、並びに、さらに、周波数ドメイン係数抽出及びスケール係数抽出がその信号化とは無関係に動作するときに、付加的に特定の変換長を下位互換的にサポートする機能を有する周波数ドメインオーディオコーデックを提供することができるという所見に基づく。この方策によって、上記信号化に対応しない旧式の周波数ドメインオーディオ符号化器/復号器が、それにもかかわらず、誤りなく妥当な品質を再生して動作することが可能になる。同時に、付加的にサポートされる変換長へ/からの切替えに対応している周波数ドメインオーディオ符号化器/復号器は、下位互換性があるにもかかわらず、さらにより良好な品質を達成する。旧式の復号器に対してトランスペアレント(transparent)に周波数ドメイン係数が符号化されることに起因する符号化効率の不利益に関する限り、これは、インターリーブに起因して比較的些細な性質のものである。
【0009】
本出願の有利な実施態様は、従属請求項の主題である。
【図面の簡単な説明】
【0010】
一実施形態による、周波数ドメインオーディオ復号器の概略ブロック図である。
図1の逆変換器の機能を示す概略図である。
一実施形態による、図2の逆TNSフィルタリングプロセスの上流方向に向けての可能な変位を示す概略図である。
一実施形態による、USACにおける長い停止-開始窓の変換分割を使用するときの窓の選択の可能性を示す図である。
一実施形態による、周波数ドメインオーディオ符号化器のブロック図である。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
ハリセン
20日前
個人
管部材の製造方法
20日前
ヤマハ株式会社
ヘルムホルツ共鳴器
13日前
ブラザー工業株式会社
カラオケ装置
17日前
ヤマハ株式会社
電子楽器
17日前
ブラザー工業株式会社
カラオケ装置
17日前
カシオ計算機株式会社
蓋部材および鍵盤楽器
22日前
セイコーエプソン株式会社
吸音ボード
7日前
日産自動車株式会社
防音構造体
7日前
オンキヨー株式会社
音声認識システム、及び、音声認識方法
20日前
ヤマハ株式会社
シンバルワッシャ
20日前
株式会社イノアックコーポレーション
遮音カバー
20日前
株式会社第一興商
カラオケ装置
13日前
株式会社第一興商
カラオケ装置
20日前
株式会社エクシング
カラオケシステム、及び、カラオケ装置
20日前
京セラ株式会社
音出力装置及び音出力方法
7日前
コスモネクスト株式会社
入力支援プログラム及び入力支援方法
今日
本田技研工業株式会社
能動型騒音低減装置
13日前
トヨタ自動車株式会社
制御装置及び制御方法
17日前
日本放送協会
音声認識装置およびプログラム
7日前
本田技研工業株式会社
能動型騒音低減装置
7日前
ヤマハ株式会社
検出システムおよび楽器
20日前
株式会社アナザーウェア
鍵盤画面表示プログラム及びそのシステム
13日前
トヨタ自動車株式会社
異音診断システム
13日前
株式会社コルグ
音波生成装置、音波生成方法、プログラム
今日
ローランド株式会社
打楽器および張力の付与方法
20日前
株式会社SOKEN
遮音部
17日前
ローランド株式会社
打楽器およびロッドの締付方法
20日前
ソフトバンクグループ株式会社
行動制御システム
今日
カシオ計算機株式会社
電子楽器及び電子鍵盤楽器
22日前
カシオ計算機株式会社
電子楽器及び電子鍵盤楽器
22日前
カシオ計算機株式会社
電子楽器及び電子鍵盤楽器
22日前
株式会社イノアックコーポレーション
ダクト
17日前
ブラザー工業株式会社
情報処理装置、情報処理プログラム、及び情報処理方法
20日前
ブラザー工業株式会社
情報処理装置、情報処理プログラム、及び情報処理方法
20日前
ブラザー工業株式会社
映像再生装置、映像再生プログラム、及び映像再生方法
20日前
続きを見る