TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024029071
公報種別公開特許公報(A)
公開日2024-03-05
出願番号2023215842,2021573912
出願日2023-12-21,2020-06-15
発明の名称パラメータの符号化および復号
出願人フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ.
代理人個人,個人,個人
主分類G10L 19/008 20130101AFI20240227BHJP(楽器;音響)
要約【課題】パラメータの符号化および復号の方法を提供する。
【解決手段】オーディオシステムにおいて、符号化器が生成したダウンミックス信号246から合成信号336、340を生成するための復号器300は、ダウンミックス信号を受信するための入力インターフェース312を有する。入力インターフェースは、ダウンミックス信号が幾つかのダウンミックスチャンネル及びサイド情報228を有し、サイド情報は、原信号のチャンネルレベル及び相関情報314を含み、原信号は、いくつかの原チャンネルを有する。復号器はまた、入力信号のチャンネルレベル及び相関情報並びにダウンミックス信号324、246に関連する共分散情報を使用して、少なくとも1つの混合規則に従って合成信号を生成する合成プロセッサを有する。
【選択図】図3a
特許請求の範囲【請求項1】
ダウンミックス信号(246、x)から合成信号(336、340、y
R
)を生成するためのオーディオ合成器(300)であって、前記合成信号(336、340、y
R
)がいくつかの合成チャンネルを有し、前記オーディオ合成器(300)が、
前記ダウンミックス信号(246、x)を受信するように構成された入力インターフェース(312)であって、前記ダウンミックス信号(246、x)がいくつかのダウンミックスチャンネルおよびサイド情報(228)を有し、前記サイド情報(228)が原信号(212、y)のチャンネルレベルおよび相関情報(314、ξ、χ)を含み、前記原信号(212、y)がいくつかの原チャンネルを有する、入力インターフェース(312)と、
合成プロセッサ(404)であって、
前記原信号(212、y)のチャンネルレベルおよび相関情報(220、314、ξ、χ)、ならびに
前記ダウンミックス信号(324、246、x)に関連する共分散情報(C
x
)
を使用して、少なくとも1つの混合規則に従って、前記合成信号(336、340、y
R
)を生成するように構成された合成プロセッサ(404)と
を備える、オーディオ合成器(300)。
続きを表示(約 2,100 文字)【請求項2】
前記ダウンミックス信号(324、246、x)からプロトタイプ信号(328)を算出するように構成されたプロトタイプ信号算出器(326)であって、前記プロトタイプ信号(328)がいくつかの合成チャンネルを有する、プロトタイプ信号算出器(326)と、
混合規則算出器(402)であって、
前記原信号(212、y)の前記チャンネルレベルおよび相関情報(314、ξ、χ)、ならびに
前記ダウンミックス信号(324、246、x)に関連する前記共分散情報(C
x
)
を使用して少なくとも1つの混合規則(403)を算出するように構成された、混合規則算出器(402)と
を備え、前記合成プロセッサ(404)が、前記プロトタイプ信号(328)および前記少なくとも1つの混合規則(403)を使用して前記合成信号(336、340、y
R
)を生成するように構成される、請求項1に記載のオーディオ合成器(300)。
【請求項3】
前記原信号のターゲット共分散情報(C
y
)を再構築(386)するように構成された、請求項1または2に記載のオーディオ合成器。
【請求項4】
前記合成信号(336、340、y
R
)のチャンネルの数に適応した前記ターゲット共分散情報(C
y
)を再構築するように構成された、請求項3に記載のオーディオ合成器。
【請求項5】
原チャンネルのグループを単一の合成チャンネルに割り当てることによって、またはその逆によって、前記合成信号(336、340、y
R
)のチャンネルの数に適応した前記共分散情報(C
y
)を再構築し、その結果、前記再構築されたターゲット共分散情報(
JPEG
2024029071000187.jpg
8
170
)が前記合成信号(336、340、y
R
)のいくつかのチャンネルに報告されるように構成された、請求項4に記載のオーディオ合成器。
【請求項6】
前記いくつかの原チャンネルに関する前記ターゲット共分散情報を生成し、続いてダウンミキシング規則またはアップミキシング規則およびエネルギー補償を適用して前記合成チャンネルの前記ターゲット共分散に到達することによって、前記合成信号(336、340、y
R
)のチャンネルの前記数に適応した前記共分散情報(C
y
)を再構築するように構成された、請求項5に記載のオーディオ合成器。
【請求項7】
元の共分散情報(C
y
)の推定バージョン(
JPEG
2024029071000188.jpg
8
170
)に基づいて前記共分散情報(C
y
)のターゲットバージョン(
JPEG
2024029071000189.jpg
9
170
)を再構築するように構成され、前記元の共分散情報(C
y
)の前記推定バージョン(
JPEG
2024029071000190.jpg
9
170
)が、前記いくつかの合成チャンネルまたは前記いくつかの原チャンネルに報告される、
請求項3から6のいずれか一項に記載のオーディオ合成器。
【請求項8】
前記ダウンミックス信号(324、246、x)に関連する共分散情報(C
x
)から前記元の共分散情報の前記推定バージョン(
JPEG
2024029071000191.jpg
9
170
)を取得するように構成された、請求項7に記載のオーディオ合成器。
【請求項9】
前記ダウンミックス信号(324、246、x)に関連する前記共分散情報(C
x
)に、前記プロトタイプ信号を算出するためのプロトタイプ規則(326)である、または前記プロトタイプ規則(326)に関連する推定規則(Q)を適用することによって、前記元の共分散情報(220)の前記推定バージョン(
JPEG
2024029071000192.jpg
9
170
)を取得するように構成された、請求項8に記載のオーディオ合成器。
【請求項10】
少なくとも1対のチャンネルについて、前記元の共分散情報(C
y
)の前記推定バージョン(
JPEG
2024029071000193.jpg
9
170
)を、前記対のチャンネルのうちの前記チャンネルの前記レベルの平方根に正規化するように構成された、請求項8または9に記載のオーディオ合成器。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
1. 序論
ここでは符号化および復号の技法のいくつかの例が開示される。詳細には、たとえばDirACフレームワークを使用して、マルチチャンネルオーディオコンテンツを低ビットレートで符号化および復号するための発明である。この方法によって、低ビットレートを使用しながら高品質の出力を得ることが可能になる。これは、芸術作品、通信、および仮想現実を含む多くのアプリケーションに使用され得る。
続きを表示(約 2,100 文字)【背景技術】
【0002】
1.1. 先行技術
本セクションでは、先行技術について簡単に説明する。
【0003】
1.1.1 マルチチャンネルコンテンツの離散コーディング(discrete coding)
マルチチャンネルコンテンツをコーディングおよび送信するための最も簡単な手法は、事前の処理も仮定もなしに、マルチチャンネルオーディオ信号の波形を直接定量化および符号化することである。この方法は理論的には完全に機能するが、マルチチャンネルコンテンツを符号化するためにビット消費量を必要とするという大きな欠点が1つある。したがって、説明する他の方法(および提案する発明)は、元のオーディオマルチチャンネル信号自体の代わりに、メタパラメータを使用してマルチチャンネルオーディオ信号を記述および送信するので、いわゆる「パラメトリック手法」である。
【0004】
1.1.2 MPEGサラウンド
MPEGサラウンドは、2006年に最終決定された、マルチチャンネルサウンドのパラメトリックコーディングのためのISO/MPEG規格である[1]。この方法は、主に2つのパラメータセットに依存する。
- 所与のマルチチャンネルオーディオ信号のあらゆるチャンネル間のコヒーレンスを表す、チャンネル間コヒーレンス(ICC: Interchannel coherence)。
- マルチチャンネルオーディオ信号の2つの入力チャンネル間のレベル差に対応する、チャンネルレベル差(CLD: Channel Level Difference)。
【0005】
MPEGサラウンドの特殊性の1つは、いわゆる「ツリー構造」の使用であり、この構造により「単一の出力チャンネルを用いて2つの入力チャンネルを記述する」([1]からの引用)ことが可能になる。一例として、以下では、MPEGサラウンドを使用した5.1マルチチャンネルオーディオ信号の符号化器方式を見出すことができる。この図では、6つの入力チャンネル(図では「L」、「L
S
」、「R」、「R
S
」、「C」、および「LFE」と表記)が、ツリー構造要素(図では「R_OTT」と表記)を介して連続して処理される。これらのツリー構造要素はそれぞれ、パラメータのセット(前述のICCおよびCLD)および残差信号を作成し、これらのパラメータのセットおよび残差信号は、別のツリー構造を介して再度処理され、別のパラメータのセットを生成することになる。ツリーの終端に達すると、ダウンミックスされた信号と同様に、これまでに計算された様々なパラメータが復号器に送信される。これらの要素は、出力マルチチャンネル信号を生成するために復号器によって使用され、復号器処理は、基本的に、符号化器によって使用されるツリー構造とは逆のツリー構造である。
【0006】
MPEGサラウンドの主な強みは、この構造の使用および前述のパラメータの使用に依存している。しかし、MPEGサラウンドの欠点の1つは、ツリー構造に起因するその柔軟性の欠如である。また、処理の特異性に起因して、いくつかの特定のアイテムにおいて品質の低下が生じる場合がある。
【0007】
特に、[1]から抜粋した5.1信号用のMPEGサラウンド符号化器の概要を示す図7を参照されたい。
【0008】
1.2. 方向性オーディオコーディング
方向性オーディオコーディング(略して「DirAC: Directional Audio Coding」)[2]もまた、空間オーディオを再現するためのパラメトリック手法であり、フィンランドにあるアールト大学のVille Pulkkiによって開発された。DirACは、2つのパラメータセットを使用して空間サウンドを記述する周波数帯域処理に依存する。
- オーディオ信号における主要なサウンドの到来方向を表す度単位の角度である、到来方向(DOA: Direction Of Arrival)。
- サウンドがどの程度「拡散」するかを表す0と1との間の値である、拡散性。値が0である場合、サウンドは、拡散性がなく、正確な角度から到来する点状の音源として取り込まれ得、値が1である場合、サウンドは、十分に拡散性があり、「あらゆる」角度から到来すると仮定される。
【0009】
DirACでは、出力信号を合成するために、サウンドが拡散部分と非拡散部分に分解されると仮定する。拡散サウンド合成は、周囲のサウンドの知覚を作成することを目的とし、直接サウンド合成は、主要なサウンドを生成することを目的とする。
【0010】
DirACは高品質の出力を提供するが、大きな欠点が1つある。それは、マルチチャンネルオーディオ信号を対象としていないことであった。したがって、DOAおよび拡散パラメータは、マルチチャンネルオーディオ入力を記述するにはあまり適しておらず、結果として、出力の品質が影響を受ける。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
アクセサリー型集音器
今日
横浜ゴム株式会社
音響材
7日前
横浜ゴム株式会社
音響材
7日前
横浜ゴム株式会社
音響材
7日前
横浜ゴム株式会社
水中音響材
10日前
ヤマハ株式会社
ヘルムホルツ共鳴器
1か月前
大和ハウス工業株式会社
音再現設備
14日前
岡山県
吸音構造
7日前
セイコーエプソン株式会社
吸音ボード
28日前
日産自動車株式会社
防音構造体
28日前
株式会社第一興商
カラオケ装置
6日前
株式会社第一興商
カラオケ装置
1か月前
株式会社第一興商
カラオケ装置
14日前
コスモネクスト株式会社
入力支援プログラム及び入力支援方法
21日前
京セラ株式会社
音出力装置及び音出力方法
28日前
日本放送協会
音声認識装置およびプログラム
28日前
本田技研工業株式会社
能動型騒音低減装置
6日前
本田技研工業株式会社
能動型騒音低減装置
6日前
本田技研工業株式会社
能動型騒音低減装置
28日前
本田技研工業株式会社
能動型騒音低減装置
1か月前
個人
発音体モジュール
1日前
カシオ計算機株式会社
楽器用電子機器
6日前
株式会社アナザーウェア
鍵盤画面表示プログラム及びそのシステム
1か月前
トヨタ自動車株式会社
異音診断システム
1か月前
株式会社永セ仁
「パワハラ」等ハラスメント発言に係る職場環境測定システム
10日前
株式会社コルグ
音波生成装置、音波生成方法、プログラム
21日前
ソフトバンクグループ株式会社
行動制御システム
21日前
株式会社AZSTOKE
調整装置、およびプログラム
6日前
本田技研工業株式会社
音声認識装置、音声認識方法、およびプログラム
13日前
永楽電気株式会社
放送音声文字化システム及び放送設備における故障診断方法
28日前
ヤマハ株式会社
響板、その製造方法および響板を備える楽器
13日前
東日本電信電話株式会社
演奏補助装置、演奏補助方法、及び、演奏補助プログラム
13日前
パイオニア株式会社
情報処理装置
15日前
ドーナッツロボティクス株式会社
音声処理システム、音声処理方法
21日前
ヤマハ株式会社
信号生成方法、表示制御方法およびプログラム
7日前
株式会社イノアックコーポレーション
防音カバー
6日前
続きを見る