TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025063033
公報種別公開特許公報(A)
公開日2025-04-15
出願番号2024218152,2022506569
出願日2024-12-12,2020-07-30
発明の名称IVASビットストリームの符号化および復号化
出願人ドルビー ラボラトリーズ ライセンシング コーポレイション
代理人個人,個人,個人,個人
主分類G10L 19/00 20130101AFI20250408BHJP(楽器;音響)
要約【課題】没入型音声オーディオサービス(IVAS)ビットストリームを符号化/復号化する方法を提供する。
【解決手段】符号化方法は、IVASビットストリームの共通ヘッダー(CH)セクション内の符号化モードインジケーターを符号化することと、ビットストリームの、CHセクションの後に続くツールヘッダー(TH)セクション内のモードヘッダー又はツールヘッダーを符号化することと、ビットストリームの、CHセクションの後に続くメタデータペイロード(MDP)セクション内のメタデータペイロードを符号化することと、ビットストリームの、CHセクションの後に続くEVSペイロード(EP)セクション内の拡張型音声サービス(EVS)ペイロードを符号化することと、符号化されたビットストリームを記憶またはストリーミングすることと、を含む。
【選択図】図4B
特許請求の範囲【請求項1】
オーディオ信号のビットストリームを復号化する方法であって、
前記ビットストリームのフレーム長を決定することと、
決定した前記フレーム長に基づいて没入型音声オーディオサービス(IVAS)ビットレート分布制御テーブルのテーブル行インデックスを求めることと、
前記テーブル行インデックスで前記IVASビットレート分布制御テーブルにアクセスして、IVASデコーダーを構成するためのチャネルの数および量子化ストラテジーインジケーターを特定することと、
没入型音声オーディオサービス(IVAS)デコーダーを使用して、IVASビットストリームの共通ヘッダー(CH)セクション内の符号化モードインジケーターまたは符号化ツールインジケーターを抽出して復号化することであって、前記符号化モードインジケーターまたは前記符号化ツールインジケーターは、前記オーディオ信号の符号化モードまたは符号化ツールを示すことと、
前記IVASデコーダーを使用して、前記IVASビットストリームのツールヘッダー(TH)セクション内のモードヘッダーまたはツールヘッダーを抽出して復号化することであって、前記THセクションは、前記IVASビットレート分布制御テーブルに関連するデータを含むことと、
前記IVASデコーダーを使用して、メタデータペイロードを前記IVASビットストリームのメタデータペイロード(MDP)セクションから抽出して復号化することであって、前記メタデータペイロードは空間メタデータを含むことと、
量子化レベルインジケーターに基づいて量子化レベルのセットから量子化レベルを決定することと、
決定した前記量子化レベルに応じて前記空間メタデータを量子化解除することと、
前記IVASデコーダーを使用して、ペイロードを前記ビットストリームのペイロードセクションから抽出して復号化することであって、前記ペイロードは、前記オーディオ信号の各チャネルまたは各ダウンミックスチャネルの符号化ビットを含むことと、
前記符号化モードまたは符号化ツールインジケーター、前記モードヘッダーまたはツールヘッダー、量子化解除された前記空間メタデータ、および前記ペイロードに基づいて、デバイス上での再生のための前記オーディオ信号を再構成またはレンダリングすることと、
を含む、方法。
続きを表示(約 1,300 文字)【請求項2】
前記デバイスにおける前記オーディオ信号の再構成またはレンダリングに使用するための前記デバイスのオーディオデコーダーを、前記符号化モードインジケーターもしくは前記符号化ツールインジケーター、前記モードヘッダーもしくは前記ツールヘッダー、前記ペイロード、および前記メタデータペイロードに基づいて制御すること、または、前記符号化モードインジケーターもしくは前記符号化ツールインジケーター、前記モードヘッダーもしくは前記ツールヘッダー、前記ペイロード、および前記メタデータペイロードの表現を非一時的コンピューター可読媒体上に記憶することを更に含む、請求項1に記載の方法。
【請求項3】
前記CHはマルチビットデータ構造体であり、前記マルチビットデータ構造体の1つの値は、空間再構成(SPAR)符号化モードに対応し、前記データ構造体の他の値は、他の符号化モードに対応する、請求項1に記載の方法。
【請求項4】
前記IVASビットレート分布制御テーブルの前記テーブル行インデックスを計算するためのインデックスオフセットをそれぞれ前記IVASビットストリームの前記THセクションに記憶することまたは前記THセクションから読み出すことを含む、請求項1に記載の方法。
【請求項5】
ビットストリーム符号化ストラテジーインジケーターと、
係数のセットの量子化および符号化された実部および虚部と、
を、それぞれ前記IVASビットストリームの前記MDPセクションに記憶することまたは前記MDPセクションから読み出すことを含む、請求項1に記載の方法。
【請求項6】
前記IVASビットストリームの前記MDPセクション内のビット数および前記IVASビットストリームの前記ペイロードセクションのビット数は、IVASビットレートバジェットにおける全ての利用可能なビットの利用を確保するために、前記IVASビットレート分布制御テーブルおよびビットレート分布アルゴリズムに従って変化する、請求項1に記載の方法。
【請求項7】
各符号化チャネルまたは各ダウンミックスチャネルのビットレートは、符号化に利用可能なビットの総数、前記IVASビットレート分布制御テーブルおよびビットレート分布アルゴリズムによって求められる、請求項1に記載の方法。
【請求項8】
前記係数のセットは、予測係数、ダイレクト係数、対角実数係数および下三角複素係数を含む、請求項5に記載の方法。
【請求項9】
前記予測係数は、エントロピー符号化に基づく可変ビット長であり、前記ダイレクト係数、前記対角実数係数および下三角複素係数は、ダウンミックス構成およびエントロピー符号化に基づく可変ビット長である、請求項8に記載の方法。
【請求項10】
前記量子化ストラテジーインジケーターは、前記量子化ストラテジーを示すマルチビットデータ構造体である、請求項1に記載の方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
[関連出願の相互参照]
本出願は、2019年8月1日に出願された米国仮出願第62/881,541号、2019年10月30日に出願された米国仮出願第62/927,894号、2020年6月11日に出願された米国仮出願第63/037,721号、および2020年7月28日に出願された米国仮出願第63/057,666号の優先権を主張する。これらの米国仮出願の全体の開示内容は、本願において参考のため援用する。
続きを表示(約 3,000 文字)【0002】
本開示は、包括的には、オーディオビットストリームの符号化および復号化に関する。
【背景技術】
【0003】
音声およびビデオのエンコーダー/デコーダー(「コーデック」)の規格開発は、近年、没入型音声オーディオサービス(IVAS:immersive voice and audio service)の
コーデックの開発に焦点を当てている。IVASは、様々なオーディオサービス能力をサポートすることが期待されている。これらのオーディオサービス能力には、モノラルからステレオへのアップミックス(upmixing:アップミキシング)ならびに完全没入型オーディオ符号化、復号化およびレンダリングが含まれるが、これらに限定されるものではない。IVASは、広範囲のデバイス、エンドポイント、およびネットワークノードによってサポートされることが意図されている。これらの広範囲のデバイス、エンドポイント、およびネットワークには、モバイルフォンおよびスマートフォン、電子タブレット、パーソナルコンピューター、会議電話、会議室、仮想現実(VR:virtual reality)デバイス
および拡張現実(AR:augmented reality)デバイス、ホームシアターデバイス、なら
びに他の適したデバイスが含まれるが、これらに限定されるものではない。これらのデバイス、エンドポイントおよびネットワークノードは、音のキャプチャーおよびレンダリング用の様々な音響インターフェースを有することができる。
【発明の概要】
【0004】
IVASビットストリームを符号化および復号化する実施態様が開示される。
【0005】
いくつかの実施態様において、オーディオ信号のビットストリームを生成する方法は、没入型音声オーディオサービス(IVAS)エンコーダーを使用して、符号化モードインジケーターまたは符号化ツールインジケーターを求めることであって、前記符号化モードインジケーターまたは前記符号化ツールインジケーターは、前記オーディオ信号の符号化モードまたは符号化ツールを示すことと、前記IVASエンコーダーを使用して、前記符号化モードインジケーターまたは前記符号化ツールインジケーターをIVASビットストリームの共通ヘッダー(CH)セクション内に符号化することと、前記IVASエンコーダーを使用して、モードヘッダーまたはツールヘッダーを求めることと、前記IVASエンコーダーを使用して、前記モードヘッダーまたは前記ツールヘッダーを前記IVASビットストリームのツールヘッダー(TH)セクション内に符号化することであって、該THセクションは前記CHセクションの後に続くことと、前記IVASエンコーダーを使用して、空間メタデータを含むメタデータペイロードを求めることと、前記IVASエンコーダーを使用して、前記メタデータペイロードを前記IVASビットストリームのメタデータペイロード(MDP)セクション内に符号化することであって、該MDPセクションは、前記CHセクションの後に続くことと、前記IVASエンコーダーを使用して、拡張型音声サービス(EVS)ペイロードを求めることであって、該EVSペイロードは、前記オーディオ信号の各チャネルまたは各ダウンミックスチャネルのEVS符号化ビットを含むことと、前記IVASエンコーダーを使用して、前記EVSペイロードを前記IVA
SビットストリームのEVSペイロード(EP)セクション内に符号化することであって、該EPセクションは前記CHセクションの後に続くこととを含む。
【0006】
いくつかの実施態様において、前記IVASビットストリームは非一時的コンピューター可読媒体上に記憶される。他の実施態様において、前記IVASビットストリームは下流デバイスにストリーミングされ、前記符号化モードまたは前記符号化ツールインジケーター、前記モードヘッダーまたは前記ツールヘッダー、前記メタデータペイロードおよび前記EVSペイロードは、前記下流デバイスまたは別のデバイスにおける前記オーディオ信号の再構成に使用するために、前記IVASビットストリームの前記CHセクション、前記THセクション、前記MDPセクションおよび前記EPセクションからそれぞれ抽出されて復号化される。
【0007】
いくつかの実施態様において、オーディオ信号のビットストリームを復号化する方法は、没入型音声オーディオサービス(IVAS)デコーダーを使用して、IVASビットストリームの共通ヘッダー(CH)セクション内の符号化モードインジケーターまたは符号化ツールインジケーターを抽出して復号化することであって、前記符号化モードインジケーターまたは前記符号化ツールインジケーターは、前記オーディオ信号の符号化モードまたは符号化ツールを示すことと、前記IVASデコーダーを使用して、前記IVASビットストリームの前記ツールヘッダー(TH)セクション内のモードヘッダーまたはツールヘッダーを抽出して復号化することであって、該THセクションは前記CHセクションの後に続くことと、前記IVASデコーダーを使用して、メタデータペイロードを前記IVASビットストリームのメタデータペイロード(MDP)セクションから抽出して復号化することであって、該MDPセクションは前記CHセクションの後に続き、前記メタデータペイロードは空間メタデータを含むことと、前記IVASデコーダーを使用して、拡張型音声サービス(EVS)ペイロードを前記IVASビットストリームのEVSペイロード(EP)セクションから抽出して復号化することであって、該EPセクションは前記CHセクションの後に続き、前記EVSペイロードは、前記オーディオ信号の各チャネルまたは各ダウンミックスチャネルのEVS符号化ビットを含むこととを含む。
【0008】
いくつかの実施態様において、下流デバイスまたは別のデバイスにおける前記オーディオ信号の再構成に使用するための該下流デバイスのオーディオデコーダーが、前記符号化モードインジケーターもしくは前記符号化ツールインジケーター、前記モードヘッダーもしくは前記ツールヘッダー、前記EVSペイロード、および前記メタデータペイロードに基づいて制御される。他の実施態様において、前記符号化モードインジケーターもしくは前記符号化ツールインジケーター、前記モードヘッダーもしくは前記ツールヘッダー、前記EVSペイロード、および前記メタデータペイロードの表現(representation)が非一時的コンピューター可読媒体上に記憶する。
【0009】
いくつかの実施態様において、各EVS符号化チャネルまたは各ダウンミックスチャネルのビットレートは、EVSの利用可能な全ビット、SPARビットレート分布制御テーブルおよびビットレート分布アルゴリズムによって求められる。
【0010】
いくつかの実施態様において、前記CHはマルチビットデータ構造体であり、該マルチビットデータ構造体の1つの値は、空間再構成(SPAR)符号化モードに対応し、該データ構造体の他の値は、他の符号化モードに対応する。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
リアルタイム翻訳システム
5日前
株式会社SOU
保護具
18日前
三井化学株式会社
防音構造
12日前
三井化学株式会社
遮音構造体
19日前
三井化学株式会社
防音構造体
13日前
東レ・セラニーズ株式会社
混繊不織布
18日前
スマートライフサプライ合同会社
楽器スタンド
18日前
中強光電股ふん有限公司
電子システム及びその制御方法
18日前
トヨタ自動車株式会社
情報処理装置
5日前
株式会社第一興商
カラオケ装置
14日前
ドリックス株式会社
消音パネル
15日前
カシオ計算機株式会社
電子機器
18日前
株式会社しくみ
音声翻訳プログラム
今日
株式会社JVCケンウッド
聴音装置、聴音方法及びプログラム
18日前
カシオ計算機株式会社
電子鍵盤楽器
18日前
ソフトバンクグループ株式会社
システム
13日前
ソフトバンクグループ株式会社
システム
13日前
ソフトバンクグループ株式会社
システム
14日前
ソフトバンクグループ株式会社
システム
13日前
ソフトバンクグループ株式会社
システム
18日前
ソフトバンクグループ株式会社
システム
13日前
ソフトバンクグループ株式会社
システム
13日前
ソフトバンクグループ株式会社
システム
13日前
ソフトバンクグループ株式会社
システム
13日前
ソフトバンクグループ株式会社
システム
13日前
ソフトバンクグループ株式会社
システム
18日前
ソフトバンクグループ株式会社
システム
14日前
ソフトバンクグループ株式会社
システム
14日前
ソフトバンクグループ株式会社
システム
14日前
ソフトバンクグループ株式会社
システム
15日前
ソフトバンクグループ株式会社
システム
15日前
ソフトバンクグループ株式会社
システム
15日前
ソフトバンクグループ株式会社
システム
15日前
ソフトバンクグループ株式会社
システム
15日前
ソフトバンクグループ株式会社
システム
15日前
ソフトバンクグループ株式会社
システム
15日前
続きを見る