TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025020389
公報種別
公開特許公報(A)
公開日
2025-02-12
出願番号
2024198195,2023094171
出願日
2024-11-13,2020-01-31
発明の名称
サブピクチャまたは領域ごとのランダムアクセスを可能にするビデオコーデックとこのビデオコーデックを使用したビデオ合成の概念
出願人
フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
代理人
弁理士法人鷲田国際特許事務所
主分類
H04N
19/597 20140101AFI20250204BHJP(電気通信技術)
要約
【課題】効果的なビデオ合成/統合又は段階的復号リフレッシュを効果的に実装するビデオコーデックの概念を、ビデオ合成/統合を効果的に可能とする概念と共に提供する。
【解決手段】デコーダ22は、ビデオの1つ以上のピクチャのセット42における各ピクチャ18の各サブピクチャ24について、データストリーム10からサブピクチャ関連情報40を復号し、サブピクチャ関連情報が第1の状態の時、ランダムアクセスポイント方式で符号化されているものとして個々のサブピクチャを識別し、第2の状態の時、ランダムアクセスポイント方式で符号化されていないものとして識別する。また、データストリームからランダムアクセスポイント・シグナリング粒度指示44を復号する。粒度指示は、第1の粒度のときサブピクチャ関連情報がそれぞれのピクチャの全てのサブピクチャに対して共通の状態をとることを示し、第2の粒度のとき異なる状態をとり得ることを示す。
【選択図】図2
特許請求の範囲
【請求項1】
データストリームからピクチャを復号する方法であって、
ピクチャに対して、NALユニットタイプが前記ピクチャの少なくとも2つのサブピクチャの間で異なるかどうかを示すフラグを前記データストリームから復号することと、
前記フラグが第1の値である場合、前記NALユニットタイプが前記ピクチャのすべての前記サブピクチャに対して同じであると決定することと、
前記フラグが、前記第1の値とは異なる第2の値である場合、前記ピクチャの第1のサブピクチャの第1のNALユニットタイプと、前記ピクチャの第2のサブピクチャの、前記第1のNALユニットタイプとは異なる第2のNALユニットタイプと、を復号することと、
を備える方法。
続きを表示(約 1,500 文字)
【請求項2】
前記第1のNALユニットタイプはランダムアクセスであり、
前記第2のNALユニットタイプはランダムアクセスではない、
請求項1に記載の方法。
【請求項3】
前記フラグは、前記データストリームのピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)、またはビデオパラメータセット(VPS)に含まれ、
各NALユニットタイプは、サブピクチャのスライスに関連付けられる、
請求項1に記載の方法。
【請求項4】
前記フラグが前記第2の値である場合、前記サブピクチャを復号する間に、前記サブピクチャの少なくとも1つをバッファに格納し、
前記ピクチャのすべての前記サブピクチャが解析または復号された後、前記バッファをフラッシュする、
ことをさらに備える、請求項1に記載の方法。
【請求項5】
前記NALユニットタイプに対応する整数値のシンタックス要素に基づいて、2つのNALユニットタイプのサブセットを区別することをさらに備え、
前記2つのNALユニットタイプのサブセットのうちの第1のサブセットは、ランダムアクセスに対応し、
前記2つのNALユニットタイプのサブセットのうちの第2のサブセットは、ランダムアクセスでないものに対応する、
請求項1に記載の方法。
【請求項6】
ピクチャに対して、NALユニットタイプが前記ピクチャの少なくとも2つのサブピクチャの間で異なるかどうかを示すフラグをデータストリームから復号し、
前記フラグが第1の値である場合、前記NALユニットタイプが前記ピクチャのすべての前記サブピクチャに対して同じであると決定し、
前記フラグが、前記第1の値とは異なる第2の値である場合、前記ピクチャの第1のサブピクチャの第1のNALユニットタイプと、前記ピクチャの第2のサブピクチャの、前記第1のNALユニットタイプとは異なる第2のNALユニットタイプとを復号する、
ように構成された、デコーダ。
【請求項7】
前記第1のNALユニットタイプはランダムアクセスであり、
前記第2のNALユニットタイプはランダムアクセスではない、
請求項6に記載のデコーダ。
【請求項8】
前記フラグは、前記データストリームのピクチャパラメータセット(PPS)、シーケンスパラメータセット(SPS)、またはビデオパラメータセット(VPS)に含まれ、
各NALユニットタイプは、サブピクチャのスライスに関連付けられる、
請求項6に記載のデコーダ。
【請求項9】
前記フラグが前記第2の値である場合、前記サブピクチャを復号する間に、前記サブピクチャの少なくとも1つをバッファに格納し、
前記ピクチャのすべての前記サブピクチャが解析または復号された後、前記バッファをフラッシュする、
ようにさらに構成された、請求項6に記載のデコーダ。
【請求項10】
前記NALユニットタイプに対応する整数値のシンタックス要素に基づいて、2つのNALユニットタイプのサブセットを区別するようにさらに構成され、
前記2つのNALユニットタイプのサブセットのうちの第1のサブセットは、ランダムアクセスに対応し、
前記2つのNALユニットタイプのサブセットのうちの第2のサブセットは、ランダムアクセスでないものに対応する、
請求項6に記載のデコーダ。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本出願は、ビデオ符号化およびビデオ合成(video composition)に関する。
続きを表示(約 2,400 文字)
【背景技術】
【0002】
様々なアプリケーションは、サブピクチャを利用しており、つまり、個別の符号化と復号化のために、ビデオピクチャをサブピクチャにサブ分割している。これらのアプリケーションの中には、360°ビデオと段階的復号リフレッシュ(gradual decoding refresh)とがある。
【0003】
360°ビデオの場合、図10の左側に示すように、サブピクチャ(HEVCの場合はタイル)が異なる解像度で個別に提供される。ユーザーは、図10の中央に示されているように、あるタイルを高解像度で、他のタイルを低解像度で、彼らの視線方向(viewing orientation)に従って選択し、図10の右側に示されているように、1つの共通のビットストリームへとマージ(統合)される。ユーザーが視線方向を変化させるときは常に、高解像度のタイルセットと低解像度のタイルのセットも変化する。ただし、高解像度のすべてのタイルが低解像度のタイルに変わるわけではなく、その逆も同様である。これは、解像度が変化するタイルのサブセットに対してのみ、切換ポイントが必要であることを意味する。この切換ポイントは通常、その特定のサブピクチャ・ビットストリームのランダムアクセスポイント(RAP)である。
【0004】
段階的復号リフレッシュ(GDR)は、図11に示されるように、非RAPでビットストリームの復号を開始し、所与の数のピクチャを復号した後、復号プロセスがRAPで開始された場合と同じような品質でビデオを表示できるようにするメカニズムである。
【0005】
図11では、例えば(符号化順序900で連続する)4つの連続する非RAPピクチャが、3つのタイルグループtile_group0、tile_group1、tile_group2へと、つまりそれぞれのピクチャの領域へと、均等にサブ分割されていることが示される。ビデオ902のピクチャは、参照記号904a~904dによって示され、それらがサブ分割された領域は、参照記号906を使用して示される。各領域906は、その中に「IRAP」と銘記されることによって、自己完結型の方法で、即ちランダムアクセスポイントを形成する方法で符号化されること、又は、そうでなく、その中に「インター」と銘記されることによって、他のピクチャを参照する方法で符号化されること、を示している。図11に示される4つのピクチャ904a~904dのいずれも、すべての領域906がランダムアクセスポイントとして符号化される訳ではない。むしろ、図11の例では、その領域の1つだけがランダムアクセスポイントであるが、図11の例では、ピクチャ904a~904cなどの3つの連続するピクチャのランダムアクセスポイント領域は、ビデオ902のピクチャのピクチャ領域を空間的に完全にカバーしている。したがって、そのようなピクチャのトリプレットの後、そのようなトリプレットの最後のピクチャ、ここではピクチャ904cは、デコーダにおいてある条件下でアーチファクトのない状態で利用可能である。その条件とは、このピクチャ904cの非RAP領域が-例えば予測および/またはエントロピーコンテキスト導出の点で、即ち符号化の相互依存性(coding interdependencies)の点で-RAP領域、または、それら自身RAP領域だけに対して符号化依存性を直接的または間接的に有している非RAP領域である領域を単に参照したことを、エンコーダが管理していたという点である。つまり、復号化がRAPを用いて開始されたときのように、即座に明瞭な復号済みピクチャが達成される訳ではない。むしろ、欠落した参照のアーチファクトを排除するために、復号済みピクチャが段階的にリフレッシュされた後、しばらくして明瞭な復号済みピクチャが達成される。これはピクチャ904cである。典型的には、GDRは、コンテンツを領域(タイルなど)に分割し、それら領域を整列されていないサブピクチャRAPを用いて符号化することで実現できる。
【0006】
上記の2つのシナリオのいずれの結果としても、異なるサブビットストリームにわたる参照は変化する。また、異なるサブピクチャがI_SLICESタイプ(前に復号されたピクチャへの予測が適用されない)としてのみシグナリングされるため、異なるサブピクチャのRAPマーキングは明確には実行されず、かつ参照ピクチャリスト内でI_SLICEタイプのピクチャの前にサブピクチャを含めないことによってのみ、同じサブピクチャ・ビットストリームの連続するサブピクチャの予測が中断される。
【0007】
上記した既存のビデオ符号化の概念にも関わらず、例えば、より効果的なビデオ合成、および/または段階的復号リフレッシュのより効果的な実装を可能にする、ビデオ符号化環境の必要性が依然として存在する。
【先行技術文献】
【特許文献】
【0008】
WO 2015/059194
WO 2016/026526
【発明の概要】
【発明が解決しようとする課題】
【0009】
したがって、本発明の目的は、より効果的なビデオ合成/統合および/または段階的復号リフレッシュのより効果的な実装を可能にするビデオコーデック、および/または、例えば合成/統合作業の複雑さの観点から、ビデオ合成/統合をより効果的にすることを可能にする概念を提供することである。
【課題を解決するための手段】
【0010】
この目的は、本出願の独立請求項の要旨によって達成される。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
インターホンシステム
6日前
個人
ヘッドホンカバー
1か月前
株式会社奥村組
通信設備
13日前
オムロン株式会社
通信装置
13日前
キヤノン株式会社
電子機器
20日前
キヤノン株式会社
電子機器
22日前
キヤノン株式会社
撮像装置
2か月前
キヤノン株式会社
電子機器
15日前
BoCo株式会社
聴音装置
2か月前
BoCo株式会社
聴音装置
2か月前
キヤノン電子株式会社
画像読取装置
2か月前
日本精機株式会社
車両用の撮像装置
1か月前
キヤノン電子株式会社
画像読取装置
21日前
キヤノン電子株式会社
画像読取装置
14日前
キヤノン電子株式会社
画像読取装置
14日前
リオン株式会社
聴取装置
1か月前
キヤノン株式会社
映像表示装置
1か月前
日本放送協会
無線伝送システム
28日前
株式会社ベアリッジ
携帯無線機
2か月前
株式会社アーク
情報処理システム
1か月前
株式会社Move
イヤホン
1か月前
キヤノン電子株式会社
画像読取システム
1か月前
シャープ株式会社
表示装置
2か月前
株式会社小糸製作所
画像照射装置
28日前
キヤノン電子株式会社
画像読取システム
14日前
株式会社日立国際電気
試験システム
1か月前
株式会社JVCケンウッド
撮像装置
1か月前
日本放送協会
送信装置及び受信装置
10日前
日本放送協会
送信装置及び受信装置
10日前
個人
共鳴管型スピーカーエンクロージャー
10日前
キヤノン株式会社
画像形成システム
2か月前
個人
テレビ画面の注視する画像の表示方法
1か月前
株式会社オカムラ
電子機器支持什器
21日前
株式会社国際電気
無線通信システム
1か月前
株式会社PFU
原稿読取装置
今日
アズビル株式会社
放熱構造及びカメラ
1か月前
続きを見る
他の特許を見る