TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025166148
公報種別公開特許公報(A)
公開日2025-11-05
出願番号2025134717,2024153760
出願日2025-08-13,2020-03-04
発明の名称ハイブリッドビデオ符号化ツールのための使用事例駆動コンテキストモデル選択
出願人フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
代理人弁理士法人鷲田国際特許事務所
主分類H04N 19/13 20140101AFI20251028BHJP(電気通信技術)
要約【課題】圧縮効率の低下を回避する画像又はビデオのデコーダ、エンコーダ、方法及び非一時的なコンピュータ可読媒体を提供する。
【解決手段】装置200において、画像を復号するためのデコーダ202は、画像を表す符号化データを含むビットストリームを受信することと、画像のブロックについて、ブロックの第1の寸法がブロックの第2の寸法の2倍より大きいか否かを判断することと、判断の結果に基づいて、コンテキストを選択することと、選択されたコンテキストを使用して、ビットストリームから、ブロックに関連付けられたフラグを復号することと、フラグに一部基づき、ブロックを復号することと、を行う。前記フラグは、ブロックを復号するのに線形重み付きイントラ予測(LWIP)符号化ツールを使用するか否かを示す。
【選択図】図4
特許請求の範囲【請求項1】
画像を復号するためのデコーダであって、該デコーダは少なくとも1つのプロセッサを含み、該プロセッサは、
前記画像を表す符号化データを含むビットストリームを受信することと、
前記画像のブロックについて、前記ブロックの第1の寸法が前記ブロックの第2の寸法の2倍より大きいか否かを判断することと、
前記判断の結果に基づいて、コンテキストを選択することと、
前記選択されたコンテキストを使用して、前記ビットストリームから、前記ブロックに関連付けられたフラグを復号することであって、前記フラグは、前記ブロックを復号するのに線形重み付きイントラ予測(LWIP)符号化ツールを使用するか否かを示す、前記復号することと、
前記フラグに一部基づき、前記ブロックを復号することと、
を行うように構成される、デコーダ。
続きを表示(約 1,500 文字)【請求項2】
前記プロセッサは、
前記ブロックの前記第1の寸法が前記ブロックの前記第2の寸法の2倍より大きいという判断に応答して、第1のコンテキストを選択することと、
前記ブロックの前記第1の寸法が前記ブロックの前記第2の寸法の2倍より大きくないという判断に応答して、第2のコンテキストを選択することと、
を行うようにさらに構成され、
前記第1のコンテキストと前記第2のコンテキストとは異なる、
請求項1に記載のデコーダ。
【請求項3】
前記ブロックの前記第1の寸法は前記ブロックの高さであり、前記第2の寸法は前記ブロックの幅であり、または、
前記ブロックの前記第1の寸法は前記ブロックの幅であり、前記第2の寸法は前記ブロックの高さである、
請求項1に記載のデコーダ。
【請求項4】
前記少なくとも1つのプロセッサは、
第1の値を表す前記フラグに応答して、前記ブロックを復号するのに前記LWIP符号化ツールを使用することを決定することと、
前記第1の値と異なる第2の値を示す前記フラグに応答して、前記ブロックを復号するのに前記LWIP符号化ツールを使用しないことを決定することと、
を行うようにさらに構成される、
請求項1に記載のデコーダ。
【請求項5】
前記第1の値は1であり、
前記第2の値は0である、
請求項4に記載のデコーダ。
【請求項6】
前記少なくとも1つのプロセッサは、
前記ブロックを復号するのに前記LWIP符号化ツールを使用することを決定した後、利用可能なLWIPモードのセットについてモードインデックスを復号すること、を行うようにさらに構成される、
請求項4に記載のデコーダ。
【請求項7】
前記LWIP符号化ツールは行列ベースのイントラ予測に対応する、
請求項1に記載のデコーダ。
【請求項8】
画像を復号するための方法であって、該方法は、
前記画像を表す符号化データを含むビットストリームを受信することと、
前記画像のブロックについて、前記ブロックの第1の寸法が前記ブロックの第2の寸法の2倍より大きいか否かを判断することと、
前記判断の結果に基づいて、コンテキストを選択することと、
前記選択されたコンテキストを使用して、前記ビットストリームから、前記ブロックに関連付けられたフラグを復号することであって、前記フラグは、前記ブロックを復号するのに線形重み付きイントラ予測(LWIP)符号化ツールを使用するか否かを示す、前記復号することと、
前記フラグに一部基づき、前記ブロックを復号することと、
を含む、方法。
【請求項9】
前記ブロックの前記第1の寸法が前記ブロックの前記第2の寸法の2倍より大きいという判断に応答して、第1のコンテキストを選択し、
前記ブロックの前記第1の寸法が前記ブロックの前記第2の寸法の2倍より大きくないという判断に応答して、第2のコンテキストを選択し、
前記第1のコンテキストと前記第2のコンテキストとは異なる、
請求項8に記載の方法。
【請求項10】
前記ブロックの前記第1の寸法は前記ブロックの高さであり、前記第2の寸法は前記ブロックの幅であり、または、
前記ブロックの前記第1の寸法は前記ブロックの幅であり、前記第2の寸法は前記ブロックの高さである、
請求項8に記載の方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、ピクチャ、画像又はビデオを符号化/復号する分野に関し、より具体的には、コンテキスト適応バイナリ算術符号化CABACエンジンのコンテキスト若しくはコンテキストモードを使用する、多用途のビデオ符号化VVC規格の、アフィン線形重み付きイントラ予測LWIP、又は行列ベースのイントラ予測MIPなどの、1つ又は複数の符号化ツールの符号化に関する。実施形態は、処理される画像又はビデオデータのブロックのアスペクト比に応じて選択されたコンテキストモデルに基づくVVC規格のLWIP又はMIPの適用可能性を示す、intra_mip_flagのようなフラグの符号化に関する。
続きを表示(約 2,500 文字)【背景技術】
【0002】
ITU T H.265|MPEG H HEVC[1]のような最先端のビデオ符号化規格では、ピクチャは固定された正方形サイズのCodingTreeUnitに分割され、これはより小さいブロックに更に細分化することができる。このようなブロックの再構築された信号は、通常、予測信号と残差信号との重畳である。予測信号は、隣接する近隣のサンプルを現在のブロックに外挿すること(イントラ予測)、又は1つ若しくは2つの参照ピクチャからのサンプルのフィルタリングされた表現若しくはフィルタリングされていない表現をコピーすること(インター予測)のいずれかによって得られる。参照ピクチャは、ビットストリームから既に再構築されており、参照のためにピクチャバッファに格納されているピクチャである。残差信号は、ビットストリームから読み出された逆量子化された変換係数を逆変換することによって得られる。ブロック再構築プロセスの後、再構築されたブロックの信号を強調し、再構築されたピクチャを取得するために、インループフィルタが適用される。
【0003】
ビットストリームから変換係数、デルタQP、イントラ予測モード、動きベクトルの違いなどのシンボルを読み取るエントロピー復号プロセスは、コンテキスト適応バイナリ算術符号化(CABAC)エンジンを使用して、ビットストリームから読み取られたビットをバイナリ決定(ビン)に変換するパーサによって行われる。パーサは、これらのビンをシンボル又は構文要素に変換又は結合する。エントロピー符号化プロセスの適応性は、CABACコンテキスト(CC)を使用することによって実現される。各コンテキストは、特定のシンボル又はシンボルのセットのエントロピーをモデル化する適応確率モデルを表す。適応という用語は、現在の符号化状態に向かうモデルの永続的な更新を示す。したがって、モデルは、対応するシンボルのローカル統計に適応する。更新ステップは、通常、算術符号化演算に埋め込まれる。まず、CCの現在の状態は、算術符号化プロセスをパラメータ化するために使用される。次に、復号されたシンボルが導出されると、それは、現在の復号された確率に対して所与のステップサイズでCCを更新するために使用される。
【0004】
JEM-Software[2]並びに近い将来のVVC規格[3]においても、算術符号化処理に関する種々の改良が評価され、採用されている。算術符号化エンジンは変更されており、CCの初期化及び更新プロセスも改善されている。確率表現のダイナミックレンジ並びにCCの更新プロセスの挙動が改良されている。各CCは、現在の確率に対するCCの適応強度を制御する個々の2レベル更新ステップを有する。この改善は、予想されるCC使用統計に従ってCC更新プロセスをカスタマイズするのに役立つ。
【0005】
構文要素を送信するために必要とされるバイナリ決定の数が多いため、また、そのような構文要素の数のため、バイナリ決定は、デコーダによって処理され得るCCの実用的な数又は量に達するために、同じCCを使用してグループ化されなければならない。更に、グループ化は、更新プロセスがローカル統計を活用するのに役立ち、基礎となる確率モデルの安定性を改善する。
【0006】
同じ構文要素に属する統計的に類似した確率を有するバイナリ決定は、通常、1つのCCにグループ化される。この種のグループ化の例外は、バイナリ決定が隣接する近隣の既に復号されたシンボルから予測できる確率が異なる可能性が高い事例で行われる。この事例では、選択されたCCは、隣接する近隣の既に復号されたシンボルから予測される。このような手順は、通常、ビットストリームでかなり頻繁に送信されるシンボルに適用される。
【0007】
コンテキスト制御算術符号化の他に、0.5の固定確率を有するバイパスモードがある。算術コーダに組み込まれたこのバイパスモードは、高スループットのための低複雑度モードである。バイパスモードは、例えば、変換符号化に広く使用される。
【発明の概要】
【発明が解決しようとする課題】
【0008】
ビデオ符号化方法の進化は、ますます多様なブロック形状及びますます多くの符号化ツールを示しており、良好な符号化表現を見つけるためのエンコーダにおけるかなりの量のアルゴリズム複雑性をもたらしている。したがって、エンコーダでは、特定のコンテキストにおける符号化ツールの評価(すなわち、スイッチオフ)をスキップして、より良好な複雑さ対圧縮効率トレードオフを達成することが有益であり得る。ブロックに対する符号化ツールの使用は、通常、ビットストリーム内のコンテキストモデル化ツール有効化フラグを送信することによってデコーダに伝達される。
【0009】
理想的には、デコーダは、ツール有効化フラグ、すなわち、例えば符号化モード又は予測モードのようなツールが特定のブロックに適用されるか否かを決定するフラグが、ビットストリームで送信されるか否かについての制約を最小限に有する。その理由は、特定の事例でツールを無効にすると、これらのシナリオがかなり可能性が低い事例であっても、いくつかのシナリオで圧縮性能への影響が悪化する可能性があるためである。実際、ハイブリッドビデオコーデックの効率性の主な理由の1つは、非常に多種多様な競合する符号化ツールが常に可能であり、所与の事例でこれらのツールのうちの1つのみが選択されることである。
【0010】
例えば、小さなブロックサイズに対してのみツールを許可し、したがってツール有効化フラグを送信することに対する制約は、小さなブロックの小さな部分のみを通常含む非常に高い解像度を有する将来のアプリケーションの符号化効率を潜在的に低下させる。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

個人
イヤーピース
1日前
個人
イヤーマフ
15日前
個人
監視カメラシステム
24日前
キーコム株式会社
光伝送線路
25日前
個人
スイッチシステム
9日前
WHISMR合同会社
収音装置
1か月前
サクサ株式会社
中継装置
1か月前
サクサ株式会社
中継装置
1か月前
個人
スキャン式車載用撮像装置
24日前
アイホン株式会社
電気機器
1か月前
キヤノン株式会社
撮像装置
2か月前
個人
ワイヤレスイヤホン対応耳掛け
1か月前
ヤマハ株式会社
放音制御装置
9日前
サクサ株式会社
無線システム
29日前
サクサ株式会社
無線通信装置
1か月前
サクサ株式会社
無線通信装置
1か月前
キヤノン電子株式会社
画像読取装置
9日前
キヤノン電子株式会社
画像読取装置
1か月前
個人
映像表示装置、及びARグラス
10日前
株式会社リコー
画像形成装置
17日前
株式会社リコー
画像形成装置
2か月前
株式会社リコー
画像形成装置
2か月前
キヤノン電子株式会社
画像読取装置
23日前
キヤノン電子株式会社
画像読取装置
1日前
株式会社リコー
画像形成装置
3か月前
キヤノン株式会社
撮像システム
1か月前
日本電気株式会社
海底分岐装置
25日前
ブラザー工業株式会社
読取装置
2か月前
キヤノン株式会社
画像処理装置
4日前
キヤノン電子株式会社
シート搬送装置
1日前
個人
発信機及び発信方法
29日前
株式会社JVCケンウッド
通信システム
1か月前
株式会社松平商会
携帯機器カバー
2か月前
有限会社フィデリックス
マイクロフォン
1か月前
キヤノン電子株式会社
シート材搬送装置
2か月前
大日本印刷株式会社
写真撮影装置
1か月前
続きを見る