TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024166257
公報種別
公開特許公報(A)
公開日
2024-11-28
出願番号
2024153291,2023111403
出願日
2024-09-05,2019-09-17
発明の名称
双方向オプティカルフローのための複雑性低減およびビット幅制御
出願人
ヴィド スケール インコーポレイテッド
代理人
弁理士法人谷・阿部特許事務所
主分類
H04N
19/577 20140101AFI20241121BHJP(電気通信技術)
要約
【課題】ビデオコーディングにおける双方向オプティカルフロー(BIO)を使用する複雑性を低減するシステムおよび方法を提供する。
【解決手段】いくつかの実施形態では、BIO計算に使用される最大ビット幅を低減するために、ビット幅低減ステップがBIO動き精緻化プロセスに導入される。いくつかの実施形態では、簡略化された補間フィルタを使用して、カレントコーディングユニットの周りの拡張された領域における予測されたサンプルを生成する。いくつかの実施形態では、垂直補間と水平補間に対して異なる補間フィルタが使用される。いくつかの実施形態では、BIOは、小さい高さを有するコーディングユニットについて、および/または高度時間動きベクトル予測(ATMVP)若しくはアフィン予測などのサブブロックレベルインター予測技法を使用して予測されたコーディングユニットについて無効にされる。
【選択図】図7
特許請求の範囲
【請求項1】
第1の参照ピクチャから第1の予測信号アレイを取得することと、
前記第1の予測信号アレイの2つのサンプルに対して右ビットシフトを実行し、前記第1の予測信号アレイの2つの右ビットシフトされたサンプル間の差を決定することを含む、第1の勾配成分の第1のアレイを取得することと、
第2の参照ピクチャから第2の予測信号アレイを取得することと、
前記第2の予測信号アレイの2つのサンプルに対して右ビットシフトを実行し、前記第2の予測信号アレイの2つの右ビットシフトされたサンプル間の差を決定することを含む、第1の勾配成分の第2のアレイを取得することと、
前記第1の勾配成分の第1のアレイと前記第1の勾配成分の第2のアレイの合計を決定することを含む、第1の成分の中間パラメータアレイを取得することと、
前記第1の成分の中間パラメータアレイに少なくとも部分的に基づいて少なくとも第1の成分の動き精緻化を取得することと、
少なくとも前記第1の成分の動き精緻化を使用して双方向オプティカルフローを用いてビデオにおけるカレントブロックの予測を生成することと、
を含むビデオデコーディング方法。
続きを表示(約 2,200 文字)
【請求項2】
前記第1の成分の中間パラメータアレイを取得することは、前記第1の勾配成分の第1のアレイと前記第1の勾配成分の第2のアレイの合計に対して右ビットシフトを実行することを含む、請求項1の方法。
【請求項3】
前記第1の予測信号アレイと前記第2の予測信号アレイの差を取得する前に、前記第1の予測信号アレイと前記第2の予測信号アレイのそれぞれに対して右ビットシフトを実行することを含む、信号差パラメータアレイを取得することをさらに含み、前記第1の成分の動き精緻化は、前記信号差パラメータアレイに少なくとも部分的に基づく、請求項1または請求項2の方法。
【請求項4】
前記第1の成分の中間パラメータアレイは、水平中間パラメータアレイであり、前記第1の成分の動き精緻化は、水平動き精緻化であり、前記方法は、
前記信号差パラメータアレイと前記水平中間パラメータアレイとの要素ごとの乗算の成分を合計することによって信号水平勾配相関パラメータを取得することをさらに含み、
前記水平動き精緻化を取得することは、前記信号水平勾配相関パラメータをビットシフトして前記水平動き精緻化を取得することを含む、請求項3の方法。
【請求項5】
前記第1の勾配成分は、水平勾配であり、
座標(i,j)を有する前記第1のアレイの少なくとも複数の水平勾配に対して、前記第1の予測信号アレイの2つのサンプルは、座標(i+1,j)および(i-1,j)を有し、
座標(i,j)を有する前記第2のアレイの少なくとも複数の水平勾配に対して、前記第2の予測信号アレイの2つのサンプルは、座標(i+1,j)および(i-1,j)を有する、
請求項4の方法。
【請求項6】
前記第1の予測信号アレイの2つのサンプルに対して右ビットシフトを実行し、前記第1の予測信号アレイの2つの右ビットシフトされたサンプル間の差を決定することを含む、第2の勾配成分の第1のアレイを取得することと、
前記第2の予測信号アレイの2つのサンプルに対して右ビットシフトを実行し、前記第2の予測信号アレイの2つの右ビットシフトされたサンプル間の差を決定することを含む、第2の勾配成分の第2のアレイを取得することと、
前記第2の勾配成分の第1のアレイと前記第2の勾配成分の第2のアレイの合計を決定することを含む、第2の成分の中間パラメータアレイを取得することと、
前記第2の成分の中間パラメータアレイに少なくとも部分的に基づいて第2の成分の動き精緻化を取得することと、
をさらに含み、
前記カレントブロックの予測は、前記第2の成分の動き精緻化をさらに使用する、請求項3の方法。
【請求項7】
前記第2の勾配成分は、垂直勾配であり、
座標(i,j)を有する前記第1のアレイの少なくとも複数の垂直勾配に対して、前記第1の予測信号アレイの2つのサンプルは、座標(i,j+1)および(i,j-1)を有し、
座標(i,j)を有する前記第2のアレイの少なくとも複数の垂直勾配に対して、前記第2の予測信号アレイの2つのサンプルは、座標(i,j+1)および(i,j-1)を有する、
請求項6の方法。
【請求項8】
第1の参照ピクチャから第1の予測信号アレイを取得することと、
前記第1の予測信号アレイの2つのサンプルに対して右ビットシフトを実行し、前記第1の予測信号アレイの2つの右ビットシフトされたサンプル間の差を決定することを含む、第1の勾配成分の第1のアレイを取得することと、
第2の参照ピクチャから第2の予測信号アレイを取得することと、
前記第2の予測信号アレイの2つのサンプルに対して右ビットシフトを実行し、前記第2の予測信号アレイの2つの右ビットシフトされたサンプル間の差を決定することを含む、第1の勾配成分の第2のアレイを取得することと、
前記第1の勾配成分の第1のアレイと前記第1の勾配成分の第2のアレイの合計を決定することを含む、第1の成分の中間パラメータアレイを取得することと、
前記第1の成分の中間パラメータアレイに少なくとも部分的に基づいて少なくとも第1の成分の動き精緻化を取得することと、
少なくとも前記第1の成分の動き精緻化を使用して双方向オプティカルフローを用いてビデオにおけるカレントブロックの予測を生成することと、
を実行するように構成された1つまたは複数のプロセッサを備えたビデオデコーダ装置。
【請求項9】
前記第1の成分の中間パラメータアレイを取得することは、前記第1の勾配成分の第1のアレイと前記第1の勾配成分の第2のアレイの合計に対して右ビットシフトを実行することを含む、請求項8の装置。
【請求項10】
前記第1の予測信号アレイと前記第2の予測信号アレイの差を取得する前に、前記第1の予測信号アレイと前記第2の予測信号アレイのそれぞれに対して右ビットシフトを実行することを含む、信号差パラメータアレイを取得することをさらに含み、前記第1の成分の動き精緻化は、前記信号差パラメータアレイに少なくとも部分的に基づく、請求項8または請求項9の装置。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
関連出願の相互参照
本出願は、(2018年9月21日に出願された)米国特許仮出願第62/734763号、(2018年9月28日に出願された)米国特許仮出願第62/738655号、および(2019年1月7日に出願された)米国特許仮出願第62/789331号の利益を米国特許法第119条(e)に基づいて主張する非仮出願であり、それらは全て、「Complexity Reduction and Bit-Width Control for Bi-Directional Optical Flow」と題され、参照によりそれらの全体が本明細書に組み込まれている。
続きを表示(約 3,000 文字)
【背景技術】
【0002】
ビデオコーディングシステムは、デジタルビデオ信号を圧縮して、そのような信号の記憶の必要性および/または送信帯域幅を低減させるために、広く使用されている。ブロックベース、ウェーブレットベース、およびオブジェクトベースのシステムなど、ビデオコーディングシステムの様々なタイプの中でも、ブロックベースのハイブリッドビデオコーディングシステムが現在、最も広く使用され展開されている。ブロックベースのビデオコーディングシステムの例は、MPEG1/2/4パート2、H.264/MPEG-4パート10 AVC、VC-1、並びにITU-T/SG16/Q.6/VCEGおよびISO/IEC/MPEGのJCT-VC(Joint Collaborative Team on Video Coding:ビデオコーディング共同作業チーム)によって開発された高効率ビデオコーディング(HEVC)などの国際ビデオコーディング規格を含む。
【0003】
HEVC規格の最初のバージョンは、2013年10月に完成され、これは、前世代のビデオコーディング規格H.264/MPEG AVCと比較して約50%のビットレートの節約または同等の知覚品質を提供する。HEVC規格は、その前身より大幅なコーディング改善を提供するが、HEVCに対して優れたコーディング効率が追加のコーディングツールを用いて達成され得るという証拠がある。これに基づいて、VCEGとMPEGの両方が、将来のビデオコーディング規格化のための新しいコーディング技術の探索作業を開始した。2015年10月にITU-T VECGおよびISO/IEC MPEGによって共同ビデオ探索チーム(Joint Video Exploration Team:JVET)が形成され、コーディング効率の相当な向上を可能にし得る先進技術の重要な研究を開始した。HEVCテストモデル(HM)上でいくつかの追加のコーディングツールを統合することにより、JVETによって、共同探索モデル(joint exploration model:JEM)と呼ばれる参照ソフトウェアが保持された。
【0004】
2017年10月に非特許文献1がITU-TおよびISO/IECによって発行された。2018年4月に、第10回JVET会合で23のCfP応答が受領されて評価され、それらはHEVCを約40%上回る圧縮効率向上を示した。そのような評価結果に基づいて、JVETは、多用途ビデオコーディング(Versatile Video Coding:VVC)と名付けられた新世代ビデオコーディング規格を開発するための新しいプロジェクトを立ち上げた。同月に、VVCテストモデル(VTM)と呼ばれる1つの参照ソフトウェアコードベースが、VVC規格の参照実装を示すために確立された。一方、新しいコーディングツールの評価を容易にするために、ベンチマークセット(BMS)と呼ばれる別の参照ソフトウェアベースも生成された。BMSコードベースでは、より高いコーディング効率および適度な実装複雑性を提供する追加のコーディングツールのリストがVTM上に含まれ、VVC規格化プロセス中に同様のコーディング技術を評価する際のベンチマークとして使用さる。具体的には、BMS-2.0に統合された5つのJEMコーディングツールがあり、それらは、4x4非分離二次変換(non-separable secondary transform:NSST)、一般化された双予測(generalized bi-prediction:GBi)、双方向オプティカルフロー(bi-directional optical flow:BIO)、デコーダ側動きベクトル精緻化(decoder-side motion vector refinement:DMVR)、およびカレントピクチャ参照(current picture referencing:CPR)を含む。
【先行技術文献】
【非特許文献】
【0005】
joint call for proposals (CfP) on video compression with capability beyond HEVC, Oct. 2017
S. Jeong et al., “CE4 Ultimate motion vector expression (Test 4.5.4)”, JVET-L0054, Oct. 2018
S. Esenlik et al., “Simplified DMVR for inclusion in VVC”, JVET-L0670, Oct. 2018
M.-S. Chiang et al., “CE10.1.1: Multi-hypothesis prediction for improving AMVP mode, skip or merge mode, and intra mode”, JVET-L0100, Oct. 2018
M. Winken et al., “CE10-related: Multi-Hypothesis Inter Prediction with simplified AMVP process”, JVET-L0679, Oct. 2018
【発明の概要】
【0006】
本明細書に記載される実施形態は、ビデオ符号化および復号(総称して「コーディング」)において使用される方法を含む。いくつかの実施形態では、ビデオコーディング方法が提供され、この方法は、双方向オプティカルフローを使用してコーディングされたビデオにおける少なくとも1つのカレントブロックについて、第1の参照ピクチャからの第1の予測信号アレイI
(0)
(i,j)に基づいて第1の水平勾配アレイ
【0007】
TIFF
2024166257000002.tif
14
21
【0008】
を計算するステップと、第2の参照ピクチャからの第2の予測信号アレイI
(1)
(i,j)に基づいて第2の水平勾配アレイ
【0009】
TIFF
2024166257000003.tif
14
21
【0010】
を計算するステップと、(i)第1の水平勾配アレイおよび(ii)第2の水平勾配アレイの合計に対して右ビットシフトを実行するステップを含む方法によって、縮小ビット幅水平中間パラメータアレイ(reduced-bit-width horizontal intermediate parameter array)Ψ
x
(i,j)を計算するステップと、縮小ビット幅水平中間パラメータアレイに少なくとも部分的に基づいて少なくとも水平動き精緻化v
x
を計算するステップと、少なくとも水平動き精緻化v
x
を使用して双方向オプティカルフローを用いてカレントブロックの予測を生成するステップとを含む。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
他の特許を見る