TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024166356
公報種別
公開特許公報(A)
公開日
2024-11-28
出願番号
2024160908,2023069776
出願日
2024-09-18,2020-04-27
発明の名称
オプティカルフローを用いる予測改善のための方法および装置
出願人
ベイジン・ダジア・インターネット・インフォメーション・テクノロジー・カンパニー,リミテッド
代理人
個人
,
個人
,
個人
,
個人
,
個人
主分類
H04N
19/513 20140101AFI20241121BHJP(電気通信技術)
要約
【課題】予測改善のビット深度表現のための双方向オプティカルフロー(BDOF)の方法を提供する。
【解決手段】この方法は、ビデオブロックに関連した第1の参照ピクチャおよび第2の参照ピクチャを取得するステップと、前記第1の参照ピクチャから前記ビデオブロックの第1の予測サンプルを取得するステップと、前記第2の参照ピクチャから前記ビデオブロックの第2の予測サンプルを取得するステップと、パディングされた予測サンプルに基づいて前記第1の予測サンプルおよび第2の予測サンプルの水平方向勾配値および垂直方向勾配値を取得するステップと、前記水平方向勾配値および前記垂直方向勾配値に基づいて、前記ビデオブロックにおけるサンプルの動き改善を取得するステップと、前記動き改善に基づいて前記ビデオブロックの双予測サンプルを取得するステップとを含む。
【選択図】図1
特許請求の範囲
【請求項1】
ビデオ信号を復号するための、オプティカルフローを用いる予測改善(PROF)のビット深度表現方法であって、
前記ビデオ信号の中のビデオブロックに関連した第1の参照ピクチャと、現在のピクチャ内のビデオブロックから前記第1の参照ピクチャ内の参照ブロックへの第1の動きベクトル(MV)とを取得するステップであって、前記第1の参照ピクチャが、オーバラップしない複数のビデオブロックを含み、少なくとも1つのビデオブロックが少なくとも1つのMVに関連付けられる、ステップと、
前記第1の参照ピクチャの中の前記参照ブロックから生成されたビデオブロックの当該第1の予測サンプルI(i,j)を取得するステップであって、iおよびjが、前記ビデオブロックを有する1つのサンプルの座標を表す、ステップと、
前記内部PROFパラメータの内部ビット深度を制御するステップであって、前記内部PROFパラメータが、予測サンプルI(i,j)に関して導出された水平方向勾配値、垂直方向勾配値、水平方向動き差分および垂直方向動き差分を含む、ステップと、
水平方向勾配値および垂直方向勾配値ならびに水平方向動き差分および垂直方向動き差分を基に、前記第1の予測サンプルI(i,j)の予測改善値を取得するステップと、
前記ビデオブロックが第2のMVを含むときには、前記第2のMVに関連した第2の予測サンプルI’(i,j)と、前記第2の予測サンプルI’(i,j)の対応する予測改善値とを取得するステップと、
前記第1の予測サンプルI(i,j)と第2の予測サンプルI’(i,j)と前記予測改善値との組合せに基づいて、前記ビデオブロックの最終予測サンプルを取得するステップと
を含む方法。
続きを表示(約 2,100 文字)
【請求項2】
前記内部PROFパラメータの内部ビット深度を制御するステップが、
第1の予測サンプルI(i+1,j)と第1の予測サンプルI(i-1,j)との間の差に基づいて第1の予測サンプルI(i,j)の水平方向勾配値を取得するステップと、
第1の予測サンプルI(i,j+1)と第1の予測サンプルI(i,j-1)との間の差に基づいて前記第1の予測サンプルI(i,j)の垂直方向勾配値を取得するステップと、
前記水平方向勾配値を第1のシフト値だけ右シフトするステップと、
前記垂直方向勾配値を前記第1のシフト値だけ右シフトするステップと
を含む、請求項1に記載の方法。
【請求項3】
前記第1のシフト値が、6と、符号化ビット深度値から6を減じた値とのうちの大きい方に等しい、請求項2に記載の方法。
【請求項4】
前記ビデオブロックの制御点MVを取得するステップであって、前記制御点MVが、前記ビデオブロックを含む1つのブロックの、左上隅のブロックのMV、右上隅のブロックのMV、および左下隅のブロックのMVを含む、ステップと、
前記制御点MVに基づいて導出されたアフィンモデルパラメータを取得するステップと、
前記アフィンモデルパラメータに基づいて水平方向オフセットおよび垂直方向オフセットを判定するステップと、
前記アフィンパラメータ、前記水平方向オフセット、および前記垂直方向オフセットに基づいて第1の予測サンプルI(i,j)用の水平方向MV差分Δv
x
(i,j)を取得するステップと、
前記アフィンパラメータ、前記水平方向オフセット、および前記垂直方向オフセットに基づいて第1の予測サンプルI(i,j)用の垂直方向MV差分Δv
y
(i,j)を取得
するステップと、
前記水平方向MV差分Δv
x
(i,j)を第2のシフト値だけ右シフトするステップと、
前記垂直方向MV差分Δv
y
(i,j)を前記第2のシフト値だけ右シフトするステップと
をさらに含む、請求項2に記載の方法。
【請求項5】
前記第2のシフト値が、13から勾配値の精密なビット深度を減じたものに等しい、請求項4に記載の方法。
【請求項6】
前記勾配値の精密なビット深度が、6と、符号化ビット深度から6を減じた値とのうちの大きい方に等しい、請求項5に記載の方法。
【請求項7】
前記ビデオブロックが前記第2のMVを含むときには、前記ビデオブロックの最終的な予測サンプルを取得するステップが、
前記第1の予測サンプルI(i,j)用に生成された前記水平方向勾配値、前記水平方向MV差分Δv
x
(i,j)、前記垂直方向勾配値、および前記垂直方向MV差分Δv
y
(i,j)に基づいて第1の予測改善値ΔI(i,j)を取得するステップと、
前記第2の予測サンプルI’(i,j)用に生成された前記水平方向勾配値、前記水平方向動き差分Δv
x
(i,j)、前記垂直方向勾配値、および前記垂直方向動き差分Δv
y
(i,j)に基づいて第2の予測改善値ΔI’(i,j)を取得するステップと、
前記第1の予測改善値ΔI(i,j)と前記第2の予測改善値ΔI’(i,j)との平均をとることによって前記予測改善値を取得するステップと、
前記第1の予測サンプルI(i,j)と、前記第2の予測サンプルI’(i,j)と、前記予測改善値との合計に基づいて、双予測サンプルを取得するステップと、
前記合計を第3のシフト値だけ右シフトするステップと
を含む、請求項4に記載の方法。
【請求項8】
前記第3のシフト値が、15から符号化ビット深度を減じたものに等しい、請求項6に記載の方法。
【請求項9】
前記第1の予測サンプルI(i,j)の前記水平方向勾配値および前記垂直方向勾配値を取得するステップが、
前記第1の予測サンプルI(i,j)用の前記参照ブロックの上境界、左境界、下境界、および右境界の各々に対して予測サンプルの追加の行および列をパディングするステップをさらに含む、請求項2に記載の方法。
【請求項10】
前記予測サンプルの前記追加の行および列をパディングするステップが、
整数参照サンプルから、左境界および右境界のパディングされた予測サンプルを、分数サンプル位置の左側にコピーするステップと、
整数参照サンプルから、上境界および下境界のパディングされた予測サンプルを、前記分数サンプル位置の上側にコピーするステップと
をさらに含む、請求項9に記載の方法。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
関連出願の相互参照
続きを表示(約 4,300 文字)
【0002】
この出願は、内容の全体が参照によって本明細書に組み込まれている、2019年4月25日出願の米国仮出願第62/838,939号に基づき、優先権を主張するものである。
【0003】
この開示はビデオ符号化および圧縮に関連するものである。より具体的には、この開示は、多用途ビデオ符号化(VVC:versatile video coding)規格、すなわちオプティカルフローを用いる予測改善(PROF:prediction refinement with optical flow)および双方向オプティカルフロー(BDOF:bi-directional optical flow)にて研究されている2つのインター予測ツールに基づく方法および装置に関する。
【背景技術】
【0004】
ビデオデータを圧縮するために様々なビデオ符号化技術が使用され得る。ビデオ符号化は1つまたは複数のビデオ符号化規格に従って実行される。たとえば、ビデオ符号化規格は、多用途ビデオ符号化(VVC)、共同探索テストモデル(JEM:joint exploration test model)、高効率ビデオ符号化(H.265/HEVC)、高度ビデオ符号化(H.264/AVC)、動画エキスパートグループ(MPEG)符号化等を含む。ビデオ符号化は、一般に、ビデオピクチャまたはビデオシーケンスに存在する冗長性を活用する予測方法(たとえばインター予測、イントラ予測等)を利用するものである。ビデオ符号化技術の重点目標は、ビデオ品質の劣化の回避または最小化を行いつつ、ビデオデータを、より低いビットレートを使用する形式に圧縮することである。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本開示の実例は、オプティカルフローを用いる予測改善のビット深度表現のための方法および装置を提供するものである。
【課題を解決するための手段】
【0006】
本開示の第1の態様によれば、ビデオ信号を復号するための、オプティカルフローを用いる予測改善(PROF)のビット深度表現方法が提供される。この方法は、ビデオ信号の中のビデオブロックに関連した第1の参照ピクチャと、現在のピクチャ内のビデオブロックから第1の参照ピクチャ内の参照ブロックへの第1の動きベクトル(MV)とを取得するステップを含み得る。第1の参照ピクチャはオーバラップしない複数のビデオブロックを含み得、少なくとも1つのビデオブロックが少なくとも1つのMVに関連付けられ得る。この方法は、第1の参照ピクチャの中の参照ブロックから生成されたビデオブロックの第1の予測サンプルI(i,j)を取得するステップをも含み得る。iおよびjは、このビデオブロックを有する1つのサンプルの座標を表し得る。この方法、内部PROFパラメータの内部ビット深度を制御するステップを含み得る。内部PROFパラメータは、予測サンプルI(i,j)に関して導出された水平方向勾配値、垂直方向勾配値、水平方向動き差分、および垂直方向動き差分を含み得る。この方法は、水平方向勾配値および垂直方向勾配値ならびに水平方向動き差分および垂直方向動き差分に基づいて第1の予測サンプルI(i,j)の予測改善値を取得するステップをさらに含み得る。この方法は、ビデオブロックが第2のMVを含み得るとき、第2のMVに関連した第2の予測サンプルI
’(i,j)と、第2の予測サンプルI’(i,j)の対応する予測改善値とを取得するステップを含み得る。この方法は、第1の予測サンプルI’(i,j)と第2の予測サンプルI’(i,j)と予測改善値との組合せに基づいて、ビデオブロックの最終予測サンプルを取得するステップを含み得る。
【0007】
本開示の第2の態様によれば、映像信号を復号するための双方向オプティカルフロー(BDOF)のビット深度表現方法が提供される。この方法は、ビデオブロックに関連した第1の参照ピクチャI
(0)
および第2の参照ピクチャI
(1)
を取得するステップを含み得る。表示順序では、第1の参照ピクチャI
(0)
は現在のピクチャの前のものでよく、第2の参照ピクチャI
(1)
は現在のピクチャの後のものでよい。この方法は、第1の参照ピクチャI
(0)
の中の参照ブロックからビデオブロックの第1の予測サンプルI
(0)
(i,j)を取得するステップをも含み得る。iおよびjは、現在のピクチャを有する1つのサンプルの座標を表し得る。この方法は、第2の参照ピクチャI
(1)
の中の参照ブロックからビデオブロックの第2の予測サンプルI
(1)
(i,j)を取得するステップを含み得る。この方法は、第1の予測サンプルI
(0)
(i,j)および第2の予測サンプルI
(1)
(i,j)に基づいてビデオブロックにBDOFを適用するステップを含み得る。この方法は、パディングされた予測サンプルに基づいて第1の予測サンプルI
(0)
(i,j)および第2の予測サンプルI
(1)
(i,j)の水平方向勾配値および垂直方向勾配値を取得するステップを含み得る。この方法は、ビデオブロックに適用されているBDOFならびに水平方向勾配値および垂直方向勾配値に基づいてビデオブロックにおけるサンプルの動き改善を取得するステップをさらに含み得る。この方法は、動き改善に基づいてビデオブロックの双予測サンプルを取得するステップを含み得る。
【0008】
本開示の第3の態様によれば、コンピューティングデバイスが提供される。コンピューティングデバイスは、1つまたは複数のプロセッサと、1つまたは複数のプロセッサによって実行可能な命令を記憶する非一時的コンピュータ可読メモリとを含み得る。1つまたは複数のプロセッサは、ビデオ信号の中のビデオブロックに関連した第1の参照ピクチャと、現在のピクチャ内のビデオブロックから第1の参照ピクチャ内の参照ブロックへの第1のMVとを取得するように構成され得る。第1の参照ピクチャはオーバラップしない複数のビデオブロックを含み得、少なくとも1つのビデオブロックが少なくとも1つのMVに関連付けられ得る。1つまたは複数のプロセッサは、第1の参照ピクチャの中の参照ブロックから生成されたビデオブロックの第1の予測サンプルI(i,j)を取得するようにも構成され得る。iおよびjは、このビデオブロックを有する1つのサンプルの座標を表す。1つまたは複数のプロセッサは、内部PROFパラメータの内部ビット深度を制御するように構成され得る。内部PROFパラメータは、予測サンプルI(i,j)に関して導出された水平方向勾配値、垂直方向勾配値、水平方向動き差分および垂直方向動き差分を含み得る。1つまたは複数のプロセッサは、水平方向勾配値および垂直方向勾配値ならびに水平方向動き差分および垂直方向動き差分に基づいて第1の予測サンプルI(i,j)の予測改善値を取得するようにも構成され得る。1つまたは複数のプロセッサは、ビデオブロックが第2のMVを含み得るときには、第2のMVに関連した第2の予測サンプルI’(i,j)と、第2の予測サンプルI’(i,j)の対応する予測改善値とを取得するようにも構成され得る。1つまたは複数のプロセッサは、第1の予測サンプルI(i,j)と第2の予測サンプルI’(i,j)と予測改善値との組合せに基づいて、ビデオブロックの最終予測サンプルを取得するように構成され得る。
【0009】
本開示の第4の態様によれば、コンピューティングデバイスが提供される。コンピューティングデバイスは、1つまたは複数のプロセッサと、1つまたは複数のプロセッサによって実行可能な命令を記憶する非一時的コンピュータ可読メモリとを含み得る。1つまたは複数のプロセッサは、ビデオブロックに関連した第1の参照ピクチャI
(0)
および第2の参照ピクチャI
(1)
を取得するように構成され得る。表示順序では、第1の参照ピ
クチャI
(0)
は現在のピクチャの前のものでよく、第2の参照ピクチャI
(1)
は現在のピクチャの後のものでよい。1つまたは複数のプロセッサは、第1の参照ピクチャI
(0)
の中の参照ブロックからビデオブロックの第1の予測サンプルI
(0)
(i,j)を取得するようにも構成され得る。iおよびjは、現在のピクチャを有する1つのサンプルの座標を表し得る。1つまたは複数のプロセッサは、第2の参照ピクチャI
(1)
の中の参照ブロックからビデオブロックの第2の予測サンプルI
(1)
(i,j)を取得するように構成され得る。1つまたは複数のプロセッサは、第1の予測サンプルI
(0)
(i,j)および第2の予測サンプルI
(1)
(i,j)に基づいてビデオブロックにBDOFを適用するように構成され得る。1つまたは複数のプロセッサは、パディングされた予測サンプルに基づいて第1の予測サンプルI
(0)
(i,j)および第2の予測サンプルI
(1)
(i,j)の水平方向勾配値および垂直方向勾配値を取得するように構成され得る。1つまたは複数のプロセッサは、ビデオブロックに適用されているBDOFならびに水平方向勾配値および垂直方向勾配値に基づいて、ビデオブロックにおけるサンプルの動き改善を取得するようにさらに構成され得る。1つまたは複数のプロセッサは、動き改善に基づいてビデオブロックの双予測サンプルを取得するように構成され得る。
【0010】
上記の概要および以下の発明を実施するための形態は、例でしかなく、本開示を限定するものではないことを理解されたい。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
他の特許を見る