TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025010311
公報種別公開特許公報(A)
公開日2025-01-20
出願番号2024190526,2022164888
出願日2024-10-30,2019-05-28
発明の名称適応変換タイプを有する空間的に変化する変換
出願人華為技術有限公司,HUAWEI TECHNOLOGIES CO.,LTD.
代理人弁理士法人ITOH
主分類H04N 19/12 20140101AFI20250109BHJP(電気通信技術)
要約【課題】本開示は、適応変換タイプを有するSVTを採用するビデオ復号化方法及び装置を開示する。
【解決手段】方法は、残差ブロックのためのSVT-V又はSVT-Hの使用を決定することと、残差ブロックの変換ブロックの変換ブロック位置を決定することと、変換ブロックの変換タイプを決定することであり、変換タイプは変換ブロックの水平変換及び垂直変換を示し、水平変換及び垂直変換のうちの少なくとも一方はDST-7である、ことと、変換タイプ、変換ブロック位置及び変換ブロックの変換係数に基づいて残差ブロックを再構成することとを有する。本開示の解決法を用いることによって、復号化品質を改善することができる。
【選択図】図5
特許請求の範囲【請求項1】
ビデオ復号化方法であって、
第1フラグ、第2フラグ、シンタックス要素、及び予測情報を含むビットストリームを受信することと、
前記第1フラグに従って、空間的に変化する変換(SVT)が画像ブロックの残差ブロックに対して使用されていることを決定することと、
前記第2フラグに従って、前記残差ブロックのためのSVTタイプを決定することであり、前記SVTタイプは、SVT-垂直(SVT-V)タイプ又はSVT-水平(SVT-H)タイプであり、前記SVT-Vタイプは、前記残差ブロックの変換ブロックの第1の幅が前記残差ブロックの第2の幅よりも狭いこと、及び前記変換ブロックの第1の高さが前記残差ブロックの第2の高さと同じであることを示し、前記SVT-Hタイプは、前記第1の幅が前記第2の幅と同じであること、及び前記第1の高さが前記第2の高さよりも低いことを示す、ことと、
前記シンタックス要素に従って、前記変換ブロックの変換ブロック位置を決定することと、
前記SVTタイプ及び前記変換ブロック位置に従って前記変換ブロックの変換タイプをルックアップテーブルから決定することと、
前記変換ブロックの変換係数を取得するよう前記ビットストリームをパースすることと、
前記変換タイプ及び前記変換係数に基づき前記残差ブロックを再構成することと、
前記予測情報に基づき、前記残差ブロックに対応する予測ブロックを取得することと、
前記残差ブロック及び前記予測ブロックに基づき前記画像ブロックを取得することと
を有するビデオ復号化方法。
続きを表示(約 2,200 文字)【請求項2】
前記変換タイプは、前記変換ブロックのための水平変換及び前記変換ブロックのための垂直変換を示し、前記SVTタイプは前記SVT-Vタイプであり、前記変換ブロック位置は、前記残差ブロックの左上角をカバーし、前記水平変換は離散コサイン変換(DCT)-8に基づき、前記垂直変換は離散サイン変換(DST)-7に基づく、
請求項1に記載のビデオ復号化方法。
【請求項3】
前記変換タイプは、前記変換ブロックのための水平変換及び前記変換ブロックのための垂直変換を示し、前記SVTタイプは前記SVT-Vタイプであり、前記変換ブロック位置は、前記残差ブロックの右下角をカバーし、前記水平変換は離散サイン変換(DST)-7に基づき、前記垂直変換は前記DST-7に基づく、
請求項1に記載のビデオ復号化方法。
【請求項4】
前記変換タイプは、前記変換ブロックのための水平変換及び前記変換ブロックのための垂直変換を示し、前記SVTタイプは前記SVT-Hタイプであり、前記変換ブロック位置は、前記残差ブロックの左上角をカバーし、前記水平変換は離散サイン変換(DST)-7に基づき、前記垂直変換は離散コサイン変換(DCT)-8に基づく、
請求項1に記載のビデオ復号化方法。
【請求項5】
前記変換タイプは、前記変換ブロックのための水平変換及び前記変換ブロックのための垂直変換を示し、前記SVTタイプは前記SVT-Hタイプであり、前記変換ブロック位置は、前記残差ブロックの右下角をカバーし、前記水平変換は離散サイン変換(DST)-7に基づき、前記垂直変換は前記DST-7に基づく、
請求項1に記載のビデオ復号化方法。
【請求項6】
ビデオ符号化方法であって、
予測情報に基づき予測ブロックを取得することと、
前記予測ブロック及び前記予測ブロックに対応する画像ブロックに基づき残差ブロックを取得することと、
前記残差ブロックに対応する変換ブロックを取得することと、
第1フラグの第1値をセットすることであり、前記第1フラグは、空間的に変化する変換(SVT)が前記残差ブロックに対して使用されることを示す、ことと、
第2フラグの第2値をセットすることであり、前記第2フラグは、前記残差ブロックのためのSVTタイプを示し、前記SVTタイプは、SVT-垂直(SVT-V)タイプ又はSVT-水平(SVT-H)タイプであり、前記SVT-Vタイプは、前記残差ブロックの前記変換ブロックの第1の幅が前記残差ブロックの第2の幅よりも狭いこと、及び前記変換ブロックの第1の高さが前記残差ブロックの第2の高さと同じであることを示し、前記SVT-Hタイプは、前記第1の幅が前記第2の幅と同じであること、及び前記第1の高さが前記第2の高さよりも低いことを示す、ことと、
前記変換ブロックの変換ブロック位置を示すシンタックス要素を取得することであり、前記変換ブロックの変換タイプは、前記変換ブロック位置及び前記第2値に対応する、ことと、
前記変換ブロックの変換係数を取得することと、
前記第1値、前記第2値、前記シンタックス要素、前記予測情報、及び前記変換係数をビットストリームに含めることと、
前記ビットストリームを記憶又は送信することと
を有するビデオ符号化方法。
【請求項7】
前記変換ブロックの前記変換タイプは、前記変換ブロックのための水平変換及び前記変換ブロックのための垂直変換を示し、前記SVTタイプは前記SVT-Vタイプであり、前記変換ブロック位置は、前記残差ブロックの左上角をカバーし、前記水平変換は離散コサイン変換(DCT)-8に基づき、前記垂直変換は離散サイン変換(DST)-7に基づく、
請求項6に記載のビデオ符号化方法。
【請求項8】
前記変換ブロックの前記変換タイプは、前記変換ブロックのための水平変換及び前記変換ブロックのための垂直変換を示し、前記SVTタイプは前記SVT-Vタイプであり、前記変換ブロック位置は、前記残差ブロックの右下角をカバーし、前記水平変換は離散サイン変換(DST)-7に基づき、前記垂直変換は前記DST-7に基づく、
請求項6に記載のビデオ符号化方法。
【請求項9】
前記変換ブロックの前記変換タイプは、前記変換ブロックのための水平変換及び前記変換ブロックのための垂直変換を示し、前記SVTタイプは前記SVT-Hタイプであり、前記変換ブロック位置は、前記残差ブロックの左上角をカバーし、前記水平変換は離散サイン変換(DST)-7に基づき、前記垂直変換は離散コサイン変換(DCT)-8に基づく、
請求項6に記載のビデオ符号化方法。
【請求項10】
前記変換ブロックの前記変換タイプは、前記変換ブロックのための水平変換及び前記変換ブロックのための垂直変換を示し、前記SVTタイプは前記SVT-Hタイプであり、前記変換ブロック位置は、前記残差ブロックの右下角をカバーし、前記水平変換は離散サイン変換(DST)-7に基づき、前記垂直変換は前記DST-7に基づく、
請求項6に記載のビデオ符号化方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本開示は、ビデオ復号化技術に、具体的に、適応変換タイプを有する空間的に変化する変換を採用するビデオ復号化方法及び関連する装置に関係がある。
続きを表示(約 1,900 文字)【背景技術】
【0002】
H.265のようなビデオコーディングは、予測及び変換のフレームワークに基づく。エンコーダで、画像ブロック(複数のピクセルを含む)は、予測ブロック及び残差ブロックに分解され得、予測情報(例えば、予測モード及び動きベクトル情報)及び残差情報(例えば、変換モード、変換係数及び量子化パラメータ)はビットストリームにコーディングされる。デコーダで、予測情報及び残差情報はパースされる。予測情報に従って、イントラ又はインター予測は、予測サンプルを生成するよう行われる。残差情報に従って、逆量子化及び逆変換は、残差サンプルを生成するよう順次行われる。予測サンプル及び残差サンプルは、再構成されたサンプルを得るよう足し合わされる。
【0003】
空間的に変化する変換(SVT)は、ビデオコーディング効率を改善するために開発された。幅w及び高さh(すなわち、w×h)の矩形残差ブロックについて、残差ブロックよりも小さい変換ブロックは、残差ブロックの一部を変換するために使用され、残差ブロックの残りの部分はコーディングされない。SVTの裏側にある論理的根拠は、残差が残差ブロックにおいて等しく分布していないことがあることである。適応的な位置を有しているより小さい変換ブロックを使用することは、残差ブロックにおける主要な残差を捕捉することができ、よって、残差ブロックにおける全ての残差を変換することよりも良いコーディング効率を達成し得る。
【0004】
SVTがサイズw×hの残差ブロックのために適用される場合に、変換ブロックのサイズ及び位置情報はビデオビットストリームにコーディングされ、よって、デコーダは、変換ブロックを再構成し、それを、残差ブロックに関連する予測ブロックの適所に構成することができる。
【0005】
一例において、SVTブロックの3つのタイプが、図1に表されるように、残差ブロックのために使用され得る。
1)SVT-I:w_t=w/2、h_t=h/2、このとき、w_t及びh_tは、夫々、変換ブロックの幅及び高さを表し、w及びhは、残差ブロックの幅及び高さを表す。言い換えれば、変換ブロックの幅及び高さは、両方とも、残差ブロックのそれらの半分である。
2)SVT-II:w_t=w/4、h_t=h。
3)SVT-III:w_t=w、h_t=h/4。
【0006】
SVTブロックのタイプ情報は、ビットストリームにコーディングされる。
【0007】
変換ブロックの位置は、残差ブロックの左上角への位置オフセット(x,y)によって表され、このとき、xは、ピクセルの単位での変換ブロックの左上角と残差ブロックのそれとの間の水平距離を示し、yは、ピクセルの単位での変換ブロックの左上角と残差ブロックのそれとの間の垂直距離を示す。変換ブロックを残差ブロック内にあるようにする各位置は、候補位置である。残差ブロックについて、候補位置の数は、SVTのタイプについて(w-w_t+1)×(h-h_t+1)である。より具体的には、16×16の残差ブロックについて、SVT-Iが使用される場合に、81個の候補位置が存在し、SVT-II又はSVT-IIIが使用される場合に、13個の候補位置が存在する。x及びyの値は、ビットストリームにコーディングされる。SVT-Iの複雑さを減らすよう、32個の位置のサブセットが、SVT-Iのための許可された候補位置として、81個の候補位置から選択される。
【0008】
SVTスキームの1つの欠点は、位置情報の重いシグナリングオーバーヘッドである。その上、エンコーダ複雑性は、レート歪み最適化(RDO)で試験される位置の数とともに大いに増大し得る。候補位置の数が残差ブロックのサイズとともに増えるので、オーバーヘッドは、32×32又は64×128のような、より大きい残差ブロックについて、より一層大きくなり得る。
【0009】
SVTスキームのもう1つの欠点は、変換ブロックのサイズが残差ブロックの1/4であることである。変換ブロックは、高い確実性で、残差ブロックにおける主要な残差をカバーするほど十分に大きくない。
【0010】
従って、簡単なSVTが開発されており、図2に示されるように、SVT-H及びSVT-Vと表されるSVTブロックの2つのタイプが、残差コーディングのために使用される。
1)SVT-V:w_t=w/2及びh_t=t。
2)SVT-H:w_t=w及びh_t=h/2。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許