TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024058566
公報種別公開特許公報(A)
公開日2024-04-25
出願番号2023084060
出願日2023-05-22
発明の名称符号化ピクチャバッファを用いたビデオ符号化
出願人フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
代理人弁理士法人岡田特許事務所
主分類H04N 19/70 20140101AFI20240418BHJP(電気通信技術)
要約【課題】HRD信号化のためのビット消費と多くのビットレートシナリオに対するHRDパラメータの効果的な決定方法との間のより良いトレードオフをもたらす、符号化ピクチャバッファ動作を使用するビデオ符号化を提供する。
【解決手段】エンコーダ10は、ビデオ12を表示する際にピクチャ16がシーケンシャルに表示又は出力される表示時間順序18とは異なる可能性のあるピクチャ符号化順序を用いてビデオのピクチャをビットストリーム14に符号化し、ブロック単位方式で、ピクチャの現在符号化されているポーションを予測し、減算器22で現在のピクチャ26のオリジナルバージョンから予測信号24を減算することによって予測残差20を形成し、残差符号化器28が予測残差をビットストリームに符号化し、残差デコーダ30が残差符号化を反転し、残差符号化器によって導入された損失の分によって予測残差とは異なる残差信号32を生成する。
【選択図】図1
特許請求の範囲【請求項1】
ビデオ復号化のための装置であって、前記装置は、符号化ピクチャバッファ(CPB)と復号化ピクチャバッファ(DPB)とを備え、
ビデオのピクチャが符号化順序に沿って符号化されているデータストリームをアクセスユニット(AU)のシーケンスとして受信し、
選択されたビットレートを用いて前記アクセスユニットのシーケンスを前記CPBにシーケンシャルに供給するとともに、前記符号化順序において最初のアクセスユニットについては選択された時間的除去遅延の分、及び、前記符号化順序において2番目以降のアクセスユニットについては前記選択された時間的除去遅延と選択された時間オフセットとの和の分、前倒しされた時間フレーム除去ラスタによる仮想利用可能時間にまだ到達していないアクセスユニットについては前記仮想利用可能時間に到達するまでは前記供給を停止させ、
時間ラスタを用いて前記CPBから前記AUをAU単位で除去し、
第1の動作点に関連する第1のCPBパラメータと第2の動作点に関連する第2のCPBパラメータとを前記データストリームから抽出し、ここで前記第1のCPBパラメータ及び前記第2のCPBパラメータの各々は、CPBサイズ、既定の時間オフセット、既定の時間的除去遅延及び既定のビットレートを示し、前記第1のCPBパラメータは、少なくとも前記既定のビットレートに関して前記第2のCPBパラメータと相違しており、
前記第1のCPBパラメータが示す前記既定の時間オフセットと前記第2のCPBパラメータが示す前記既定の時間オフセットとの間を前記選択されたビットレートで補間することによって前記選択された時間オフセットを決定し、前記第1のCPBパラメータが示す前記既定の時間的除去遅延と前記第2のCPBパラメータが示す前記既定の時間的除去遅延との間を前記選択されたビットレートで補間することによって前記選択された時間的除去遅延を決定し、
前記CPBから除去された現在のAUを前記DPBに格納された参照される基準ピクチャからピクチャ間予測を用いて復号化して復号化されたピクチャを取得し、
前記復号化されたピクチャを前記DPBに挿入し、
前記DPBに格納された各基準ピクチャに、短期基準ピクチャ、長期基準ピクチャ、未参照基準ピクチャのうちの1つとしての分類を割り当て、
前記現在のAUからDPBモード情報を読み出し、
前記DPBモード情報が第1モードを示す場合、先入れ先出し(FIFO)方法に従って、短期ピクチャに分類された1つ以上の基準ピクチャを前記DPBから除去し、
前記DPBモード情報が第2モードを示す場合、前記現在のAUにおいて少なくとも1つのコマンドを含むメモリ管理制御情報を読み出し、前記少なくとも1つのコマンドを実行して前記DPBに格納された前記基準ピクチャのうちの少なくとも1つに割り当てられた前記分類を変更し、前記DPB内の前記基準ピクチャの前記分類を使用して前記DPBからの基準ピクチャの除去を管理する
ように構成され、
前記選択されたビットレートは、前記第1のCPBパラメータが示す前記既定のビットレートと前記第2のCPBパラメータが示す前記既定のビットレートとの間にある、装置。
続きを表示(約 4,300 文字)【請求項2】
ビデオ復号化のための装置であって、前記装置は、符号化ピクチャバッファ(CPB)と復号化ピクチャバッファ(DPB)とを備え、
ビデオのピクチャが符号化順序に沿って符号化されているデータストリームをアクセスユニット(AU)のシーケンスとして受信し、
選択されたビットレートを用いて前記アクセスユニットのシーケンスを前記CPBにシーケンシャルに供給するとともに、前記符号化順序において最初のアクセスユニットについては選択された時間的除去遅延の分、及び、前記符号化順序において2番目以降のアクセスユニットについては前記選択された時間的除去遅延と選択された時間オフセットとの和の分、前倒しされた時間フレーム除去ラスタによる仮想利用可能時間にまだ到達していないアクセスユニットについては前記仮想利用可能時間に到達するまでは前記供給を停止させ、
時間ラスタを用いて前記CPBから前記AUをAU単位で除去し、
第1の動作点に関連する第1のCPBパラメータと第2の動作点に関連する第2のCPBパラメータとを前記データストリームから抽出し、ここで前記第1のCPBパラメータ及び前記第2のCPBパラメータの各々は、CPBサイズ、既定の時間オフセット、既定の時間的除去遅延及び既定のビットレートを示し、前記第1のCPBパラメータは、少なくとも前記既定のビットレートに関して前記第2のCPBパラメータと相違しており、
前記第1のCPBパラメータが示す前記既定の時間オフセットと前記第2のCPBパラメータが示す前記既定の時間オフセットとの間を前記選択されたビットレートで補間することによって前記選択された時間オフセットを決定し、前記第1のCPBパラメータが示す前記既定の時間的除去遅延と前記第2のCPBパラメータが示す前記既定の時間的除去遅延との間を前記選択されたビットレートで補間することによって前記選択された時間的除去遅延を決定し、
前記CPBから除去された現在のAUを前記DPBに格納された参照される基準ピクチャからピクチャ間予測を用いて復号化して復号化されたピクチャを取得し、
前記復号化されたピクチャを前記DPBに挿入し、
前記DPBに格納された各基準ピクチャに、短期基準ピクチャ、長期基準ピクチャ、未参照基準ピクチャのうちの1つとしての分類を割り当て、
前記現在のAUからDPBモード情報を読み出し、
前記DPBモード情報が第1モードを示す場合、先入れ先出し(FIFO)方法に従って、短期ピクチャに分類された1つ以上の基準ピクチャを前記DPBから除去し、
前記DPBモード情報が第2モードを示す場合、前記現在のAUにおいて少なくとも1つのコマンドを含むメモリ管理制御情報を読み出し、前記少なくとも1つのコマンドを実行して前記DPBに格納された前記基準ピクチャのうちの少なくとも1つに割り当てられた前記分類を変更し、前記DPB内の前記基準ピクチャの前記分類を使用して前記DPBからの基準ピクチャの除去を管理する
ように構成され、
前記データストリームから1つ以上の補間パラメータを導出し、前記1つ以上の補間パラメータを用いて前記補間をパラメータ化するように構成される、装置。
【請求項3】
ビデオ復号化のための装置であって、前記装置は、符号化ピクチャバッファ(CPB)と復号化ピクチャバッファ(DPB)とを備え、
ビデオのピクチャが符号化順序に沿って符号化されているデータストリームをアクセスユニット(AU)のシーケンスとして受信し、
選択されたビットレートを用いて前記アクセスユニットのシーケンスを前記CPBにシーケンシャルに供給するとともに、前記符号化順序において最初のアクセスユニットについては選択された時間的除去遅延の分、及び、前記符号化順序において2番目以降のアクセスユニットについては前記選択された時間的除去遅延と選択された時間オフセットとの和の分、前倒しされた時間フレーム除去ラスタによる仮想利用可能時間にまだ到達していないアクセスユニットについては前記仮想利用可能時間に到達するまでは前記供給を停止させ、
時間ラスタを用いて前記CPBから前記AUをAU単位で除去し、
第1の動作点に関連する第1のCPBパラメータと第2の動作点に関連する第2のCPBパラメータとを前記データストリームから抽出し、ここで前記第1のCPBパラメータ及び前記第2のCPBパラメータの各々は、CPBサイズ、既定の時間オフセット、既定の時間的除去遅延及び既定のビットレートを示し、前記第1のCPBパラメータは、少なくとも前記既定のビットレートに関して前記第2のCPBパラメータと相違しており、
前記第1のCPBパラメータが示す前記既定の時間オフセットと前記第2のCPBパラメータが示す前記既定の時間オフセットとの間を前記選択されたビットレートで補間することによって前記選択された時間オフセットを決定し、前記第1のCPBパラメータが示す前記既定の時間的除去遅延と前記第2のCPBパラメータが示す前記既定の時間的除去遅延との間を前記選択されたビットレートで補間することによって前記選択された時間的除去遅延を決定し、
前記CPBから除去された現在のAUを前記DPBに格納された参照される基準ピクチャからピクチャ間予測を用いて復号化して復号化されたピクチャを取得し、
前記復号化されたピクチャを前記DPBに挿入し、
前記DPBに格納された各基準ピクチャに、短期基準ピクチャ、長期基準ピクチャ、未参照基準ピクチャのうちの1つとしての分類を割り当て、
前記現在のAUからDPBモード情報を読み出し、
前記DPBモード情報が第1モードを示す場合、先入れ先出し(FIFO)方法に従って、短期ピクチャに分類された1つ以上の基準ピクチャを前記DPBから除去し、
前記DPBモード情報が第2モードを示す場合、前記現在のAUにおいて少なくとも1つのコマンドを含むメモリ管理制御情報を読み出し、前記少なくとも1つのコマンドを実行して前記DPBに格納された前記基準ピクチャのうちの少なくとも1つに割り当てられた前記分類を変更し、前記DPB内の前記基準ピクチャの前記分類を使用して前記DPBからの基準ピクチャの除去を管理する
ように構成され、
前記現在のAUにおける動きベクトルに基づいて、且つ6タップFIRフィルタを使用して2分の1ピクセル単位値を導出し、隣接する2分の1ピクセル単位値を平均化して、前記参照される基準ピクチャにおける4分の1ピクセル単位値を導出するように構成される、装置。
【請求項4】
データストリームにビデオを符号化するための装置であって、前記データストリームは、符号化ピクチャバッファ(CPB)を備えるデコーダに供給されることによって復号化されるものであり、前記装置は、
符号化順序で符号化されたビデオのピクチャをアクセスユニット(AU)のシーケンスとしてデータストリームに符号化し、
第1の動作点に関連する第1のCPBパラメータと第2の動作点に関連する第2のCPBパラメータを決定し、ここで前記第1のCPBパラメータ及び第2のCPBパラメータの各々は、CPBサイズ、既定の時間オフセット、既定の時間的除去遅延及び既定のビットレートを示し、前記第1のCPBパラメータは、少なくとも前記既定のビットレートに関して前記第2のCPBパラメータと相違し、複数の選択されたビットレートの各々において前記第1のCPBパラメータの前記既定の時間オフセットと前記第2のCPBパラメータの前記既定の時間的オフセットとの間を補間することによって、補間された時間オフセット及び補間された時間的除去遅延が生じて、
それぞれの前記選択されたビットレートを使用して前記AUのシーケンスを前記CPBにシーケンシャルに供給するとともに前記符号化順序において最初のアクセスユニットについては補間された時間的除去遅延の分、及び、符号化順序において2番目以降のアクセスユニットについては前記補間された時間的除去遅延と補間された時間オフセットとの和の分、前倒しされた時間フレーム除去ラスタによる仮想利用可能時間にまだ到達していないアクセスユニットについては前記仮想利用可能時間に到達するまでは前記供給を停止し、
時間ラスタを用いて前記CPBから前記AUをAU単位で除去して、
前記データストリームを前記CPBを介して前記デコーダに供給することが、いかなるアンダーフローも、いかなるオーバーフローも引き起こさないように前記決定が実行され、
前記CPBパラメータを前記データストリームに符号化する
ように構成され、
ここで、前記装置は、前記AUを符号化する際に、
復号化ピクチャバッファ(DPB)に格納された参照される基準ピクチャからのピクチャ間予測を使用して現在のピクチャを現在のAUに符号化し、
前記DPB内の前記現在のピクチャの復号化バージョンを前記DPBに挿入し、
前記DPBに格納された各基準ピクチャに、短期基準ピクチャ、長期基準ピクチャ、未使用基準ピクチャのうちの1つとしての分類を割り当て、
DPBモード情報を前記現在のAUに書き込み、
前記DPBモード情報が第1モードを示す場合、FIFO方法に従って、短期ピクチャに分類される1つ以上の基準ピクチャを前記DPBから除去し、
前記DPBモード情報が第2モードを示す場合、少なくとも1つのコマンドを含むメモリ管理制御情報を前記現在のAUに書き込み、ここで前記コマンドは、前記DPBに格納された前記基準ピクチャのうちの少なくとも1つに割り当てられた前記分類を変更するように指示するものであり、前記DPBにおける前記基準ピクチャの前記分類は、前記DPBからの基準ピクチャ除去を管理するために使用される
ように構成され、
前記補間は、補間パラメータを用いてパラメータ化され、
前記装置は、前記補間パラメータを前記データストリームに符号化する
ように構成される、装置。

発明の詳細な説明【技術分野】
【0001】
本願発明は、ビデオ符号化及びビデオ符号化における符号化ピクチャバッファの使用法に関するものである。
続きを表示(約 1,600 文字)【背景技術】
【0002】
仮想的な基準デコーダと、ビットストリーム及びデコーダの適合性をチェックするためのその使用は、VVCのようなあらゆるビデオ符号化規格に不可欠な要素である。
【0003】
このような適合性チェックを行うために、図17に示すように、HSS(Hypothetical stream scheduler:仮説ストリームスケジューラ)、CPB(Coded Picture Buffer:符号化ピクチャバッファ)、(瞬時とみなされる)デコード処理、DBP(Decoded Picture Buffer:復号化ピクチャバッファ)、出力クロッピング処理からなるHRDバッファモデルを規定する。
【0004】
符号化ピクチャーバッファにビットストリームを供給するタイミング及びビットレート、その復号化ユニット(低遅延動作モードの場合はアクセスユニット又はVCL NALユニット)をCPBから除去して瞬時に復号化する時間、及びDPBからピクチャーを出力する出力時間を定義するモデルである。
【0005】
そうすることで、バッファオーバーフロー(CPBに保持できる量より多くのデータがデコーダに送られる)又はアンダーフロー(必要以上に低いビットレートで少ない量のデータがデコーダに送られる)、AUからの必要なデータが復号化のために適切なタイミングでデコーダに存在しないことを避けるために、デコーダに必要なCPBサイズを定義することも可能になる。
【0006】
最先端のビデオ符号化規格では、ビットストリーム及びHRDの要件及びバッファモデルを記述するために、異なるパラメータが指定される。
【0007】
例えば、HEVCでは、hrd_parameters(hrd_パラメータ)がサブレイヤごとに定義され、Bitrate(i)及びCPBsize(i)の1つ以上のタプル(tuples)を記述し、HSSがCPBsize(i)のサイズのCPBにBitrate(i)のビットレートを供給する場合、オーバーフローやアンダーフローは発生しないことを示す。つまり、これらのビットレート及びCPBサイズのタプルに従えば、連続した復号化が保証される。
【0008】
hrd_parameterシンタックスエレメントと連動して、CPBからの各ピクチャの除去時間を特定する追加のタイミング情報、すなわち、各ピクチャに属するVCL
NALユニットがどのタイミングでデコードに送られるかを示す情報がビットストリーム内に存在する。
【0009】
関連する情報は、InitialCPBRemovalDelay(i)、InitialCPBRemovalDelayOffset(i)、AuCPBRemovalDelayのシンタックスエレメントまたは変数でバッファリング期間SEIメッセージに存在し、及び、AuCPBRemovalDelayでピクチャタイミングSEIメッセージに存在する。
【0010】
しかし、アプリケーションや及び伝送チャネルによっては、ビットレートに関して微調整できるようにするには、多くのビットレートのHRDパラメータに関する情報が必要となる場合がある。しかし、この場合、bitrates(i)を密に選択するために、多くのHRDパラメータをビット消費して送信する必要がある。HRD情報を送信するための合理的なオーバーヘッドで多数のビットレートに対して正しいHRDパラメータ化、すなわち、CPBのアンダーフローまたはオーバーフローにつながらないものを可能にする概念を手元に置くことは好ましいと思われる。
【発明の概要】
【発明が解決しようとする課題】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許