発明の詳細な説明【技術分野】 【0001】 本発明は、符号化装置及びプログラムに関する。 続きを表示(約 1,900 文字)【背景技術】 【0002】 放送等の映像伝送サービスにおいて、利用可能な帯域(ビットレート)には制約がある。この制約下で画質を最大化するために、符号化制御技術が重要な役割を果たしている。一般的な符号化制御は、ビット量割り当て処理及びモード選択処理の2つから構成される。 【0003】 ビット量割り当て処理では、符号化装置は、目標ビットレートを超えないように、映像を構成する要素(GOP(Group Of Pictures)、フレーム、ブロック等)に対してビット量を割り当てる。モード選択処理では、符号化装置は、割り当てられたビット量を超えないように符号化モード(ブロック分割数、予測モード等)の選択を行う。これらの処理が適切に行われないと、ビットレート制約を達成していても画質が著しく劣化する。 【0004】 こうした課題を解決するために、ビット量割り当てを最適化する手法の研究が行われている。最新のソフトウェアエンコーダの1つであるVVenCでは、R-QPモデルと呼ばれる符号化制御を実装したことで、ビットレート制約下における符号化効率がVTM(VVC Test Model)に比べて大幅に改善している。なお、VVenCは、最新の符号化方式であるVVC(Versatile Video Coding)の国際標準化で使用されている参照ソフトウェアであるVTMを高速化したソフトウェアエンコーダである。R-QPモデルでは、量子化パラメータ(QP)がビットレート(R)の関数(R-QP式)で与えられる。この定式化により、目標ビットレートRを超えないQPを算出することが可能となる。 【0005】 VVenCに実装されたR-QPモデルでは、2パス符号化が行われる(例えば、非特許文献1参照)。以下、1、2パス目の符号化処理をそれぞれ第1符号化、第2符号化とも称する。第1符号化の結果は、第2符号化を最適化するための事前情報として利用される。 【0006】 具体的には、第1符号化では、固定QPモードで符号化し、フレームごとに消費ビット量と量子化パラメータとの対応関係を導出する。固定QPモードでは、符号化装置は、フレームごとに固定で設定されたQPオフセットをベースQPに加算して得た暫定のQP(仮のQPであり、以下、「第1QP」とも称する)を用いて、仮の符号化処理(符号化試行)を行う。QPオフセットは、符号化制御におけるフレーム単位のビット量割り当てと同様の機能を果たすため、QPオフセットを加算することで、QPオフセットを加算しない場合と比べて高画質化が実現できる。 【0007】 第2符号化では、符号化装置は、第1符号化の結果に基づいて各フレームにビット量が割り当てられ、最適化された最終的なQP(以下、「第2QP」とも称する)を用いて正規の符号化処理を行う。 【先行技術文献】 【非特許文献】 【0008】 C. R. Helmrich, I. Zupancic, J. Brandenburg, V. George, A. Wieckowski and B. Bross, "Visually Optimized Two-Pass Rate Control for Video Coding Using the Low-Complexity XPSNR Model," 2021 International Conference on Visual Communications and Image Processing (VCIP), 2021, pp. 1-5, doi: 10.1109/VCIP53242.2021.9675364. 【発明の概要】 【発明が解決しようとする課題】 【0009】 VVenCの符号化制御のように、2パス符号化によって符号化制御を行う符号化装置は、第1符号化を固定QPモードで符号化するため、QPオフセットは入力映像によらず一定(固定)である。 【0010】 しかしながら、最適なQPオフセットは入力映像に依存するため、第1符号化から得られる消費ビット量の情報が、第2符号化のための事前情報として最適でない可能性がある。その結果、第2符号化におけるビット量割り当て処理が適切に行われず、映像によっては符号化効率が低下する。同様の理由で、不適切なビット量割り当てにより、フレーム間で割り当てビット量に大きな差が発生すると、フレーム間で画質が大きく変動し、主観的な画質が劣化する可能性もある。 (【0011】以降は省略されています) この特許をJ-PlatPatで参照する