TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025025460
公報種別公開特許公報(A)
公開日2025-02-21
出願番号2023130238
出願日2023-08-09
発明の名称符号化装置、符号化プログラム、プリ処理装置、及びプリ処理プログラム
出願人日本放送協会
代理人弁理士法人キュリーズ
主分類H04N 19/85 20140101AFI20250214BHJP(電気通信技術)
要約【課題】主観画質だけではなく客観画質を向上させることが可能な符号化装置及び符号化プログラムを提供する。
【解決手段】一態様に係る符号化装置100は、第1映像信号に対して、学習済の第1ニューラルネットワークモデルを用いてプリ処理を行い、プリ処理後の映像信号を出力するプリ処理部110を有する。また、符号化装置100は、プリ処理後の映像信号に対してピクチャ参照構造を利用して符号化処理を行い、符号化された符号化映像信号を出力する映像符号化部120を有する。ここで、第1ニューラルネットワークモデルに対する学習は、映像符号化部で用いられるピクチャ参照構造と同一のピクチャ参照構造を利用して学習された第2ニューラルネットワークモデルを含むニューラルネットワーク映像符号化部を用いて行われる。
【選択図】図2
特許請求の範囲【請求項1】
第1映像信号に対して、学習済の第1ニューラルネットワークモデルを用いてプリ処理を行い、プリ処理後の映像信号を出力するプリ処理部と、
前記プリ処理後の映像信号に対してピクチャ参照構造を利用して符号化処理を行い、符号化された符号化映像信号を出力する映像符号化部と、を有し、
前記第1ニューラルネットワークモデルに対する学習は、前記映像符号化部で用いられる前記ピクチャ参照構造と同一のピクチャ参照構造を利用して学習された第2ニューラルネットワークモデルを含むニューラルネットワーク映像符号化部を用いて行われる
符号化装置。
続きを表示(約 1,500 文字)【請求項2】
前記ニューラルネットワーク映像符号化部は、第2映像信号に対して、前記第2ニューラルネットワークモデルを用いてイントラ符号化及びインター符号化を行い、ニューラルネットワーク符号化映像信号を出力する
請求項1記載の符号化装置。
【請求項3】
前記第2ニューラルネットワークモデルの学習の際に、第2映像信号に対する前記ニューラルネットワーク映像符号化部の出力であるニューラルネットワーク符号化映像信号と、前記第2映像信号に対する前記映像符号化部の出力である符号化映像信号とに対する誤差判定を行い、前記第2ニューラルネットワークモデルのパラメータを最適化する第1誤差判定部を、更に有する
請求項1記載の符号化装置。
【請求項4】
前記第1ニューラルネットワークモデルの学習の際に、前記プリ処理後の映像信号に対する前記ニューラルネットワーク映像符号化部の出力であるニューラルネットワーク符号化映像信号と、前記プリ処理部に入力される第3映像信号とに対する誤差判定を行い、前記第1ニューラルネットワークモデルのパラメータを最適化する第2誤差判定部を、更に有する
請求項1記載の符号化装置。
【請求項5】
前記プリ処理部は、前記映像符号化部と同一の前記ピクチャ参照構造を利用して、前記第1映像信号に対して前記プリ処理を行う
請求項1記載の符号化装置。
【請求項6】
符号化装置のコンピュータに実行させる符号化プログラムであって、
第1映像信号に対して、学習済の第1ニューラルネットワークモデルを用いてプリ処理を行い、プリ処理後の映像信号を出力する処理と、
前記プリ処理後の映像信号に対してピクチャ参照構造を利用して符号化処理を行い、符号化された符号化映像信号を出力する処理と、を前記コンピュータに実行させ、
前記第1ニューラルネットワークモデルに対する学習は、前記符号化映像信号を出力する処理で用いられる前記ピクチャ参照構造と同一のピクチャ参照構造を利用して学習された第2ニューラルネットワークモデルを含むニューラルネットワーク映像符号化部を用いて行われる
符号化プログラム。
【請求項7】
プリ処理装置であって、
第1映像信号に対して、学習済の第1ニューラルネットワークモデルを用いてプリ処理を行い、プリ処理後の映像信号を符号化装置へ出力するプリ処理部、を有し、
前記符号化装置では、前記プリ処理後の映像信号に対してピクチャ参照構造を利用して符号化処理が行われ、
前記第1ニューラルネットワークモデルに対する学習は、前記符号化装置で用いられる前記ピクチャ参照構造と同一のピクチャ参照構造を利用して学習された第2ニューラルネットワークモデルを含むニューラルネットワーク映像符号化部を用いて行われる
プリ処理装置。
【請求項8】
プリ処理装置のコンピュータで実行されるプリ処理プログラムであって、
第1映像信号に対して、学習済の第1ニューラルネットワークモデルを用いてプリ処理を行い、プリ処理後の映像信号を符号化装置へ出力する処理、をコンピュータに実行させ、
前記符号化装置では、前記プリ処理後の映像信号に対してピクチャ参照構造を利用して符号化処理が行われ、
前記第1ニューラルネットワークモデルに対する学習は、前記符号化装置で用いられる前記ピクチャ参照構造と同一のピクチャ参照構造を利用して学習された第2ニューラルネットワークモデルを含むニューラルネットワーク映像符号化部を用いて行われる
プリ処理プログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、符号化装置、符号化プログラム、プリ処理装置、及びプリ処理プログラムに関する。
続きを表示(約 2,600 文字)【背景技術】
【0002】
近年、ニューラルネットワークを用いた符号化方法が注目されつつある。
【0003】
例えば、現画像と過去画像との動きベクトルを検出する動き検出処理と、動きベクトルから予測画像を生成する動き補償処理と、原画像と予測画像との差分画像を変換(例えば、DCT変換など)する変換処理などを、CNN(Convolutional Neural Network)を用いて行う符号化手法がある(例えば、非特許文献1)。このような符号化手法をエンドツーエンド(end-to-end)で最適化させることで、HEVC(High Efficiency Video Coding)などの従来型の符号化方式と同程度の符号化効率を得ることができる。
【0004】
また、ニューラルネットワークを用いた符号化手法と合わせて、符号化前に、プリ処理(preprocessing)を行う符号化手法もある(例えば、非特許文献2及び非特許文献3)。プリ処理を用いた符号化手法に関し、MS-SSIM(Multi-Scale Structural Similarity)又はVMAF(Video Multimethod Assessment Fusion)による主観画質指標を用いると、H.264などの従来型の符号化方式と比較して、符号化効率が向上することが報告されている。
【先行技術文献】
【非特許文献】
【0005】
G. Lu, W. Ouyang, D. Xu, X. Zhang, C. Cai and Z. Gao, "DVC: An End-To-End Deep Video Compression Framework," 2019 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2019 April 7, pp. 10998-11007.
A. Chadha and Y. Andreopoulos, "Deep Perceptual Preprocessing for Video Coding," 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), 2021, pp. 14847-14856.
A. Chadha, R. Anam, I. Fadeev, V. Giotsas, and Y. Andreopoulos, “Escaping The Complexity-Bitrate-Quality Barriers Of Video Encoders Via Deep Perceptual Optimization,” SPIE2020, Optical Engineering + Applications.
【発明の概要】
【発明が解決しようとする課題】
【0006】
本開示は、主観画質だけではなく客観画質を向上させることが可能な符号化装置、符号化プログラム、プリ処理装置、及びプリ処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
第1の態様に係る符号化装置は、第1映像信号に対して、学習済の第1ニューラルネットワークモデルを用いてプリ処理を行い、プリ処理後の映像信号を出力するプリ処理部を有する。また、符号化装置は、プリ処理後の映像信号に対してピクチャ参照構造を利用して符号化処理を行い、符号化された符号化映像信号を出力する映像符号化部を有する。ここで、第1ニューラルネットワークモデルに対する学習は、映像符号化部で用いられるピクチャ参照構造と同一のピクチャ参照構造を利用して学習された第2ニューラルネットワークモデルを含むニューラルネットワーク映像符号化部を用いて行われる。
【0008】
第2の態様に係る符号化プログラムは、符号化装置のコンピュータに実行させる符号化プログラムである。前記符号化プログラムは、第1映像信号に対して、学習済の第1ニューラルネットワークモデルを用いてプリ処理を行い、プリ処理後の映像信号を出力する処理をコンピュータに実行させる。また、前記符号化プログラムは、プリ処理後の映像信号に対してピクチャ参照構造を利用して符号化処理を行い、符号化された符号化映像信号を出力する処理をコンピュータに実行させる。ここで、第1ニューラルネットワークモデルに対する学習は、符号化映像信号を出力する処理で用いられるピクチャ参照構造と同一のピクチャ参照構造を利用して学習された第2ニューラルネットワークモデルを含むニューラルネットワーク映像符号化部を用いて行われる。
【0009】
第3の態様に係るプリ処理装置は、第1映像信号に対して、学習済の第1ニューラルネットワークモデルを用いてプリ処理を行い、プリ処理後の映像信号を符号化装置へ出力するプリ処理部を有する。符号化装置では、プリ処理後の映像信号に対してピクチャ参照構造を利用して符号化処理が行われる。そして、第1ニューラルネットワークモデルに対する学習は、符号化装置で用いられるピクチャ参照構造と同一のピクチャ参照構造を利用して学習された第2ニューラルネットワークモデルを含むニューラルネットワーク映像符号化部を用いて行われる。
【0010】
第4の態様に係るプリ処理プログラムは、プリ処理装置のコンピュータで実行されるプリ処理プログラムである。前記プリ処理プログラムは、第1映像信号に対して、学習済の第1ニューラルネットワークモデルを用いてプリ処理を行い、プリ処理後の映像信号を符号化装置へ出力する処理、をコンピュータに実行させる。符号化装置では、プリ処理後の映像信号に対してピクチャ参照構造を利用して符号化処理が行われる。第1ニューラルネットワークモデルに対する学習は、符号化装置で用いられるピクチャ参照構造と同一のピクチャ参照構造を利用して学習された第2ニューラルネットワークモデルを含むニューラルネットワーク映像符号化部を用いて行われる。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

日本放送協会
撮像装置
9か月前
日本放送協会
撮像装置
1か月前
日本放送協会
撮像装置
8か月前
日本放送協会
液晶表示装置
6か月前
日本放送協会
カメラ正対治具
10か月前
日本放送協会
光制御デバイス
6か月前
日本放送協会
無線伝送システム
27日前
日本放送協会
レンズアダプター
3か月前
日本放送協会
磁性細線デバイス
1か月前
日本放送協会
360度撮影装置
8か月前
日本放送協会
有機光電変換素子
7か月前
日本放送協会
情報提示システム
8か月前
日本放送協会
LDM送信システム
8か月前
日本放送協会
3次元映像表示装置
10か月前
日本放送協会
垂直分離型撮像素子
5か月前
日本放送協会
三次元撮像システム
11か月前
日本放送協会
データ管理システム
27日前
日本放送協会
データ管理システム
10か月前
日本放送協会
送出装置及び受信装置
6か月前
日本放送協会
受信装置及び送出装置
2か月前
日本放送協会
送信装置及び受信装置
1か月前
日本放送協会
送信装置及び受信装置
6か月前
日本放送協会
送信装置及び受信装置
9か月前
日本放送協会
表示端末、プログラム
11か月前
日本放送協会
送信装置及び受信装置
6か月前
日本放送協会
送信装置及び受信装置
3か月前
日本放送協会
衛星放送受信システム
3か月前
日本放送協会
送信装置及び受信装置
3か月前
日本放送協会
撮像装置及び撮像方法
8か月前
日本放送協会
撮像素子及び撮像装置
6か月前
日本放送協会
同軸切替器の着脱機構
4か月前
日本放送協会
送信装置及び受信装置
9か月前
日本放送協会
送信装置及び受信装置
9日前
日本放送協会
送信装置及び受信装置
9日前
日本放送協会
送信装置及び受信装置
9か月前
日本放送協会
送信装置及び受信装置
11か月前
続きを見る