TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024057562
公報種別公開特許公報(A)
公開日2024-04-24
出願番号2023003991
出願日2023-01-13
発明の名称ビデオ符号化においてニューラルネットワークポストフィルタフレームレートアップサンプリング情報をシグナリングするためのシステム及び方法
出願人シャープ株式会社
代理人個人,個人,個人,個人
主分類H04N 19/82 20140101AFI20240417BHJP(電気通信技術)
要約【課題】符号化されたビデオのためのニューラルネットワークポストフィルタパラメータ情報をシグナリングするデバイス、システム及び方法を提供する。
【解決手段】ビデオ復号装置は、ニューラルネットワークポストフィルタピクチャ補間プロセスのための入力として使用される入力ピクチャの数を指定するシンタックス要素と、ニューラルネットワークポストフィルタピクチャ補間プロセスに入力される前に入力ピクチャが連結される方式を指定する値を有するシンタックス要素と、を含むニューラルネットワークポストフィルタ特性メッセージに含まれる情報に基づいて、フレームレートアップサンプリングを実行する。
【選択図】図6
特許請求の範囲【請求項1】
ビデオデータに対してニューラルネットワークフィルタリングを実行する方法であって、
ニューラルネットワークポストフィルタ特性メッセージを受信することと、
ニューラルネットワークポストフィルタピクチャ補間プロセスのための入力として使用される入力ピクチャの数を指定する第1のシンタックス要素を、前記ニューラルネットワークポストフィルタ特性メッセージからパースすることと、
前記ニューラルネットワークポストフィルタピクチャ補間プロセスに入力される前に入力ピクチャが連結される方式を指定する値を有する第2のシンタックス要素を、前記ニューラルネットワークポストフィルタ特性メッセージからパースすることと、
前記第2のシンタックス要素の前記値に基づいて入力ピクチャを連結することと、
を含む、方法。
続きを表示(約 1,200 文字)【請求項2】
1つ以上のプロセッサを備えるデバイスであって、前記1つ以上のプロセッサが、
ニューラルネットワークポストフィルタ特性メッセージを受信し、
ニューラルネットワークポストフィルタピクチャ補間プロセスのための入力として使用される入力ピクチャの数を指定する第1のシンタックス要素を、前記ニューラルネットワークポストフィルタ特性メッセージからパースし、
前記ニューラルネットワークポストフィルタピクチャ補間プロセスに入力される前に入力ピクチャが連結される方式を指定する値を有する第2のシンタックス要素を、前記ニューラルネットワークポストフィルタ特性メッセージからパースし、
前記第2のシンタックス要素の前記値に基づいて入力ピクチャを連結する
ように構成されている、デバイス。
【請求項3】
前記1つ以上のプロセッサが、
出力ピクチャが連結される方式を指定する値を有する第3のシンタックス要素を、前記ニューラルネットワークポストフィルタ特性メッセージからパースする
ように更に構成されている、請求項2に記載のデバイス。
【請求項4】
前記1つ以上のプロセッサが、
正規化範囲を示す値を有する第4のシンタックス要素を、前記ニューラルネットワークポストフィルタ特性メッセージからパースする
ように更に構成されている、請求項3に記載のデバイス。
【請求項5】
前記1つ以上のプロセッサが、
前記ニューラルネットワークポストフィルタピクチャ補間プロセスへの入力が規格化されるかどうかを示す値を有する第5のシンタックス要素を、前記ニューラルネットワークポストフィルタ特性メッセージからパースする
ように更に構成されている、請求項4に記載のデバイス。
【請求項6】
前記デバイスは、ビデオ復号装置を含む、請求項2に記載のデバイス。
【請求項7】
1つ以上のプロセッサを備えるデバイスであって、前記1つ以上のプロセッサが、
ニューラルネットワークポストフィルタ特性メッセージをシグナリングし、
ニューラルネットワークポストフィルタピクチャ補間プロセスのための入力として使用される入力ピクチャの数を指定する第1のシンタックス要素を、前記ニューラルネットワークポストフィルタ特性メッセージにおいてシグナリングし、
前記ニューラルネットワークポストフィルタピクチャ補間プロセスに入力される前に入力ピクチャが連結される方式を指定する値を有する第2のシンタックス要素を、前記ニューラルネットワークポストフィルタ特性メッセージにおいてシグナリングする
ように構成されている、デバイス。
【請求項8】
前記デバイスは、ビデオ符号化装置を含む、請求項7に記載のデバイス。

発明の詳細な説明【技術分野】
【0001】
本開示は、ビデオ符号化に関し、より詳細には、符号化されたビデオのためのニューラルネットワークポストフィルタパラメータ情報をシグナリングする技術に関する。
続きを表示(約 5,100 文字)【背景技術】
【0002】
デジタルビデオ能力は、デジタルテレビ、ラップトップ又はデスクトップコンピュータ、タブレット型コンピュータ、デジタル記録デバイス、デジタルメディアプレーヤ、ビデオゲーミングデバイス、いわゆるスマートフォンを含むセルラー電話、医療用イメージングデバイスなどを含む、広範囲のデバイスに組み込むことができる。デジタルビデオは、ビデオ符号化規格に従って符号化することができる。ビデオ符号化規格は、符号化されたビデオデータをカプセル化する準拠ビットストリームのフォーマットを定義する。準拠ビットストリームは、復元されたビデオデータを生成するために、ビデオ復号デバイスによって受信及び復号され得るデータ構造である。ビデオ符号化規格は、ビデオ圧縮技術を組み込むことができる。ビデオ符号化規格の例としては、ISO/IEC MPEG-4 Visual及びITU-T H.264(ISO/IEC MPEG-4 AVCとしても公知である)並びにHigh-Efficiency Video Coding(HEVC)が挙げられる。HEVCは、High Efficiency Video Coding(HEVC),Rec.ITU-T H.265(2016年12月)に記載されており、参照により本明細書に組み込まれ、本明細書ではITU-T H.265と称する。ITU-T H.265に関する拡張及び改善が、次世代ビデオ符号化規格の開発のために考えられている。例えば、ITU-T Video Coding Experts Group(VCEG)及びISO/IEC(Moving Picture Experts Group(MPEG)(Joint Video Exploration Team(JVET)と集合的に呼ばれる)は、現在のHEVC規格の圧縮能力を著しく上回る圧縮能力を有する規格化されたビデオ符号化技術を有する。The Joint Exploration Model 7(JEM 7),Algorithm Description of Joint Exploration Test Model 7(JEM 7),ISO/IEC JTC1/SC29/WG11 Document:ビデオ符号化技術を、ITU-T H.265の能力を超えて向上させる可能性を有するものとして、JVETによって協調的試験モデル研究中であった符号化特徴について、JVET-G1001,July 2017,Torino,ITが説明しており、それが参照により本明細書に組み込まれる。JEM 7の符号化特徴は、JEM参照ソフトウェアで実施されることに留意されたい。本明細書で使用されるとき、JEMという用語は、JEM 7に含まれるアルゴリズム及びJEM参照ソフトウェアの実施を集合的に表し得る。更に、VCEG及びMPEGが共同で発行した「Joint Call for Proposals on Video Compression with Capabilities beyond HEVC」に応答して、ビデオ符号化ツールに関する複数の説明が様々なグループによって、10
th
Meeting of ISO/IEC JTC1/SC29/WG11 16-20 April 2018,San Diego,CAにおいて提案された。ビデオ符号化ツールの複数の説明から得られたビデオ符号化仕様の初期のドラフトテキストが、「Versatile Video Coding(Draft 1)」,10
th
Meeting of ISO/IEC JTC1/SC29/WG11 16-20 April 2018,San Diego,CA,document JVET-J1001-v2において説明され、これは参照により本明細書に組み込まれ、JVET-J1001として参照される。VCEG及びMPEGによるビデオ符号化規格のこの開発は、汎用ビデオ符号化(VVC)プロジェクトと呼ばれる。「Versatile Video Coding(Draft 10)」,20th Meeting of ISO/IEC JTC1/SC29/WG11 7-16 October 2020,Teleconference,document JVET-T2001-v2は、VVCプロジェクトに対応するビデオ符号化仕様のドラフトテキストの現在の反復を表し、これは参照により本明細書に組み込まれ、JVET-T2001として参照される。
【0003】
ビデオ圧縮技術は、ビデオデータを記憶し送信するためのデータ要件を低減することを可能にする。ビデオ圧縮技術は、ビデオ系列における固有の冗長性を利用することにより、データ要件を低減することができる。ビデオ圧縮技術は、ビデオ系列を連続的により小さい部分(すなわち、ビデオ系列内のピクチャ群、ピクチャ群内のピクチャ、ピクチャ内の領域、領域内のサブ領域など)に再分割し得る。イントラ予測符号化技術(例えば、ピクチャ内の空間予測技術)及びインター予測技術(すなわち、ピクチャ間技術(時間))を使用して、符号化されるビデオデータのユニットとビデオデータの参照ユニットとの間の差分値を生成することができる。差分値は、残差データと呼ばれることがある。残差データは、量子化された変換係数として符号化することができる。シンタックス要素は、残差データと参照符号化ユニットを関連付けることができる(例えば、イントラ予測モードインデックス、及び動き情報)。残差データ及びシンタックス要素は、エントロピ符号化することができる。エントロピ符号化された残差データ及びシンタックス要素は、準拠ビットストリームを形成するデータ構造に含めることができる。
【発明の概要】
【0004】
概して、本開示は、ビデオデータを符号化する様々な技術を説明する。特に、本開示は、符号化されたビデオデータのためのニューラルネットワークポストフィルタパラメータ情報をシグナリングする技術を説明する。本開示の技術は、ITU-T H.264、ITU-T H.265、JEM、及びJVET-T2001に関して説明されているが、本開示の技術は、ビデオ符号化に一般に適用可能であることに留意されたい。例えば、本明細書で説明する符号化技術は、ITU-T H.265、JEM、及びJVET-T2001に含まれるもの以外のビデオブロック構造、イントラ予測技術、インター予測技術、変換技術、フィルタリング技術、及び/又はエントロピ符号化技術を含むビデオ符号化システム(将来のビデオ符号化規格に基づくビデオ符号化システムを含む)に組み込むことができる。したがって、ITU-T H.264、ITU-T H.265、JEM、及び/又はJVET-T2001の参照は、説明のためのものであり、本明細書で説明する技術の範囲を限定するように解釈すべきではない。更に、本明細書での文書の参照による組み込みは、説明のためのものであり、本明細書で使用される用語に関して限定する又は曖昧さを生むように解釈されるべきではないことに留意されたい。例えば、組み込まれた参照が、別の組み込まれた参照のものとは異なる用語の定義を与える場合、かつ/又はその用語が本明細書で使用されるような場合には、その用語は、それぞれの対応する定義を幅広く含むように、及び/又は代わりに特定の定義のそれぞれを含むように解釈されるべきである。
【0005】
一例では、ビデオデータを符号化する方法は、ニューラルネットワークポストフィルタ特性メッセージをシグナリングすることと、ニューラルネットワークポストフィルタピクチャ補間プロセスのための入力として使用される入力ピクチャの数を指定する第1のシンタックス要素を、ニューラルネットワークポストフィルタ特性メッセージにおいてシグナリングすることと、ニューラルネットワークポストフィルタピクチャ補間プロセスに入力される前に入力ピクチャが連結される方式を指定する値を有する第2のシンタックス要素を、ニューラルネットワークポストフィルタ特性メッセージにおいてシグナリングすることと、を含む。
【0006】
一例では、デバイスは、1つ以上のプロセッサを備え、1つ以上のプロセッサは、ニューラルネットワークポストフィルタ特性メッセージをシグナリングし、ニューラルネットワークポストフィルタピクチャ補間プロセスのための入力として使用される入力ピクチャの数を指定する第1のシンタックス要素を、ニューラルネットワークポストフィルタ特性メッセージにおいてシグナリングし、ニューラルネットワークポストフィルタピクチャ補間プロセスに入力される前に入力ピクチャが連結される方式を指定する値を有する第2のシンタックス要素を、ニューラルネットワークポストフィルタ特性メッセージにおいてシグナリングするように構成されている。
【0007】
一例では、非一時的コンピュータ可読記憶媒体は、非一時的コンピュータ可読記憶媒体に記憶された命令を含み、命令が実行されたときに、デバイスの1つ以上のプロセッサに、ニューラルネットワークポストフィルタ特性メッセージをシグナリングさせ、ニューラルネットワークポストフィルタピクチャ補間プロセスのための入力として使用される入力ピクチャの数を指定する第1のシンタックス要素を、ニューラルネットワークポストフィルタ特性メッセージにおいてシグナリングさせ、ニューラルネットワークポストフィルタピクチャ補間プロセスに入力される前に入力ピクチャが連結される方式を指定する値を有する第2のシンタックス要素を、ニューラルネットワークポストフィルタ特性メッセージにおいてシグナリングさせる。
【0008】
一例では、装置は、ニューラルネットワークポストフィルタピクチャ補間プロセスのための入力として使用される入力ピクチャの数を指定する第1のシンタックス要素を、ニューラルネットワークポストフィルタ特性メッセージにおいてシグナリングするための手段と、ニューラルネットワークポストフィルタピクチャ補間プロセスに入力される前に入力ピクチャが連結される方式を指定する値を有する第2のシンタックス要素を、ニューラルネットワークポストフィルタ特性メッセージにおいてシグナリングするための手段と、を備える。
【0009】
一例では、ビデオデータを復号する方法は、ニューラルネットワークポストフィルタ特性メッセージを受信することと、ニューラルネットワークポストフィルタピクチャ補間プロセスのための入力として使用される入力ピクチャの数を指定する第1のシンタックス要素を、ニューラルネットワークポストフィルタ特性メッセージからパースすることと、ニューラルネットワークポストフィルタピクチャ補間プロセスに入力される前に入力ピクチャが連結される方式を指定する値を有する第2のシンタックス要素を、ニューラルネットワークポストフィルタ特性メッセージからパースすることと、第2のシンタックス要素の値に基づいて入力ピクチャを連結することと、を含む。
【0010】
一例では、デバイスは、1つ以上のプロセッサを備え、1つ以上のプロセッサは、ニューラルネットワークポストフィルタ特性メッセージを受信し、ニューラルネットワークポストフィルタピクチャ補間プロセスのための入力として使用される入力ピクチャの数を指定する第1のシンタックス要素を、ニューラルネットワークポストフィルタ特性メッセージからパースし、ニューラルネットワークポストフィルタピクチャ補間プロセスに入力される前に入力ピクチャが連結される方式を指定する値を有する第2のシンタックス要素を、ニューラルネットワークポストフィルタ特性メッセージからパースし、第2のシンタックス要素の値に基づいて入力ピクチャを連結するように構成されている。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
挿耳装置
28日前
個人
メガホン
9日前
個人
通話装置
28日前
個人
イラストの著作権保護方法
1か月前
シャープ株式会社
調理器
2日前
富士通株式会社
光送信装置
29日前
船井電機株式会社
表示装置
16日前
船井電機株式会社
表示装置
7日前
キヤノン株式会社
表示装置
29日前
富士通株式会社
光受信装置
29日前
リオン株式会社
補聴器
1か月前
日本無線株式会社
通信システム
22日前
キヤノン電子株式会社
照明付スピーカー
29日前
トヨタ自動車株式会社
車両
1か月前
株式会社日立国際電気
通信システム
1か月前
沖電気工業株式会社
受光回路
2日前
株式会社小野測器
音響校正器
14日前
株式会社小野測器
音響校正器
14日前
マスプロ電工株式会社
光信号計測装置
1か月前
株式会社JMC
映像音声配信用セット
16日前
三菱電機株式会社
送信機
29日前
日本電気株式会社
端末及び認証システム
24日前
日本無線株式会社
復調器および復調方法
22日前
株式会社ネットアプリ
飲料用演出グラス
1か月前
株式会社埼王住研
金属鉢を含むスピーカー
23日前
フォスター電機株式会社
スピーカユニット
16日前
シャープ株式会社
電気機器および携帯端末
14日前
株式会社埼王住研
吸気弁を含むスピーカー
23日前
株式会社ダイフク
物品搬送設備
7日前
株式会社日立国際電気
撮像装置
1か月前
ホシデン株式会社
イヤーパッド
21日前
トヨタ自動車株式会社
端末装置
8日前
日本放送協会
撮像素子および撮像装置
21日前
三菱電機株式会社
監視システム
22日前
トヨタ自動車株式会社
端末装置
8日前
大和ハウス工業株式会社
制御システム
29日前
続きを見る