TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025066740
公報種別公開特許公報(A)
公開日2025-04-23
出願番号2025002891,2023543103
出願日2025-01-08,2022-01-19
発明の名称スケーラブルな符号化及び復号方法及び装置
出願人華為技術有限公司,HUAWEI TECHNOLOGIES CO.,LTD.
代理人弁理士法人ITOH
主分類H04N 19/90 20140101AFI20250416BHJP(電気通信技術)
要約【課題】人工知能(AI)ベースのビデオ又はピクチャ圧縮技術の分野に関し、スケーラブルな符号化及び復号方法及び装置を提供する。
【解決手段】符号化方法は、ビデオ信号の第1信号成分の制御信号を第1信号成分の第1特徴マップに適用して、第1信号成分の第2特徴マップを取得するステップであり、第1信号成分の制御信号は学習を通じて取得されるステップと、ビデオ信号の第2信号成分の制御信号を第2信号成分の第1特徴マップに適用して、第2信号成分の第2特徴マップを取得するステップであり、第2信号成分の制御信号は学習を通じて取得されるステップと、第1信号成分の第2特徴マップと第2信号成分の第2特徴マップとに基づいて、ビデオ信号のビットストリームを取得するステップと、を含む。この出願は、異なる色特性を持つピクチャコンテンツに適応することができる。
【選択図】図7B
特許請求の範囲【請求項1】
ビデオ信号符号化方法であって、
ビデオ信号の第1信号成分の品質係数情報及び前記ビデオ信号の第2信号成分の品質係数情報をビットストリームに符号化するステップと、
前記第1信号成分の前記品質係数情報に基づいて前記第1信号成分の制御信号を取得するステップと、
前記第2信号成分の前記品質係数情報に基づいて前記第2信号成分の制御信号を取得するステップと、
前記第1信号成分の前記制御信号を前記第1信号成分の第1特徴マップに適用して、前記第1信号成分の第2特徴マップを取得するステップと、
前記第2信号成分の前記制御信号を前記第2信号成分の第1特徴マップに適用して、前記第2信号成分の第2特徴マップを取得するステップと、
前記第1信号成分の前記第2特徴マップ及び前記第2信号成分の前記第2特徴マップを前記ビットストリームに符号化するステップと、
を有する方法。
続きを表示(約 3,000 文字)【請求項2】
当該方法は更に、
前記第1信号成分の前記品質係数情報に基づいて、N個の候補第1制御信号から前記第1信号成分の前記制御信号を取得するステップであり、Nは1より大きい整数である、ステップと、
前記第2信号成分の前記品質係数情報に基づいて、M個の候補第2制御信号から前記第2信号成分の前記制御信号を取得するステップであり、Mは1より大きい整数である、ステップと、
を有する、請求項1に記載の方法。
【請求項3】
前記第1信号成分の前記第2特徴マップ及び前記第2信号成分の前記第2特徴マップを前記ビットストリームに前記符号化するステップは、
前記第1信号成分の前記第2特徴マップと、前記第2信号成分の前記第2特徴マップと、に対してエントロピー符号化を実行して、前記ビデオ信号の前記ビットストリームを取得すること、
前記第1信号成分の前記第2特徴マップと、ニューラルネットワークによって処理された前記第2信号成分の前記第2特徴マップと、に対してエントロピー符号化を実行して、前記ビデオ信号の前記ビットストリームを取得すること、
ニューラルネットワークによって処理された前記第1信号成分の前記第2特徴マップと、前記第2信号成分の前記第2特徴マップと、に対してエントロピー符号化を実行して、前記ビデオ信号の前記ビットストリームを取得すること、又は
ニューラルネットワークによって処理された前記第1信号成分の前記第2特徴マップと、ニューラルネットワークによって処理された前記第2信号成分の前記第2特徴マップと、に対してエントロピー符号化を実行して、前記ビデオ信号の前記ビットストリームを取得すること、
を有する、請求項1又は2に記載の方法。
【請求項4】
前記第1信号成分の前記第2特徴マップ及び前記第2信号成分の前記第2特徴マップを前記符号化するステップは、
前記第1信号成分の前記第2特徴マップと、前記第2信号成分の前記第2特徴マップと、に対してジョイント処理を実行して、ジョイント特徴マップを取得し、該ジョイント特徴マップに対してエントロピー符号化を実行して、前記ビデオ信号の前記ビットストリームを取得すること、
前記第1信号成分の前記第2特徴マップと、ニューラルネットワークによって処理された前記第2信号成分の前記第2特徴マップと、に対してジョイント処理を実行して、ジョイント特徴マップを取得し、該ジョイント特徴マップに対してエントロピー符号化を実行して、前記ビデオ信号の前記ビットストリームを取得すること、
ニューラルネットワークによって処理された前記第1信号成分の前記第2特徴マップと、前記第2信号成分の前記第2特徴マップと、に対してジョイント処理を実行して、ジョイント特徴マップを取得し、該ジョイント特徴マップに対してエントロピー符号化を実行して、前記ビデオ信号の前記ビットストリームを取得すること、又は
ニューラルネットワークによって処理された前記第1信号成分の前記第2特徴マップと、ニューラルネットワークによって処理された前記第2信号成分の前記第2特徴マップと、に対してジョイント処理を実行して、ジョイント特徴マップを取得し、該ジョイント特徴マップに対してエントロピー符号化を実行して、前記ビデオ信号の前記ビットストリームを取得すること、
を有する、請求項1又は2に記載の方法。
【請求項5】
前記第1信号成分はY成分であり、前記第2信号成分はUV成分である、請求項1乃至4のいずれか一項に記載の方法。
【請求項6】
前記第2信号成分が前記UV成分である場合、当該方法は、
学習を通じて、前記Y成分の制御信号行列{q
y1
,q
y2
,…,q
yi
,…,q
yN
}と、前記UV成分の制御信号行列{q
uv1
,q
uv2
,…,q
uvj
,…,q
uvM
}とを生成するステップであり、N及びMは1より大きい整数である、ステップと、
前記Y成分の品質係数情報のインデックスiに基づいて、前記第1信号成分の制御信号q
yi
を取得するステップと、
前記UV成分の品質係数情報のインデックスjに基づいて、前記第2信号成分の制御信号q
uvj
を取得するステップと、
を有する、請求項5に記載の方法。
【請求項7】
前記ビデオ信号の前記ビットストリームは、前記Y成分の前記品質係数の前記インデックスi及び前記UV成分の前記品質係数の前記インデックスjを含む、請求項6に記載の方法。
【請求項8】
前記第2信号成分が前記UV成分である場合、当該方法は、
前記Y成分の品質係数を全結合型ネットワークへの入力として使用し、前記Y成分の制御信号を出力するステップと、
前記UV成分の品質係数を前記全結合型ネットワークへの入力として使用し、前記UV成分の制御信号を出力するステップと、
を有する、請求項5に記載の方法。
【請求項9】
前記制御信号が制御ベクトルを有する場合、前記第1信号成分の前記制御信号を前記第1信号成分の第1特徴マップに適用して、前記第1信号成分の第2特徴マップを前記取得するステップは、
前記第1信号成分の制御ベクトルに前記第1信号成分の前記第1特徴マップを乗算して、前記第1信号成分の前記第2特徴マップを取得すること、
を有し、
前記第2信号成分の前記制御信号を前記第2信号成分の第1特徴マップに適用して、前記第2信号成分の第2特徴マップを前記取得するステップは、
前記第2信号成分の制御ベクトルに前記第1信号成分の前記第2特徴マップを乗算して、前記第2信号成分の前記第2特徴マップを取得すること、
を有する、請求項1乃至8のいずれか一項に記載の方法。
【請求項10】
前記制御信号が制御ベクトルとオフセットベクトルとを有する場合、前記第1信号成分の前記制御信号を前記第1信号成分の第1特徴マップに適用して、前記第1信号成分の第2特徴マップを前記取得するステップは、
前記第1信号成分の制御ベクトルに前記第1信号成分の前記第1特徴マップを乗算し、次いで、前記第1信号成分のオフセットベクトルを加算して、前記第1信号成分の前記第2特徴マップを取得すること、
を有し、
前記第2信号成分の前記制御信号を前記第2信号成分の第1特徴マップに適用して、前記第2信号成分の第2特徴マップを前記取得するステップは、
前記第2信号成分の制御ベクトルに前記第1信号成分の前記第2特徴マップを乗算し、次いで、前記第2信号成分のオフセットベクトルを加算して、前記第2信号成分の前記第2特徴マップを取得すること、
を有する、請求項1乃至8のいずれか一項に記載の方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明の実施形態は、人工知能(AI)ベースのビデオ又はピクチャ圧縮技術の分野に関し、特に、スケーラブルな符号化及び復号方法及び装置に関する。
続きを表示(約 3,000 文字)【背景技術】
【0002】
ビデオ圧縮符号化及び復号技術は、例えば、放送デジタルテレビジョン、インターネット及びモバイルネットワーク上でのビデオ伝送、例えばビデオチャット及びビデオ会議などのリアルタイム会話アプリケーション、DVD及びBlu-rayディスク、ビデオコンテンツ収集・編集システム、並びにセキュリティ用途のビデオカメラといった、マルチメディアサービス、放送、ビデオ通信、ストレージ、及びこれらに類するものの分野において広く使用されている。
【0003】
短い映像であってもそれを描写するために大量のビデオデータが必要とされる。これは、限られた帯域幅容量を持つネットワーク上でデータがストリーミングされる又はその他の方法で通信されるときに困難をもたらし得る。従って、ビデオデータは一般に、今日の遠隔通信ネットワーク上で通信される前に圧縮される。ビデオのサイズはまた、メモリリソースが限られ得るために、ビデオがストレージ装置に格納されるときにも懸念となり得る。ビデオ圧縮装置は、しばしば、伝送又は記憶に先立って、ソースにてソフトウェア及び/又はハードウェアを用いてビデオデータを符号化して、デジタルビデオピクチャを表すのに必要なデータの量を減少させる。そして、圧縮されたデータが、送り先でビデオ解凍装置によって受信される。限られたネットワークリソースと、増加の一途をたどるいっそう高いビデオ品質の要求とに伴い、ピクチャ品質の犠牲を殆ど乃至は全く伴わずに圧縮比を向上させるために、圧縮及び解凍技術を改善する必要がある。
【0004】
近年、エンドツーエンドピクチャ符号化及び復号技術の分野にディープラーニングを適用することが徐々にトレンドとなっている。ハイブリッドアーキテクチャを使用するビデオエンコーダ及びビデオデコーダでは、特徴マップに対してエントロピー符号化が実行されるときに、特徴値がゼロ平均ガウス分布を満たすと仮定され、超事前分布(hyperprior)構造を用いることによってガウス分布の分散を推定して、特徴値の確率分布モデルを取得し、そして、算術符号化モジュールが、推定された確率分布に基づいて、特徴マップに対してエントロピー符号化を実行する。デコーダサイドが特徴マップの確率分布を正確に推定することを可能にするために、超事前分布構造内のモジュールが、推定された確率分布の隠れ変数を抽出し、該隠れ変数が、量子化及び算術符号化を通じて副次的な情報として、デコーダサイドに伝達される。このメカニズムにおいて、YUVフォーマットの入力ピクチャでは、Y、U、及びV成分のビットレートの比が固定されている。しかしながら、ピクチャはコンテンツにおいて異なる色特性を持つので、Y、U、及びV成分のビットレートの固定された比は、符号化されたピクチャにおいて大きな歪みを生じさせる。
【発明の概要】
【0005】
この出願は、異なる色特性を持つピクチャコンテンツに適応するためのスケーラブルな符号化及び復号方法及び装置を提供する。
【0006】
この出願において、スケーラブルな符号化及び復号は、ビデオ信号が第1信号成分及び第2信号成分に分割されること、又はビデオ信号が第1信号成分、第2信号成分、及び第3信号成分に分割されることを示す。第1信号成分はY成分であり、第2信号成分はUV成分、U成分、又はV成分である。第2信号成分がU成分である場合、第3信号成分はV成分である。代わりに、第2信号成分がV成分である場合、第3信号成分はU成分である。
【0007】
第1態様によれば、この出願は符号化方法を提供する。当該符号化方法は、ビデオ信号の第1信号成分の制御信号を第1信号成分の第1特徴マップに適用して、第1信号成分の第2特徴マップを取得し、第1信号成分の制御信号は学習を通じて取得され、ビデオ信号の第2信号成分の制御信号を第2信号成分の第1特徴マップに適用して、第2信号成分の第2特徴マップを取得し、第2信号成分の制御信号は学習を通じて取得され、第1信号成分の第2特徴マップと第2信号成分の第2特徴マップとに基づいて、ビデオ信号のビットストリームを取得する、ことを含む。
【0008】
取り得る一実装において、第1信号成分の第2特徴マップと第2信号成分の第2特徴マップとに基づいて、ビデオ信号のビットストリームを取得することは、第1信号成分の第2特徴マップと、第2信号成分の第2特徴マップとに対して、第1信号成分の第2特徴マップと、ニューラルネットワークによって処理された第2信号成分の第2特徴マップとに対して、ニューラルネットワークによって処理された第1信号成分の第2特徴マップと、第2信号成分の第2特徴マップとに対して、又は、ニューラルネットワークによって処理された第1信号成分の第2特徴マップと、ニューラルネットワークによって処理された第2信号成分の第2特徴マップとに対して、エントロピー符号化を実行して、ビデオ信号のビットストリームを取得すること、を含む。
【0009】
取り得る一実装において、第1信号成分の第2特徴マップと第2信号成分の第2特徴マップとに基づいて、ビデオ信号のビットストリームを取得することは、第1信号成分の第2特徴マップと、第2信号成分の第2特徴マップと、に対してジョイント処理を実行して、ジョイント特徴マップを取得し、該ジョイント特徴マップに対してエントロピー符号化を実行して、ビデオ信号のビットストリームを取得すること、第1信号成分の第2特徴マップと、ニューラルネットワークによって処理された第2信号成分の第2特徴マップと、に対してジョイント処理を実行して、ジョイント特徴マップを取得し、該ジョイント特徴マップに対してエントロピー符号化を実行して、ビデオ信号のビットストリームを取得すること、ニューラルネットワークによって処理された第1信号成分の第2特徴マップと、第2信号成分の第2特徴マップと、に対してジョイント処理を実行して、ジョイント特徴マップを取得し、該ジョイント特徴マップに対してエントロピー符号化を実行して、ビデオ信号のビットストリームを取得すること、又は、ニューラルネットワークによって処理された第1信号成分の第2特徴マップと、ニューラルネットワークによって処理された第2信号成分の第2特徴マップと、に対してジョイント処理を実行して、ジョイント特徴マップを取得し、該ジョイント特徴マップに対してエントロピー符号化を実行して、ビデオ信号のビットストリームを取得すること、を含む。
【0010】
取り得る一実装において、当該方法は、第1信号成分の品質係数に基づいて、N個の候補第1制御信号から第1信号成分の制御信号を取得し、Nは1より大きい整数であり、第2信号成分の品質係数に基づいて、M個の候補第2制御信号から第2信号成分の制御信号を取得し、Mは1より大きい整数である、ことを含む。NとMは等しくてもよいし、等しくなくてもよい。これはこの出願において限定されることではない。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

華為技術有限公司
マルチリンク再構成方法および装置
12日前
華為技術有限公司
短距離通信方法、装置、及びシステム
17日前
華為技術有限公司
マルチリンク確立方法および通信装置
17日前
華為技術有限公司
エンコーダ、デコーダ及び対応する方法
17日前
華為技術有限公司
通信方法、通信装置および通信システム
17日前
華為技術有限公司
動きベクトル予測方法及び関連する装置
17日前
華為技術有限公司
エンコーダ、デコーダ、及び対応する方法
12日前
華為技術有限公司
スケーラブルな符号化及び復号方法及び装置
4日前
華為技術有限公司
表示画面、表示画面保護膜、および電子デバイス
17日前
華為技術有限公司
信号トランシーバー装置、給電構造、及びアンテナ
12日前
華為技術有限公司
時間リソース割り当て及び受信方法、並びに関連装置
12日前
華為技術有限公司
電子デバイスに適用される制御方法及び電子デバイス
17日前
華為技術有限公司
ビデオエンコーダ、ビデオデコーダ、及び対応する方法
12日前
華為技術有限公司
動きベクトル予測方法および装置、エンコーダ、ならびにデコーダ
17日前
華為技術有限公司
無線フレーム送信方法及び装置並びに無線フレーム受信方法及び装置
12日前
華為技術有限公司
データ伝送方法、通信装置、コンピュータ可読記憶媒体、およびチップ
17日前
華為技術有限公司
ワイヤレス通信ネットワーク内のセンシングシステム、方法、および装置
1か月前
華為技術有限公司
指定されたレイヤのためのスケーラブル・ネスティングSEIメッセージ
17日前
華為技術有限公司
巡回シフトダイバーシティシーケンスを選択するための方法及び関連装置
17日前
華為技術有限公司
クロマサブブロックのアフィンベースのインター予測のための方法及び装置
17日前
華為技術有限公司
クロマ量子化パラメータのマッピング関数のシグナリングのための方法及び装置
12日前
個人
防犯AIプラグイン
23日前
個人
音声による制御装置
1か月前
個人
コメント配信システム
1か月前
個人
電気音響変換装置
1か月前
個人
テレビ会議拡張システム
18日前
株式会社SEtech
撮像装置
1か月前
キヤノン株式会社
撮像装置
1か月前
日本放送協会
無線通信装置
23日前
個人
無線中継赤外線コピーリモコン
20日前
キヤノン電子株式会社
画像処理装置
1か月前
キヤノン電子株式会社
画像処理装置
24日前
キヤノン電子株式会社
画像処理装置
1か月前
TOA株式会社
音響システム
19日前
キヤノン電子株式会社
画像読取装置
13日前
キヤノン株式会社
画像読取装置
1か月前
続きを見る