TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025179847
公報種別
公開特許公報(A)
公開日
2025-12-10
出願番号
2025151880,2024520083
出願日
2025-09-12,2021-11-11
発明の名称
条件付き画像圧縮
出願人
華為技術有限公司
,
HUAWEI TECHNOLOGIES CO.,LTD.
代理人
弁理士法人ITOH
主分類
H04N
19/91 20140101AFI20251203BHJP(電気通信技術)
要約
【課題】本開示は、画像の成分の条件付きコーディングに関する。
【解決手段】画像の少なくとも一部をエンコードする方法であって、少なくとも1つの二次成分とは独立に画像の一次成分をエンコードする段階と、一次成分からの情報を使用して画像の前記少なくとも1つの二次成分をエンコードする段階とを含む方法が提供される。さらに、画像の少なくとも一部をエンコードする方法であって、画像の一次成分についての一次残差成分と、一次成分とは異なる画像の少なくとも1つの二次成分についての少なくとも1つの二次残差成分とを含む残差を提供する段階と、前記少なくとも1つの二次残差成分とは独立に一次残差成分をエンコードする段階と、一次残差成分からの情報を使用して前記少なくとも1つの二次残差成分をエンコードする段階とを含む方法が提供される。
【選択図】図14
特許請求の範囲
【請求項1】
画像の少なくとも一部を再構成する方法であって:
第1のエントロピー・モデルに基づいて第1のビットストリームを処理して第1の潜在テンソルを得る段階(S232)と;
前記第1の潜在テンソルを処理して前記画像の一次成分を表す第1のテンソルを得る段階(S234)と;
前記第1のエントロピー・モデルとは異なる第2のエントロピー・モデルに基づいて前記第1のビットストリームとは異なる第2のビットストリームを処理して、前記第1の潜在テンソルとは異なる第2の潜在テンソルを得る段階(S236)と;
前記第1の潜在テンソルからの情報を使用して、前記第2の潜在テンソルを処理して、前記画像の少なくとも1つの二次成分を表す第2のテンソルを得る段階(S238)とを含む、
方法。
続きを表示(約 1,600 文字)
【請求項2】
前記第1の潜在テンソルは、前記第2の潜在テンソルの処理とは独立して処理される、請求項1に記載の方法。
【請求項3】
前記画像の前記一次成分はルーマ成分であり、前記画像の前記少なくとも1つの二次成分はクロマ成分である、請求項1または2に記載の方法。
【請求項4】
前記画像の前記一次成分はクロマ成分であり、前記画像の前記少なくとも1つの二次成分はルーマ成分である、請求項1または2に記載の方法。
【請求項5】
前記第2のテンソルは、2つの二次成分を表し、その一方はクロマ成分であり、他方は別のクロマ成分である、請求項3に記載の方法。
【請求項6】
前記第1の潜在テンソルの処理(S234)は、前記第1の潜在テンソルを前記第1のテンソルに変換することを含み;
前記第2の潜在テンソルの処理(S238)は、前記第2の潜在テンソルと前記第1の潜在テンソルとを連結して連結テンソルを得て、前記連結テンソルを前記第2のテンソルに変換することを含む、
請求項1ないし4のうちいずれか一項に記載の方法。
【請求項7】
前記第1および第2の潜在テンソルのそれぞれは、高さおよび幅次元を有し、
前記第1の潜在テンソルの処理(S234)は、前記第1の潜在テンソルを前記第1のテンソルに変換することを含み;
前記第2の潜在テンソルの処理(S238)は、高さおよび幅次元のうちの少なくとも1つにおける前記第2の潜在テンソルのサンプルのサイズまたはサブピクセル・オフセットが、前記第1の潜在テンソルの高さおよび幅次元のうちの少なくとも1つにおけるサンプルのサイズまたはサブピクセル・オフセットと異なるかどうかを判定し、前記第2の潜在テンソルのサンプルのサイズまたはサブピクセル・オフセットが前記第1の潜在テンソルのサンプルのサイズまたはサブピクセル・オフセットと異なると判定されたとき、前記第1の潜在テンソルのサンプル位置を、前記第2の潜在テンソルのサンプル位置に一致するように調整し、それにより、調整された第1の潜在テンソルを得て;
前記第2の潜在テンソルのサンプルのサイズまたはサブピクセル・オフセットが前記第1の潜在テンソルのサンプルのサイズまたはサブピクセル・オフセットと異なると判定された場合にのみ、前記第2の潜在テンソルおよび前記調整された第1の潜在テンソルとを連結して連結潜在テンソルを得て、そうでない場合には、前記第2の潜在テンソルおよび前記第1の潜在テンソルを連結して、連結潜在テンソルを得て;
前記連結潜在テンソルを前記第2のテンソルに変換することを含む、
請求項1ないし5のうちいずれか一項に記載の方法。
【請求項8】
前記第1のビットストリームは第1のニューラルネットワークによって処理され、前記第2のビットストリームは前記第1のニューラルネットワークとは異なる第2のニューラルネットワークによって処理される、請求項1ないし6のうちいずれか一項に記載の方法。
【請求項9】
前記第1の潜在テンソルは、前記第1および第2のネットワークとは異なる第3のニューラルネットワークによって変換され、前記連結潜在テンソルは、前記第1、第2、および第3のネットワークとは異なる第4のニューラルネットワークによって変換される、請求項6および7に記載の方法。
【請求項10】
前記第1の潜在テンソルはチャネル次元を含み、前記第2の潜在テンソルはチャネル次元を含み、チャネル次元における前記第1の潜在テンソルのサイズは、チャネル次元における前記第2の潜在テンソルのサイズに比べ大きい、小さい、および等しいのうちの1つである、請求項1ないし9のうちいずれか一項に記載の方法。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本開示は、概括的には、画像およびビデオ・コーディング〔ビデオ符号化〕の分野に関し、詳細には、条件付き画像圧縮を備える画像およびビデオ・コーディングに関する。
続きを表示(約 1,600 文字)
【背景技術】
【0002】
ビデオ・コーディング(ビデオ・エンコードおよびデコード)は、デジタル・ビデオ・アプリケーションの広い範囲、たとえば、放送デジタルTV、インターネットおよびモバイル・ネットワークを通じたビデオ送信、ビデオチャット、テレビ会議のようなリアルタイム会話アプリケーション、DVDおよびブルーレイディスク、ビデオコンテンツ取得および編集システム、およびセキュリティアプリケーションのカムコーダにおいて使用される。
【0003】
比較的短いビデオであっても、描写するために必要なビデオ・データの量は相当なものになる可能性があり、そのことは、データがストリーミングされる、または他の仕方で、帯域幅容量が限られている通信ネットワークを通じて通信されるときに、困難が生じる可能性がある。よって、ビデオ・データは一般に、現代の遠隔通信ネットワークを通じて通信される前に圧縮される。メモリ資源が限られている可能性があるため、ビデオが記憶デバイスに記憶されるときにも、ビデオのサイズが問題になる可能性がある。ビデオ圧縮デバイスは、しばしば、ソースにおいてソフトウェアおよび/またはハードウェアを使用して、伝送または記憶の前にビデオ・データをコーディングし、それによってデジタル・ビデオ画像を表すために必要とされるデータの量を削減する。その後、圧縮されたデータは、宛先で、ビデオ・データをデコードするビデオ圧縮解除デバイスによって受領される。圧縮技法は、静止画像コーディングのコンテキストでも好適に適用される。
【0004】
ネットワーク資源が限られ、より高いビデオ品質の要求がますます高まっているため、画像品質をほとんどまたは全く犠牲にせずに圧縮率を改善する、改善された圧縮および圧縮解除技術が望ましい。
【0005】
現在、人工ニューラルネットワークを利用したニューラルネットワーク(neural network、NN)および深層学習(deep learning、DL)技術が、ビデオ、画像(たとえば静止画像)などのエンコードおよびデコードの技術分野でも、しばらく前から使用されている。
【0006】
利用可能なメモリおよび/または処理速度の制限を考慮に入れる、トレーニングされたネットワークに基づいてそのような画像コーディング(ビデオ・コーディングまたは静止画像コーディング)の効率をさらに改善することが望ましい。
【0007】
特に、従来の条件付き画像圧縮符号化は、貧弱な並列化適合性および困難なメモリ要求に悩まされる。
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明は、特に、ニューラルネットワーク、たとえば、以下の詳細な説明に記載されるニューラルネットワークによって、画像またはビデオ・データをコーディングするための方法および装置に関する。ニューラルネットワークの使用は、自己学習方式での信頼できるエンコードおよびデコードならびにエントロピー・モデルの推定を許容し、エンコードされた圧縮入力データから再構成される画像の高い精度をもたらしうる。
【課題を解決するための手段】
【0009】
上記および他の目的は、独立請求項の主題によって達成される。さらなる実装は、従属請求項、明細書、および図面から明白である。
【0010】
第1の側面によれば、画像の少なくとも一部(たとえば、一つまたは複数のブロック、スライス、タイル等)をエンコードする方法であって、(画像の少なくとも前記一部について)画像の(画像の成分から選択された)少なくとも1つの二次(非一次)成分から独立して画像の(画像の成分から選択された)一次成分をエンコードし、一次成分からの情報を使用して画像の前記少なくとも1つの二次成分をエンコードすることを含む方法が提供される。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
華為技術有限公司
条件付き画像圧縮
1日前
華為技術有限公司
遅延推定方法および遅延推定装置
8日前
華為技術有限公司
電力増幅回路、電力増幅器、及び送信器
2日前
華為技術有限公司
エンコーダ、デコーダ、および、対応する方法
15日前
華為技術有限公司
センシング・セッション確立方法および通信装置
23日前
華為技術有限公司
協調マルチアクセスポイントAP伝送のための方法および関連装置
6日前
華為技術有限公司
多重リンクに適用可能な個別アドレス指定トラフィックインジケーション方法および関連装置
2日前
華為技術有限公司
ハイブリッド自動再送要求確認HARQ-ACKコードブックを決定するための方法および装置
15日前
個人
イヤーピース
1か月前
個人
イヤーマフ
1か月前
個人
監視カメラシステム
1か月前
キーコム株式会社
光伝送線路
1か月前
個人
スイッチシステム
1か月前
個人
スキャン式車載用撮像装置
1か月前
サクサ株式会社
中継装置
2か月前
サクサ株式会社
中継装置
2か月前
キヤノン株式会社
撮像装置
13日前
キヤノン株式会社
撮像装置
6日前
キヤノン株式会社
撮像装置
6日前
キヤノン株式会社
撮像装置
6日前
株式会社リコー
画像形成装置
1か月前
サクサ株式会社
無線システム
2か月前
キヤノン電子株式会社
画像読取装置
1か月前
サクサ株式会社
無線通信装置
2か月前
キヤノン電子株式会社
画像読取装置
1か月前
サクサ株式会社
無線通信装置
2か月前
ヤマハ株式会社
放音制御装置
1か月前
個人
ワイヤレスイヤホン対応耳掛け
2か月前
個人
映像表示装置、及びARグラス
1か月前
キヤノン電子株式会社
画像読取装置
1か月前
キヤノン株式会社
画像処理装置
1か月前
キヤノン電子株式会社
シート搬送装置
1か月前
日本電気株式会社
海底分岐装置
1か月前
個人
発信機及び発信方法
2か月前
キヤノン株式会社
情報処理装置
21日前
株式会社NTTドコモ
端末
1か月前
続きを見る
他の特許を見る