TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024071773
公報種別公開特許公報(A)
公開日2024-05-24
出願番号2024060706,2020083122
出願日2024-04-04,2020-05-11
発明の名称画像コーディング装置、確率モデル生成装置及び画像デコーディング装置
出願人富士通株式会社
代理人個人,個人
主分類H04N 19/13 20140101AFI20240517BHJP(電気通信技術)
要約【課題】本発明は、画像コーディング装置、確率モデル生成装置及び画像デコーディング装置を提供する。
【解決手段】画像コーディング装置は、入力画像に対して特徴抽出を行い、N個のチャンネルの特徴マップを取得する第一特徴抽出ユニット;サイズがK回調整された入力画像に対して特徴抽出を行い、それぞれ、N個のチャンネルの特徴マップを取得する第二特徴抽出ユニット;及び、前記第一特徴抽出ユニットからのN個のチャンネルの特徴マップと、前記第二特徴抽出ユニットからのK×N個のチャンネルの特徴マップとを結合して出力する第一結合ユニットを含む。これにより、画像の特徴を正確に抽出し、競争力のもっとある潜在表現を得ることができる。
【選択図】図2
特許請求の範囲【請求項1】
画像をデコーディングする装置であって、
ハイパーデコーダの出力に対して特徴抽出を行い、マルチスケール補助情報を取得するマルチスケールダイレイテッド畳み込みユニット;
算術デコーダからの入力画像の潜在表現と、前記マルチスケールダイレイテッド畳み込みユニットからのマルチスケール補助情報とを結合する結合器;及び
前記結合器からの出力に対してデコーディングを行い、前記入力画像の再構成画像を取得するデコーダを含む、装置。
続きを表示(約 610 文字)【請求項2】
請求項1に記載の装置であって、
前記マルチスケールダイレイテッド畳み込みユニットは、3つの特徴抽出ユニットを含み、
前記3つの特徴抽出ユニットは、異なる拡張率のダイレイテッド畳み込みカーネル及び同じチャンネル数を用いて前記ハイパーデコーダの出力に対して特徴抽出を行い、前記マルチスケール補助情報を取得する。装置。
【請求項3】
確率モデルを生成する装置であって、
ハイパーデコーダの出力に対して特徴抽出を行い、マルチスケール補助情報を取得するマルチスケールダイレイテッド畳み込みユニット;
量子化器からの入力画像の潜在表現を入力とし、コンテンツに基づく予測を取得するコンテキストモデル処理ユニット;及び
前記コンテキストモデル処理ユニットの出力及び前記マルチスケールダイレイテッド畳み込みユニットの出力を処理し、予測の確率モデルを取得するエントロピーモデル処理ユニットを含む、装置。
【請求項4】
請求項3に記載の装置であって、
前記マルチスケールダイレイテッド畳み込みユニットは、3つの特徴抽出ユニットを含み、
前記3つの特徴抽出ユニットは、異なる拡張率のダイレイテッド畳み込みカーネル及び同じチャンネル数を用いて前記ハイパーデコーダの出力に対して特徴抽出を行い、前記マルチスケール補助情報を取得する、装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、画像圧縮及びディープラーニングの技術分野に関する。
続きを表示(約 2,300 文字)【背景技術】
【0002】
近年、ディープラーニングがコンピュータビジョン分野で主導な地位を成している。画像認識や超解像再生では、ディープラーニングが画像についての研究の重要な技術になっているが、その能力がこれらのタスクに限定されない。また、ディープラーニング技術は、画像圧縮分野でも応用され、ホットな研究テーマになっている。
【0003】
今のところ、ディープニューラルネットワークに基づく画像圧縮は、できるだけ少ないコードストリームを用いて高品質の画像を生成することを目的としているため、レート‐ディストーションのトレードオフの問題が生じてしまう。ビット率とディストーションとの間の良好なバランスを取るために、次のような2つの研究が行っており、即ち、(1)潜在表現のために最も近似したエントロピーモデルを見つけてビットストリームの長さを最適化し(ビット率を低くする);及び、(2)より有効な潜在表現を得て画像を正確に再構成する(ディストーションを減少させる)。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の実施例は、画像コーディング方法及び装置、確率モデル生成方法及び装置、画像デコーディング方法及び装置、並びに画像圧縮システムを提供し、ピラミッドサイズ調整ジュール(pyramidal resize module)及びインセプション(inception)コーダーネットワークを用いることで、画像の特徴を正確に抽出し、競争力のもっとある潜在表現を得ることができる。
【課題を解決するための手段】
【0005】
本発明の実施例の第一側面によれば、画像コーディング装置が提供され、前記装置は、
入力画像に対して特徴抽出を行い、N個のチャンネルの特徴マップを取得する第一特徴抽出ユニット;
サイズがK回調整された入力画像に対して特徴抽出を行い、それぞれ、N個のチャンネルの特徴マップを取得する第二特徴抽出ユニット;及び
前記第一特徴抽出ユニットからのN個のチャンネルの特徴マップと、前記第二特徴抽出ユニットからのK×N個のチャンネルの特徴マップとを結合して出力する第一結合ユニットを含む。
【0006】
本発明の実施例の第二側面によれば、確率モデル生成装置が提供され、前記装置は、
ハイパーデコーダの出力に対して特徴抽出を行い、マルチスケール補助情報を取得するマルチスケールダイレイテッド畳み込みユニット;
量子化器からの入力画像の潜在表現を入力とし、コンテンツに基づく予測を取得するコンテキストモデル処理ユニット;及び
前記コンテキストモデル処理ユニットの出力及び前記マルチスケールダイレイテッド畳み込みユニットの出力を処理し、予測の確率モデルを取得するエントロピーモデル処理ユニットを含む。
【0007】
本発明の実施例の第三側面によれば、画像デコーディング装置が提供され、前記画像デコーディング装置は、
ハイパーデコーダの出力に対して特徴抽出を行い、マルチスケール補助情報を取得するマルチスケールダイレイテッド畳み込みユニット;
算術デコーダからの入力画像の潜在表現と、前記マルチスケールダイレイテッド畳み込みユニットからのマルチスケール補助情報とを結合する結合器;及び
前記結合器からの出力に対してデコーディングを行い、前記入力画像の再構成画像を取得するデコーダを含む。
【0008】
本発明の実施例の第四側面によれば、画像コーディング方法が提供され、前記方法は、
複数のインセプションユニットを用いて、入力画像に対して特徴抽出を行い、N個のチャンネルの特徴マップの取得し;
複数の畳み込み層を用いて、それぞれ、サイズが調整された入力画像に対して特徴抽出を行い、それぞれ、N個のチャンネルの特徴マップを取得し;及び
前記インセプションユニットからのN個のチャンネルの特徴マップと、前記複数の畳み込み層からのそれぞれ対応するN個のチャンネルの特徴マップとを結合して出力することを含む。
【0009】
本発明の実施例の第五側面によれば、確率モデル生成方法が提供され、前記方法は、
マルチスケールダイレイテッド畳み込みユニットを用いて、前記ハイパーデコーダの出力に対して特徴抽出を行い、マルチスケール補助情報を取得し;
コンテキストモデルを用いて、量子化器からの入力画像の潜在表現を入力とし、コンテンツに基づく予測を取得し;及び
エントロピーモデルを用いて、前記コンテキストモデルの出力及び前記マルチスケールダイレイテッド畳み込みユニットの出力を処理し、予測の確率モデルを取得することを含む。
【0010】
本発明の実施例の第六側面によれば、画像デコーディング方法が提供され、前記方法は、
マルチスケールダイレイテッド畳み込みユニットを用いて、ハイパーデコーダの出力に対して特徴抽出を行い、マルチスケール補助情報を取得し;
結合器を用いて、算術デコーダからの入力画像の潜在表現及び前記マルチスケールダイレイテッド畳み込みユニットからのマルチスケール補助情報に対して結合を行い;及び
デコーダを用いて、前記結合器からの出力に対してデコーディングを行い、前記入力画像の再構成画像を取得することを含む。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
評価装置及び評価方法
9日前
富士通株式会社
半導体装置及び実装方法
2日前
富士通株式会社
介入方法及び介入プログラム
10日前
富士通株式会社
ヘテロ積層デバイスの製造方法
4日前
富士通株式会社
セキュリティポリシーの判定及び適用
12日前
富士通株式会社
分散学習プログラム、方法、及び装置
4日前
富士通株式会社
推定プログラム、推定方法および推定装置
9日前
富士通株式会社
オブジェクトの計数装置、方法及び電子機器
9日前
富士通株式会社
評価プログラム,評価方法および情報処理装置
12日前
富士通株式会社
推定プログラム、機械学習方法、及び推定装置
10日前
富士通株式会社
情報処理装置、情報処理方法およびプログラム
6日前
富士通株式会社
半導体装置、半導体装置の製造方法及び電子装置
6日前
富士通株式会社
修正プログラム、修正方法、および情報処理装置
9日前
富士通株式会社
生成プログラム、生成方法、および情報処理装置
9日前
富士通株式会社
窒化物半導体装置及び窒化物半導体装置の製造方法
9日前
富士通株式会社
検索処理プログラム、検索処理方法及び検索処理装置
3日前
富士通株式会社
通信制御プログラム、通信制御方法および通信制御装置
3日前
富士通株式会社
情報表示プログラム、情報表示方法および情報表示装置
11日前
富士通株式会社
通信制御装置、無線システム及び無線リソース割当方法
13日前
富士通株式会社
文字認識プログラム、文字認識方法および文字認識装置
2日前
富士通株式会社
強化学習プログラム、情報処理装置および強化学習方法
2日前
富士通株式会社
品質評価プログラム、品質評価方法および品質評価装置
9日前
富士通株式会社
対象物判定プログラム、情報処理装置及び対象物判定方法
5日前
富士通株式会社
データ処理プログラム,データ処理方法および情報処理装置
2日前
富士通株式会社
内容を分析するための方法と装置及びコンピュータプログラム
12日前
富士通株式会社
制御装置、基地局装置、中継局装置及びハンドオーバ制御方法
12日前
富士通株式会社
量子化学計算プログラム、量子化学計算方法、および情報処理装置
5日前
富士通株式会社
記憶領域制御プログラム、記憶領域制御装置、及び記憶領域制御方法
2日前
富士通株式会社
ソフトウェア管理プログラム、情報処理装置、及び、ソフトウェア管理方法
6日前
富士通株式会社
モデル訓練方法、セマンティックセグメンテーション方法及びモデル訓練方法
5日前
富士通株式会社
ストリーミング品質推定プログラム、ストリーミング品質推定方法およびストリーミング品質推定装置
5日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
11日前
富士通株式会社
アニーラー・ベースの解法のためのランダムウォーク・ベースの車両ルーティング問題(VRP)の分割
16日前
個人
多重無線通信方法
2か月前
個人
デジタル放送受信装置
1か月前
ブラザー工業株式会社
複合機
1か月前
続きを見る