TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025099497
公報種別公開特許公報(A)
公開日2025-07-03
出願番号2023216193
出願日2023-12-21
発明の名称情報処理装置、情報処理方法及びプログラム
出願人キヤノン株式会社
代理人弁理士法人大塚国際特許事務所
主分類G06N 3/09 20230101AFI20250626BHJP(計算;計数)
要約【課題】 データ処理を目的とするNNにおいて、処理対象のデータが持つビット深度よりも小さいビット深度で量子化しても最終的なデータの劣化を抑制する。
【解決手段】情報処理装置は、ニューラルネットワークによって対象データを処理する情報処理装置であって、前記対象データを取得する入力データ取得手段と、教師データを取得する教師データ取得手段と、前記ニューラルネットワークに前記対象データを入力して処理することで得られた出力データと前記教師データとの誤差が小さくなるように学習して、前記ニューラルネットワークのパラメタを更新する学習手段と、を備え、前記教師データ取得手段は、前記教師データのビット深度が前記対象データの第1ビット深度よりも小さい第2ビット深度である場合、前記対象データの特性に合わせた分解能で前記教師データの値を変換する深度変換処理がされた前記教師データを取得する。
【選択図】 図2
特許請求の範囲【請求項1】
ニューラルネットワークによって対象データを処理する情報処理装置であって、
前記対象データを取得する入力データ取得手段と、
教師データを取得する教師データ取得手段と、
前記ニューラルネットワークに前記対象データを入力して処理することで得られた出力データと前記教師データとの誤差が小さくなるように学習して、前記ニューラルネットワークのパラメタを更新する学習手段と、
を備え、
前記教師データ取得手段は、前記教師データのビット深度が前記対象データの第1ビット深度よりも小さい第2ビット深度である場合、前記対象データの特性に合わせた分解能で前記教師データの値を変換する深度変換処理がされた前記教師データを取得する
ことを特徴とする情報処理装置。
続きを表示(約 960 文字)【請求項2】
前記学習手段でパラメタが更新された前記ニューラルネットワークを量子化する量子化手段を備えることを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記ニューラルネットワークの量子化パラメタを取得する量子化パラメタ取得手段を備え、
前記量子化手段は、前記量子化パラメタに基づいて前記ニューラルネットワークを量子化する
ことを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記学習手段は、前記量子化されたニューラルネットワークのパラメタを更新する
ことを特徴とする請求項2に記載の情報処理装置。
【請求項5】
前記ニューラルネットワークが推論した対象データのビット深度を前記第2ビット深度から前記第1ビット深度へと変換する場合、前記深度変換処理とは逆の手順で前記対象データの値を変換する深度変換手段と、
前記第1ビット深度の前記対象データの値を分解能に応じて変更するデータ変更手段と、
を備えることを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記深度変換処理において、前記データ変更手段の用いる分解能に対応する分解能に基づいて、前記対象データの値を変更する
ことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記教師データ取得手段は、前記対象データの値の特性に合わせた分解能を反映したルックアップテーブルによって前記対象データの値を変更する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項8】
前記教師データ取得手段は、前記対象データの値の分解能に応じた数式によって前記教師データの値を変更する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項9】
前記量子化手段は、前記第2ビット深度に前記ニューラルネットワークを量子化する
ことを特徴とする請求項2に記載の情報処理装置。
【請求項10】
前記対象データ及び前記教師データは、画像データである
ことを特徴とする請求項1に記載の情報処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及びプログラムに関するものである。
続きを表示(約 2,700 文字)【背景技術】
【0002】
近年画像の画質を向上させる画像処理技術などのデータ処理において、ニューラルネットワーク(Neural Network、以下NN)を用いた手法が盛んに開発されている。例えばノイズ除去、ブラー除去、超解像などの高画質化画像処理を、NNを用いて実現する技術が存在する(非特許文献1)。
【0003】
昨今のNNはレイヤ数が多く計算量が大きいため、学習時には高速な計算機が用いられる。しかし、学習後の推論におけるデータ処理では、計算資源が限られている場合も多く、より効率のよい演算方法が求められる。
【0004】
効率のよい推論時の演算方法として、NNの重み及び特徴量を低精度の数値に量子化して演算する方法が知られている(非特許文献2)。量子化することで、組み込み機器のような計算リソースの乏しい機器でも動作させることができる。また、汎用の計算機であっても、NNの重みなどを量子化することでSIMD(Single Instruction Multiple Data)命令のような高スループットの演算命令を利用できる場合があり、高速化が見込める。
【先行技術文献】
【非特許文献】
【0005】
RESTORMER: EFFICIENT TRANSFORMER for High―Resolution Image Restoration, Inception Institute of AI, Nov, 18, 2021,[令和5年12月13日検索]、インターネット<URL:https://openaccess.thecvf.com/content/CVPR2022/papers/Zamir_Restormer_Efficient_Transformer_for_High-Resolution_Image_Restoration_CVPR_2022_paper.pdf>
8-bit Inference with TensorRT Szymon Migacz, NVIDIA,May 8, 2017,[令和5年12月13日検索]、インターネット<URL:https://on-demand.gputechconf.com/gtc/2017/presentation/s7310-8-bit-inference-with-tensorrt.pdf>
Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification, Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun; Proceedings of the IEEE International Conference on Computer Vision (ICCV), 2015, pp. 1026-1034.[令和5年12月13日検索]、インターネット<URL:https://arxiv.org/pdf/1502.01852.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、NNの重み及び特徴量などを低精度の数値に量子化することで、NNが出力する画像の解像度などのデータの精度は一般的に低下する。特に本来のデータが持つビット深度よりも小さいビット深度で重みなどを量子化する場合、出力する画像の階調などのデータの精度が粗くなり、その劣化は顕著に表れる。例えば高画質化画像処理を目的とするNNで言えば、対象であるNNへの入力画像が12bit~14bitのRAW画像の場合、NNの重み及び特徴量などを8bitに量子化すると、NNが出力する高画質化画像も8bitで出力されるので、本来の画像の階調を表現できない。RAW画像は最終的には現像処理によって8bitのJPEG画像などに変換するが、元画像であるRAW画像の階調が粗くなってしまっているため、変換される8bitのJPEG画像も結果的に階調が粗くなり、画質が劣化した画像を出力してしまう。
【0007】
本発明は、高画質化画像処理などのデータ処理を目的とするNNにおいて、処理対象のデータが持つビット深度よりも小さいビット深度で量子化しても最終的なデータの劣化を抑制することを目的とする。
【課題を解決するための手段】
【0008】
この課題を解決するため、例えば本発明の情報処理装置は以下の構成を備える。すなわち、
ニューラルネットワークによって対象データを処理する情報処理装置であって、
前記対象データを取得する入力データ取得手段と、
教師データを取得する教師データ取得手段と、
前記ニューラルネットワークに前記対象データを入力して処理することで得られた出力データと前記教師データとの誤差が小さくなるように学習して、前記ニューラルネットワークのパラメタを更新する学習手段と、
を備え、
前記教師データ取得手段は、前記教師データのビット深度が前記対象データの第1ビット深度よりも小さい第2ビット深度である場合、前記対象データの特性に合わせた分解能で前記教師データの値を変換する深度変換処理がされた前記教師データを取得する
ことを特徴とする。
【発明の効果】
【0009】
本発明によれば、高画質化画像処理などのデータ処理を目的とするNNにおいて、処理対象のデータが持つビット深度よりも小さいビット深度で量子化しても最終的なデータの劣化を抑制できる。
【図面の簡単な説明】
【0010】
第1実施形態の情報処理装置のハードウェア構成を例示するブロック図。
第1実施形態の情報処理装置の機能構成を例示する機能ブロック図。
第1実施形態のビット深度変換及び階調変換に用いられるルックアップテーブルとトーンカーブの一例。
第1実施形態のNNのモデルの一例。
第1実施形態のNNの学習処理の例を表すフローチャート。
第1実施形態のNNの推論および現像処理の例を表すフローチャート。
第2実施形態のビット深度変換及び階調変換に用いられる数式とトーンカーブの一例。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
対話装置
25日前
個人
政治のAI化
1か月前
個人
情報処理装置
25日前
個人
記入設定プラグイン
13日前
個人
情報処理装置
21日前
個人
プラグインホームページ
1か月前
個人
情報入力装置
25日前
個人
不動産売買システム
5日前
個人
物価スライド機能付生命保険
25日前
個人
マイホーム非電子入札システム
25日前
株式会社BONNOU
管理装置
18日前
キヤノン株式会社
画像処理装置
1か月前
株式会社東芝
電子機器
6日前
シャープ株式会社
電子機器
1か月前
大同特殊鋼株式会社
輝線検出方法
1か月前
株式会社ワコム
電子消去具
5日前
サクサ株式会社
カードの制動構造
27日前
ホシデン株式会社
タッチ入力装置
5日前
個人
決済手数料0%のクレジットカード
28日前
株式会社アジラ
データ転送システム
1か月前
村田機械株式会社
割当補助システム
1か月前
ミサワホーム株式会社
宅配ロッカー
1か月前
株式会社ライト
情報処理装置
18日前
トヨタ自動車株式会社
情報処理装置
1か月前
トヨタ自動車株式会社
欠け検査装置
1か月前
パテントフレア株式会社
交差型バーコード
1か月前
個人
パターン抽出方法及び通信多重化方法
4日前
住友重機械工業株式会社
力覚伝達装置
20日前
大王製紙株式会社
RFIDタグ
4日前
株式会社CBE-A
情報処理システム
4日前
応研株式会社
業務支援システム
1か月前
Sansan株式会社
組織図生成装置
1か月前
トヨタ自動車株式会社
管理装置
1か月前
シャープ株式会社
通信装置
25日前
ミサワホーム株式会社
荷物搬送システム
1か月前
シャープ株式会社
通信装置
1か月前
続きを見る