TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025120049
公報種別公開特許公報(A)
公開日2025-08-15
出願番号2024015266
出願日2024-02-02
発明の名称画像処理装置、画像処理方法及び画像処理プログラム
出願人NTT株式会社,国立大学法人電気通信大学
代理人弁理士法人酒井国際特許事務所
主分類G06T 7/00 20170101AFI20250807BHJP(計算;計数)
要約【課題】CNNの性能を向上させること。
【解決手段】画像処理装置10は、入力画像に対するCNNによる識別結果の損失である画像識別損失を算出する。また、画像処理装置10は、入力画像をシフトして得られた互いに異なる複数の画像のそれぞれに対するCNNによる識別結果のシフト不変性に基づくシフト不変損失を算出する。また、画像処理装置10は、画像識別損失とシフト不変損失が小さくなるように、CNNのパラメータを最適化する。
【選択図】図1
特許請求の範囲【請求項1】
第1の画像を基に、画像識別モデルによる識別結果の損失である第1の損失を算出する第1の損失算出部と、
前記第1の画像をシフトして得られた互いに異なる複数の画像のそれぞれに対する前記画像識別モデルによる識別結果のシフト不変性に基づく第2の損失を算出する第2の損失算出部と、
前記第1の損失と前記第2の損失が小さくなるように、前記画像識別モデルのパラメータを最適化する最適化部と、
を有することを特徴とする画像処理装置。
続きを表示(約 640 文字)【請求項2】
前記第1の損失算出部は、前記第1の画像、又は前記第1の画像をシフトして得られた画像に対する前記画像識別モデルによる識別結果の損失を前記第1の損失として算出する
ことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
画像処理装置によって実行される画像処理方法であって、
第1の画像を基に、画像識別モデルによる識別結果の損失である第1の損失を算出する第1の損失算出工程と、
前記第1の画像をシフトして得られた互いに異なる複数の画像のそれぞれに対する前記画像識別モデルによる識別結果のシフト不変性に基づく第2の損失を算出する第2の損失算出工程と、
前記第1の損失と前記第2の損失が小さくなるように、前記画像識別モデルのパラメータを最適化する最適化工程と、
を含むことを特徴とする画像処理方法。
【請求項4】
第1の画像を基に、画像識別モデルによる識別結果の損失である第1の損失を算出する第1の損失算出ステップと、
前記第1の画像をシフトして得られた互いに異なる複数の画像のそれぞれに対する前記画像識別モデルによる識別結果のシフト不変性に基づく第2の損失を算出する第2の損失算出ステップと、
前記第1の損失と前記第2の損失が小さくなるように、前記画像識別モデルのパラメータを最適化する最適化ステップと、
をコンピュータに実行させることを特徴とする画像処理プログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法及び画像処理プログラムに関する。
続きを表示(約 1,800 文字)【背景技術】
【0002】
従来、画像内の被写体の識別、検出、領域分割等を行うための機械学習の手法として、畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)が知られている。例えば、CNNは、業務における目視工程の自動化に寄与する。
【0003】
撮像された画像を処理することで業務の目視工程の自動化を推進していく場合、CNNの画像処理はもともと目視工程を行っている人間の直感に沿った処理であることが望ましい。例えば、CNNは、画像識別の際に識別対象の位置がシフトしても識別結果がなるべく変化しない性質(以下、シフト不変性)を持っていることが望ましいと考えられる。
【0004】
一方で、CNNにシフト不変性が欠如していることが指摘されている(例えば、非特許文献1を参照)。また、CNNのシフト不変性を評価する指標として、CADD(Correctness-Aware Distribution Distance)と呼ばれる指標が提案されている(例えば、非特許文献2を参照)。CADDは2つの異なるシフトを与えた画像に対して、CNNモデルを用いた画像識別を行い、それぞれの出力が互いにどの程度乖離しているかを測定することによって得られる。
【先行技術文献】
【非特許文献】
【0005】
R. Zhang, “Making Convolutional Networks Shift-Invariant Again”, 2019.
H. Higuchi, S. Suzuki, H. Shouno, “Measuring Shift-invariance of Convolutional Neural Network with a Probability-incorporated Metric”, 2022.
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、従来技術では、CNNの性能を十分に向上させることができない場合がある。例えば、従来技術では、CNNのシフト不変性の欠如という問題を解決することができない。
【課題を解決するための手段】
【0007】
上述した課題を解決し、目的を達成するために、画像処理装置は、第1の画像を基に、画像識別モデルによる識別結果の損失である第1の損失を算出する第1の損失算出部と、前記第1の画像をシフトして得られた互いに異なる複数の画像のそれぞれに対する前記画像識別モデルによる識別結果のシフト不変性に基づく第2の損失を算出する第2の損失算出部と、前記第1の損失と前記第2の損失が小さくなるように、前記画像識別モデルのパラメータを最適化する最適化部と、を有することを特徴とする。
【発明の効果】
【0008】
本発明によれば、CNNの性能を向上させることができる。
【図面の簡単な説明】
【0009】
図1は、第1の実施形態に係る画像処理装置の構成例を示す図である。
図2は、第1の実施形態に係る画像処理装置の処理の流れを示すフローチャートである。
図3は、シフト画像識別部の処理の流れを示すフローチャートである。
図4は、非シフト画像識別部の処理の流れを示すフローチャートである。
図5は、画像識別損失算出部の処理の流れを示すフローチャートである。
図6は、シフト不変損失算出部の処理の流れを示すフローチャートである。
図7は、最適化部の処理の流れを示すフローチャートである。
図8は、第2の実施形態に係る画像処理装置の構成例を示す図である。
図9は、第2の実施形態に係る画像処理装置の処理の流れを示すフローチャートである。
図10は、実験の結果を示す図である。
図11は、画像処理プログラムを実行するコンピュータの一例を示す図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る画像処理装置、画像処理方法及び画像処理プログラムの実施形態を図面に基づいて詳細に説明する。なお、本発明は、以下に説明する実施形態により限定されるものではない。
(【0011】以降は省略されています)

特許ウォッチbot のツイートを見る
この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

NTT株式会社
光デバイス
1か月前
NTT株式会社
圧力センサ
24日前
NTT株式会社
信号送信装置
1か月前
NTT株式会社
光信号処理装置
1か月前
NTT株式会社
復号装置及び復号方法
9日前
NTT株式会社
推定装置及び推定方法
17日前
NTT株式会社
解析装置および解析方法
23日前
NTT株式会社
情報処理装置、及び情報処理方法
3日前
NTT株式会社
情報処理装置、及び情報処理方法
3日前
NTT株式会社
通信システム、方法及びプログラム
9日前
NTT株式会社
通信システム、方法及びプログラム
9日前
NTT株式会社
検索装置、検索方法及びプログラム
1か月前
NTT株式会社
映像処理装置、方法及びプログラム
13日前
NTT株式会社
秘匿計算システム及び秘匿計算方法
1か月前
NTT株式会社
交通量推定装置及び交通量推定方法
17日前
NTT株式会社
秘匿計算システム及び秘匿計算方法
1か月前
NTT株式会社
光ファイバの群遅延時間測定システム
23日前
NTT株式会社
情報処理装置、方法およびプログラム
1か月前
NTT株式会社
電子署名システム、方法及びプログラム
9日前
NTT株式会社
データ解析装置、方法およびプログラム
1か月前
NTT株式会社
量子鍵配送システム及び量子鍵配送方法
4日前
NTT株式会社
座屈剥離構造の予測装置および予測方法
9日前
NTT株式会社
微生物の土壌中での生存性を調節する方法
4日前
NTT株式会社
測定装置、測定方法、及び、測定プログラム
5日前
NTT株式会社
推論装置、学習装置、推論方法、及びプログラム
23日前
NTT株式会社
推定装置、復元装置、推定方法、およびプログラム
2日前
NTT株式会社
情報処理システム、情報処理装置および情報処理方法
10日前
NTT株式会社
組合せ最適化方法、組合せ最適化装置、及びプログラム
13日前
NTT株式会社
通信品質予測装置、通信品質予測方法、及びプログラム
16日前
NTT株式会社
伝搬グラフ復元装置、伝搬グラフ復元方法、及びプログラム
9日前
NTT株式会社
生成装置、再生システム、生成方法、再生方法、およびプログラム
24日前
NTT株式会社
施工計画立案装置、施工計画立案方法、及び施工計画立案プログラム
17日前
NTT株式会社
制御装置、及びプログラム
1か月前
NTT株式会社
サーバ内データ転送装置、サーバ内データ転送方法およびプログラム
1か月前
NTT株式会社
アクセラレータ状態制御装置、アクセラレータ状態制御方法およびプログラム
23日前
NTT株式会社
脂質膜巨大ベシクル、脂質膜巨大ベシクルの製造方法、脂質膜巨大ベシクル内部に含まれる標的生体分子の検出方法、バイオセンサー
1か月前
続きを見る