TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025120049
公報種別公開特許公報(A)
公開日2025-08-15
出願番号2024015266
出願日2024-02-02
発明の名称画像処理装置、画像処理方法及び画像処理プログラム
出願人NTT株式会社,国立大学法人電気通信大学
代理人弁理士法人酒井国際特許事務所
主分類G06T 7/00 20170101AFI20250807BHJP(計算;計数)
要約【課題】CNNの性能を向上させること。
【解決手段】画像処理装置10は、入力画像に対するCNNによる識別結果の損失である画像識別損失を算出する。また、画像処理装置10は、入力画像をシフトして得られた互いに異なる複数の画像のそれぞれに対するCNNによる識別結果のシフト不変性に基づくシフト不変損失を算出する。また、画像処理装置10は、画像識別損失とシフト不変損失が小さくなるように、CNNのパラメータを最適化する。
【選択図】図1
特許請求の範囲【請求項1】
第1の画像を基に、画像識別モデルによる識別結果の損失である第1の損失を算出する第1の損失算出部と、
前記第1の画像をシフトして得られた互いに異なる複数の画像のそれぞれに対する前記画像識別モデルによる識別結果のシフト不変性に基づく第2の損失を算出する第2の損失算出部と、
前記第1の損失と前記第2の損失が小さくなるように、前記画像識別モデルのパラメータを最適化する最適化部と、
を有することを特徴とする画像処理装置。
続きを表示(約 640 文字)【請求項2】
前記第1の損失算出部は、前記第1の画像、又は前記第1の画像をシフトして得られた画像に対する前記画像識別モデルによる識別結果の損失を前記第1の損失として算出する
ことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
画像処理装置によって実行される画像処理方法であって、
第1の画像を基に、画像識別モデルによる識別結果の損失である第1の損失を算出する第1の損失算出工程と、
前記第1の画像をシフトして得られた互いに異なる複数の画像のそれぞれに対する前記画像識別モデルによる識別結果のシフト不変性に基づく第2の損失を算出する第2の損失算出工程と、
前記第1の損失と前記第2の損失が小さくなるように、前記画像識別モデルのパラメータを最適化する最適化工程と、
を含むことを特徴とする画像処理方法。
【請求項4】
第1の画像を基に、画像識別モデルによる識別結果の損失である第1の損失を算出する第1の損失算出ステップと、
前記第1の画像をシフトして得られた互いに異なる複数の画像のそれぞれに対する前記画像識別モデルによる識別結果のシフト不変性に基づく第2の損失を算出する第2の損失算出ステップと、
前記第1の損失と前記第2の損失が小さくなるように、前記画像識別モデルのパラメータを最適化する最適化ステップと、
をコンピュータに実行させることを特徴とする画像処理プログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、画像処理装置、画像処理方法及び画像処理プログラムに関する。
続きを表示(約 1,800 文字)【背景技術】
【0002】
従来、画像内の被写体の識別、検出、領域分割等を行うための機械学習の手法として、畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)が知られている。例えば、CNNは、業務における目視工程の自動化に寄与する。
【0003】
撮像された画像を処理することで業務の目視工程の自動化を推進していく場合、CNNの画像処理はもともと目視工程を行っている人間の直感に沿った処理であることが望ましい。例えば、CNNは、画像識別の際に識別対象の位置がシフトしても識別結果がなるべく変化しない性質(以下、シフト不変性)を持っていることが望ましいと考えられる。
【0004】
一方で、CNNにシフト不変性が欠如していることが指摘されている(例えば、非特許文献1を参照)。また、CNNのシフト不変性を評価する指標として、CADD(Correctness-Aware Distribution Distance)と呼ばれる指標が提案されている(例えば、非特許文献2を参照)。CADDは2つの異なるシフトを与えた画像に対して、CNNモデルを用いた画像識別を行い、それぞれの出力が互いにどの程度乖離しているかを測定することによって得られる。
【先行技術文献】
【非特許文献】
【0005】
R. Zhang, “Making Convolutional Networks Shift-Invariant Again”, 2019.
H. Higuchi, S. Suzuki, H. Shouno, “Measuring Shift-invariance of Convolutional Neural Network with a Probability-incorporated Metric”, 2022.
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、従来技術では、CNNの性能を十分に向上させることができない場合がある。例えば、従来技術では、CNNのシフト不変性の欠如という問題を解決することができない。
【課題を解決するための手段】
【0007】
上述した課題を解決し、目的を達成するために、画像処理装置は、第1の画像を基に、画像識別モデルによる識別結果の損失である第1の損失を算出する第1の損失算出部と、前記第1の画像をシフトして得られた互いに異なる複数の画像のそれぞれに対する前記画像識別モデルによる識別結果のシフト不変性に基づく第2の損失を算出する第2の損失算出部と、前記第1の損失と前記第2の損失が小さくなるように、前記画像識別モデルのパラメータを最適化する最適化部と、を有することを特徴とする。
【発明の効果】
【0008】
本発明によれば、CNNの性能を向上させることができる。
【図面の簡単な説明】
【0009】
図1は、第1の実施形態に係る画像処理装置の構成例を示す図である。
図2は、第1の実施形態に係る画像処理装置の処理の流れを示すフローチャートである。
図3は、シフト画像識別部の処理の流れを示すフローチャートである。
図4は、非シフト画像識別部の処理の流れを示すフローチャートである。
図5は、画像識別損失算出部の処理の流れを示すフローチャートである。
図6は、シフト不変損失算出部の処理の流れを示すフローチャートである。
図7は、最適化部の処理の流れを示すフローチャートである。
図8は、第2の実施形態に係る画像処理装置の構成例を示す図である。
図9は、第2の実施形態に係る画像処理装置の処理の流れを示すフローチャートである。
図10は、実験の結果を示す図である。
図11は、画像処理プログラムを実行するコンピュータの一例を示す図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る画像処理装置、画像処理方法及び画像処理プログラムの実施形態を図面に基づいて詳細に説明する。なお、本発明は、以下に説明する実施形態により限定されるものではない。
(【0011】以降は省略されています)

特許ウォッチbot のツイートを見る
この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

NTT株式会社
光デバイス
4日前
NTT株式会社
信号送信装置
5日前
NTT株式会社
光信号処理装置
6日前
NTT株式会社
試験装置および試験方法
1か月前
NTT株式会社
分類装置、および分類方法
1か月前
NTT株式会社
量子計算装置、及び制御装置
1か月前
NTT株式会社
通信システム、及び通信方法
13日前
NTT株式会社
音声抽出装置及び音声抽出方法
18日前
NTT株式会社
光増幅器及び光増幅器監視方法
1か月前
NTT株式会社
足場を構築する施工方法及び治具
2か月前
NTT株式会社
無線通信方法及び無線通信システム
27日前
NTT株式会社
秘匿計算システム及び秘匿計算方法
4日前
NTT株式会社
秘匿計算システム及び秘匿計算方法
4日前
NTT株式会社
検索装置、検索方法及びプログラム
4日前
NTT株式会社
推論装置、推論方法、及びプログラム
1か月前
NTT株式会社
イオン伝送装置、及びイオン伝送方法
6日前
NTT株式会社
情報処理装置、方法およびプログラム
4日前
NTT株式会社
データ解析装置、方法およびプログラム
4日前
NTT株式会社
単一光子生成装置、及び単一光子生成方法
17日前
NTT株式会社
生成システム、生成装置、および生成方法
21日前
NTT株式会社
周期検出装置、周期検出方法及びプログラム
17日前
NTT株式会社
情報処理装置、情報処理方法及びプログラム
21日前
NTT株式会社
情報処理装置、情報処理方法及びプログラム
28日前
NTT株式会社
置局設計装置、置局設計方法及びプログラム
1か月前
NTT株式会社
配送計画装置、配送計画方法、及びプログラム
1か月前
NTT株式会社
量子計算装置、量子計算方法、及びプログラム
1か月前
NTT株式会社
移動ロボット、移動量推定方法、及びプログラム
1か月前
NTT株式会社
通信制御システム、通信制御方法及びプログラム
1か月前
NTT株式会社
画像処理装置、画像処理方法及び画像処理プログラム
1か月前
NTT株式会社
修辞構造解析装置、修辞構造解析方法及びプログラム
26日前
NTT株式会社
情報処理装置、情報処理方法および情報処理プログラム
26日前
富士通株式会社
データ転送制御装置および情報処理装置
1か月前
NTT株式会社
簡易な方法で光ファイバをセンサ化するシステム及び方法
1か月前
富士通株式会社
データ転送制御装置および情報処理装置
1か月前
NTT株式会社
電気刺激装置、電気刺激システム、電気刺激方法及びプログラム
28日前
NTT株式会社
伝送システム、送信装置、受信装置、伝送方法およびプログラム
1か月前
続きを見る