TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025087494
公報種別公開特許公報(A)
公開日2025-06-10
出願番号2023202193
出願日2023-11-29
発明の名称画像処理装置、画像処理方法
出願人キヤノン株式会社
代理人弁理士法人大塚国際特許事務所
主分類G06N 20/00 20190101AFI20250603BHJP(計算;計数)
要約【課題】学習画像の処理負荷を増やすことなく、特定の評価値を向上させることが可能な画像処理装置及び画像処理方法を提供する。
【解決手段】方法は、学習画像群を分類することで得られる複数のグループのうち、入力画像に係る複数の評価値のうち規定条件を満たす評価値に応じたグループを特定し、該特定したグループについて、より強い強度でデータ拡張を行う。
【選択図】図2
特許請求の範囲【請求項1】
学習画像群を分類することで得られる複数のグループのうち、入力画像に係る複数の評価値のうち規定条件を満たす評価値に応じたグループを特定する特定手段と、
前記特定手段が特定したグループについて、より強い強度でデータ拡張を行う拡張手段と
を備えることを特徴とする画像処理装置。
続きを表示(約 1,000 文字)【請求項2】
前記特定手段は、前記複数のグループのうち、前記入力画像におけるそれぞれの領域について算出した評価値のうち閾値未満の評価値を算出した領域の特徴に対応するグループを特定することを特徴とする請求項1に記載の画像処理装置。
【請求項3】
さらに、
前記学習画像群の一部を用いてモデルの学習を行う学習手段を備え、
前記特定手段は、前記複数のグループのうち、前記入力画像におけるそれぞれの領域について前記モデルが算出した評価値のうち閾値未満の評価値を算出した領域の特徴に対応するグループを特定することを特徴とする請求項2に記載の画像処理装置。
【請求項4】
さらに、
閾値未満の評価値を算出した領域の数が規定個数を下回らない場合には、閾値未満の評価値を算出した領域の特徴を有する学習画像の追加をユーザに要求する要求手段を備えることを特徴とする請求項2に記載の画像処理装置。
【請求項5】
前記特定手段は、前記複数のグループのうち、分類の正解率が閾値未満の入力画像のグループを特定することを特徴とする請求項1に記載の画像処理装置。
【請求項6】
さらに、
前記学習画像群の一部を用いてモデルの学習を行う学習手段を備え、
前記特定手段は、前記複数のグループのうち、前記モデルが算出した分類の正解率が閾値未満の入力画像のグループを特定することを特徴とする請求項5に記載の画像処理装置。
【請求項7】
さらに、
全てのグループの正解率が閾値以上とはならない場合には、正解率が閾値未満のグループに対応する学習画像の追加をユーザに要求する要求手段を備えることを特徴とする請求項5に記載の画像処理装置。
【請求項8】
画像処理装置が行う画像処理方法であって、
前記画像処理装置の特定手段が、学習画像群を分類することで得られる複数のグループのうち、入力画像に係る複数の評価値のうち規定条件を満たす評価値に応じたグループを特定する特定工程と、
前記画像処理装置の拡張手段が、前記特定工程で特定したグループについて、より強い強度でデータ拡張を行う拡張工程と
を備えることを特徴とする画像処理方法。
【請求項9】
コンピュータを、請求項1ないし7のいずれか1項に記載の画像処理装置の各手段として機能させるためのコンピュータプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、学習技術に関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
データの検出、分類、認証などのタスクを解決するための方法として、畳み込みネットワークなどを用いて検出器や分類器を作成し、さらに学習用データを用いた学習処理により畳み込みネットワークのパラメータを更新して、検出、分類、認証などの性能を向上させる方法が知られている。一般的なネットワークの学習手法では、十分な性能を達成するためには、膨大かつ多彩な学習用データが必要となるため、学習用データの生成コストが大きい。そこで、効率的に学習用データを生成するための手法や、疑似的に学習用データを増やす方法、などが知られている。また、疑似的に学習用データを増やす方法は、“データ拡張”、“データオーグメンテーション”、“データ水増し”、などという表現で呼ばれていることが多い。以下では、疑似的に学習用データを増やす方法を、“データ拡張”と呼ぶこととする。
【0003】
例えば、特許文献1には、分類誤差が所定の閾値より大きい画像データを学習用データに追加することで予測モデルの精度を高める手法が開示されている。また、非特許文献1では、対象とする学習用データセットに対して効果的なデータ拡張方策を強化学習により自動的に発見する手法が開示されている。
【先行技術文献】
【特許文献】
【0004】
特許6874827号
【非特許文献】
【0005】
Ekin D. Cubuk, Barret Zoph, Dandelion Mane, Vijay Vasudevan, Quoc V. Le ´ Google Brain , 『AutoAugment : Learning Augmentation Strategies from Data』
【発明の概要】
【発明が解決しようとする課題】
【0006】
機械学習モデルを用いて複数の評価指標を評価する場合を考える。例えば、ノイズ低減タスクにおいて画像の劣化の少なさ(PSNR)を評価する際に、画像内の複数の領域毎にPSNRを評価する場合である。他には、物体検出タスクにおいて、クラス毎の正解率を評価する場合なども含まれる。
【0007】
このように、機械学習モデルが複数の評価指標を評価する際に、複数の評価指標のいずれにおいても一定以上の評価スコアが求められることがあり、特定の評価指標において評価スコアが低い場合は、該当の評価スコアを改善する必要がある。
【0008】
特許文献1では、分類誤差の大きかった画像データを学習用データに追加する構成のため、分類誤差の大きい画像データが多くなるほど学習用データが増えてしまい、学習用データの処理に要する時間が増加する。また、画像データを、画像処理を含む加工をすることなく学習用データに追加しているため、分類誤差の大きかった画像データに対しての効果が十分でない可能性が考えられる。
【0009】
非特許文献1では、強化学習を用いてデータ拡張の手法・確率・強度を網羅的に探索するため、計算量が膨大となる。また、全体精度の向上は見込めるが、特定の画像・領域に対する精度が改善するとは限らない。例えば、得意な画像・領域の精度がより向上し、苦手な画像・領域の精度はあまり改善されないという可能性も考えられる。本発明では、学習画像の処理負荷を増やすことなく、特定の評価値を向上させることが可能な技術を提供する。
【課題を解決するための手段】
【0010】
本発明の一様態では、学習画像群を分類することで得られる複数のグループのうち、入力画像に係る複数の評価値のうち規定条件を満たす評価値に応じたグループを特定する特定手段と、前記特定手段が特定したグループについて、より強い強度でデータ拡張を行う拡張手段とを備えることを特徴とする。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

キヤノン株式会社
顕微鏡
今日
キヤノン株式会社
撮像装置
15日前
キヤノン株式会社
通信装置
16日前
キヤノン株式会社
光学装置
6日前
キヤノン株式会社
記録装置
16日前
キヤノン株式会社
撮像装置
今日
キヤノン株式会社
撮像装置
2日前
キヤノン株式会社
撮像装置
19日前
キヤノン株式会社
撮像装置
19日前
キヤノン株式会社
光学センサ
5日前
キヤノン株式会社
光走査装置
8日前
キヤノン株式会社
画像形成装置
6日前
キヤノン株式会社
画像形成装置
2日前
キヤノン株式会社
画像形成装置
1日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
記録素子基板
14日前
キヤノン株式会社
画像形成装置
16日前
キヤノン株式会社
画像形成装置
2日前
キヤノン株式会社
画像形成装置
16日前
キヤノン株式会社
画像形成装置
19日前
キヤノン株式会社
画像形成装置
13日前
キヤノン株式会社
画像形成装置
6日前
キヤノン株式会社
画像形成装置
19日前
キヤノン株式会社
画像表示装置
5日前
キヤノン株式会社
画像形成装置
5日前
キヤノン株式会社
冊子作製装置
15日前
キヤノン株式会社
画像処理装置
9日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
光電変換装置
今日
キヤノン株式会社
光電変換装置
今日
キヤノン株式会社
画像形成装置
2日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
通信システム
今日
キヤノン株式会社
画像形成装置
9日前
キヤノン株式会社
液体供給装置
9日前
キヤノン株式会社
画像形成装置
9日前
続きを見る