TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025068600
公報種別公開特許公報(A)
公開日2025-04-28
出願番号2024175446
出願日2024-10-07
発明の名称画像を識別してトレーニングする方法、機器および記憶媒体
出願人株式会社NTTドコモ
代理人インフォート弁理士法人
主分類G06T 7/00 20170101AFI20250421BHJP(計算;計数)
要約【課題】ノイズラベル付きデータに対するモデルのロバスト性を向上させる、画像を識別してトレーニングする方法、機器及び記憶媒体を提供する。
【解決手段】画像を識別してトレーニングする方法は、有効な識別マークのない画像サンプルに対して第1のデータ拡張を実行して、第1の拡張画像のサンプルセットを生成するステップと、人工知能識別モデルと前記第1の拡張画像のサンプルセットで、有効な識別マークのない画像サンプルに対して識別して予測するステップと、予測された結果で、有効な識別マークのない画像サンプルに擬似ラベルを付けるステップと、有効な識別マークのない画像サンプルと擬似ラベルを使用して、人工知能識別モデルに対して、教師あり学習を実行するステップと、を含む。これにより、クリーンデータとノイズデータを同時に利用して、データ分布およびノイズ分布の仮定への依存から脱却する。
【選択図】図1
特許請求の範囲【請求項1】
有効な識別マークのない画像サンプルに対して第1のデータ拡張を実行して、第1の拡張画像のサンプルセットを生成するステップと、
人工知能識別モデルと前記第1の拡張画像のサンプルセットで、前記有効な識別マークのない画像サンプルに対して識別して予測するステップと、
予測された結果で、前記有効な識別マークのない画像サンプルに擬似ラベルを付けるステップと、
前記有効な識別マークのない画像サンプルと前記擬似ラベルを使用して、前記人工知能識別モデルに対して、教師あり学習を実行するステップと、を含む、画像を識別してトレーニングする方法。
続きを表示(約 1,900 文字)【請求項2】
前記有効な識別マークのない画像サンプルと前記擬似ラベルを使用して、前記人工知能識別モデルに対して教師あり学習を実行するステップは、
有効な識別マークのない画像サンプルに対して第2のデータ拡張を実行して、第2の拡張画像のサンプルセットを生成するステップと、
前記人工知能識別モデルに、前記第2の拡張画像のサンプルセットと前記擬似ラベルを入力して、教師あり学習を実行するステップとを含み、
前記第2のデータ拡張は、前記第1のデータ拡張とは異なる、請求項1に記載の画像を識別してトレーニングする方法。
【請求項3】
前記予測された結果で、前記有効な識別マークのない画像サンプルに前記擬似ラベルを付けるステップは、
前記予測された結果での最大確率が予め設定された確率閾値以上である場合、前記最大確率を有する識別マークを、前記有効な識別マークのない画像サンプルの擬似ラベルとしてラベル付けるステップを含む、請求項1または2に記載の画像を識別してトレーニングする方法。
【請求項4】
前記方法は、
人工知能識別モデルと前記第1の拡張画像のサンプルセットで、前記有効な識別マークのない画像サンプルに対して識別して予測する前に、有効な識別マークのある画像サンプルと当該識別マークを使用して、前記人工知能分類モデルに対して、教師あり学習を実行するステップを含む、請求項1または2に記載の画像を識別してトレーニングする方法。
【請求項5】
前記方法は、
トレーニング画像サンプルを、ノイジーな画像サンプルとクリーンな画像サンプルとに分け、前記ノイジーな画像サンプルを前記有効な識別マークのない画像サンプルとして使用し、前記クリーンな画像サンプルを、前記有効な識別マークのある画像サンプルとして使用するステップを含む、請求項4に記載の画像を識別してトレーニングする方法。
【請求項6】
トレーニング画像サンプルをノイジーな画像サンプルとクリーンな画像サンプルとに分けるステップは、
前記トレーニング画像サンプルをに対して第3のデータ拡張を実行して、第3の拡張画像のサンプルセットを生成するステップと、
前記人工知能識別モデルで、前記第3の拡張画像のサンプルセットを識別して予測し、前記第3の拡張画像のサンプルセットのうち拡張された各画像サンプルが、前記トレーニング画像サンプルの識別マークに対応するか否かを判断するステップと、
前記第3の拡張画像のサンプルセットおいて、ターゲットマークに対応する、拡張された画像サンプルの数の割合を決定するステップと、
前記割合が予め設定された閾値以上である場合、前記トレーニング画像サンプルを前記クリーンな画像サンプルとして識別し、そうでない場合、前記トレーニング画像サンプルをノイジーな画像サンプルとして識別するステップとを含む、請求項5に記載の画像を識別してトレーニングする方法。
【請求項7】
前記方法は、
ターゲットマーク付きテキストからテキスト特徴を抽出するステップと、
入力された画像サンプルセットのうち画像サンプルから画像特徴を抽出するステップと、
前記テキスト特徴と前記画像特徴との類似性に基づいて、前記入力された画像サンプルセットから、有効な画像サンプルを決定して前記トレーニング画像サンプルとするステップとを含む、請求項5に記載の画像を識別してトレーニングする方法。
【請求項8】
前記第1のデータ拡張は、画像サンプルに対する空間的な変更であり、前記第2のデータ拡張は、前記画像サンプルの画像ピクセル自体に対する変更を含む、請求項2に記載の画像を識別してトレーニングする方法。
【請求項9】
プロセッサと、
1つまたは複数のコンピュータプログラムモジュールが記憶されるメモリと、を含み、
前記1つまたは複数のコンピュータプログラムモジュールが前記プロセッサによって実行される場合、請求項1~8のいずれか一項に記載の画像を識別してトレーニングする方法が実行される、画像を識別してトレーニングする機器。
【請求項10】
コンピュータ命令が記憶される非一時的なコンピュータ読み取り可能な記憶媒体であって、プロセッサによって前記コンピュータ命令が実行される場合、請求項1~8のいずれか一項に記載の画像を識別してトレーニングする方法が実現される、コンピュータ読み取り可能な記憶媒体。

発明の詳細な説明【技術分野】
【0001】
本願は、画像を処理する技術分野に関し、特に画像を識別してトレーニングする方法、機器および記憶媒体に関する。
続きを表示(約 2,100 文字)【背景技術】
【0002】
画像分類のトレーニングセットにノイズデータが含まれる場合、ニューラルネットワークが強力な適合能力を有することにより、通常、モデルのトレーニングにおいてノイズラベルが過剰適合(overfitting)され、クリーンなデータセットに対するモデルの汎化能力が大幅に低下してしまう。したがって、ノイズラベル付きデータに対するモデルのロバスト性を向上させることが特に重要である。
【0003】
ノイズラベル付き画像を分類する問題に関して、現在において主流になる方法は、ノイズ分布またはデータ分布に関して行われた仮定に基づいて、合成ノイズデータセット(例えば、対称ノイズや非対称ノイズ)にモデル化することである。しかし、実際には、実際のノイズ分布と合成ノイズとの間には大きな違いがある。例えば、現実世界のノイズデータセットには、通常、複数の種類のノイズが同時に含まれており、これらのノイズが、粒度の細かいノイズである一方、合成ノイズデータセットには、通常、単一種類のノイズしか含まれておらず、類似した大きなクラス間で混同が発生すると想定される。したがって、データ分布とノイズ分布の仮定に依存する従来のノイズ除去方法は、ロバスト性が高くない。
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記課題に鑑み、本開示は、画像を識別してトレーニングする方法、機器および記憶媒体を提供する。
【0005】
本開示の一態様によれば、
有効な識別マークのない画像サンプルに対して第1のデータ拡張を実行して、第1の拡張画像のサンプルセットを生成するステップと、
人工知能(Artificial Intelligence)分類モデルと前記第1の拡張画像のサンプルセットで、前記有効な識別マークのない画像サンプルに対して識別して予測するステップと、
予測された結果で、前記有効な識別マークのない画像サンプルに擬似ラベルを付けるステップと、
前記有効な識別マークのない画像サンプルと前記擬似ラベルで、前記人工知能識別モデルに対して教師あり学習を実行するステップと、を含む、画像を識別してトレーニングする方法が提供される。
【0006】
本開示の一例によれば、前記有効な識別マークのない画像サンプルと前記擬似ラベルで、前記人工知能識別モデルに対して教師あり学習を実行するステップは、
有効な識別マークのない画像サンプルに対して第2のデータ拡張を実行して、第2の拡張画像のサンプルセットを生成するステップと、
前記第2の拡張画像のサンプルセットと前記擬似ラベルを、前記人工知能識別モデルに入力して、教師あり学習を実行するステップとを含み、
前記第2のデータ拡張は、前記第1のデータ拡張とは異なる。
【0007】
本開示の一例によれば、前記予測された結果で、前記有効な識別マークのない画像サンプルに前記擬似ラベルを付けるステップは、前記予測された結果での最大確率が予め設定された確率閾値以上である場合、前記最大確率を有する識別マークを、前記有効な識別マークのない画像サンプルの擬似ラベルとしてラベル付けるステップを含む。
【0008】
本開示の一例によれば、前記方法は、人工知能識別モデルと前記第1の拡張画像のサンプルセットで、前記有効な識別マークのない画像サンプルに対して識別して予測する前に、有効な識別マークのある画像サンプルと当該識別マークを使用して、前記人工知能識別モデルに対して、教師あり学習を実行するステップを含む。
【0009】
本開示の一例によれば、前記方法は、トレーニング画像サンプルを、ノイジーな画像サンプルとクリーンな画像サンプルとに分け、前記ノイジーな画像サンプルを、前記有効な識別マークのない画像サンプルとして使用し、前記クリーンな画像サンプルを、前記有効な識別マークのある画像サンプルとして使用するステップを含む。
【0010】
本開示の一例によれば、トレーニング画像サンプルをノイジーな画像サンプルとクリーンな画像サンプルとに分けるステップは、
前記トレーニング画像サンプルに対して第3のデータ拡張を実行して、第3の拡張画像のサンプルセットを生成するステップと、
前記人工知能識別モデルで、前記第3の拡張画像のサンプルセットを識別して予測し、前記第3の拡張画像のサンプルセットのうち拡張された各画像サンプルが、前記トレーニング画像サンプルの識別マークに対応するか否かを判断するステップと、
前記第3の拡張画像のサンプルセットにおいて、前記ターゲットマークに対応する、拡張された画像サンプルの数の割合を決定するステップと、
前記割合が予め設定された閾値以上である場合、前記トレーニング画像サンプルを、前記クリーンな画像サンプルとして識別し、そうでない場合、前記トレーニング画像サンプルをノイジーな画像サンプルとして識別するステップとを含む。
(【0011】以降は省略されています)

特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する

関連特許

個人
非正規コート
22日前
個人
在宅介護システム
4日前
個人
人物再現システム
19日前
個人
RFタグ読取装置
4日前
個人
AI飲食最適化プラグイン
12日前
個人
電話管理システム及び管理方法
13日前
有限会社ノア
データ読取装置
20日前
株式会社ザメディア
出席管理システム
27日前
個人
広告提供システムおよびその方法
22日前
株式会社CROSLAN
支援装置
4日前
個人
日誌作成支援システム
19日前
長屋印刷株式会社
画像形成システム
4日前
ひびきの電子株式会社
認証システム
6日前
ミサワホーム株式会社
情報処理装置
26日前
トヨタ自動車株式会社
工程計画装置
27日前
個人
ポイント還元付き配送システム
20日前
株式会社タクテック
商品取出集品システム
26日前
トヨタ自動車株式会社
作業判定方法
28日前
オベック実業株式会社
接続構造
19日前
オムロン株式会社
回転装置及びマウス
8日前
ゼネラル株式会社
RFIDタグ付き物品
29日前
株式会社村田製作所
動き検知装置
26日前
トヨタ自動車株式会社
情報処理システム
28日前
トヨタ自動車株式会社
情報処理方法
28日前
株式会社国際電気
支援システム
29日前
株式会社実身美
ワーキングシェアリングシステム
20日前
個人
コンテンツ配信システム
26日前
株式会社ドクター中松創研
生成AIの適切使用法
19日前
個人
アルバム作成システム及びアルバム作成方法
6日前
ブラザー工業株式会社
ラベルプリンタ
28日前
個人
プラットフォームシステム
26日前
富士通株式会社
画像生成方法
1か月前
株式会社エスシーシー
置き配システム
20日前
株式会社半導体エネルギー研究所
情報処理システム
4日前
株式会社TMEIC
データ処理装置
4日前
アスエネ株式会社
温室効果ガス排出量管理方法
5日前
続きを見る