TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024096024
公報種別公開特許公報(A)
公開日2024-07-11
出願番号2023215177
出願日2023-12-20
発明の名称モデル生成方法、画像分類方法及び補助分類モデル訓練装置
出願人富士通株式会社
代理人個人,個人
主分類G06N 20/00 20190101AFI20240704BHJP(計算;計数)
要約【課題】本発明は、分類モデル生成方法、画像分類方法及び補助分類モデルを訓練するための装置を提供する。
【解決手段】分類モデル生成方法は、エンコーダ及びエンコーダの出力端に接続される第一ポストモジュールを含む補助分類モデルを反復して訓練し;及び、反復訓練後の補助分類モデルにおけるエンコーダと第二ポストモジュールとを接続することで分類モデルを生成することを含み、エンコーダは入力画像の分類用の表現特徴を確定するように構成され、第一ポストモジュールは表現特徴に基づいて、エンコーダによるバイアスを拡大する方式で分類確率ベクトルを確定するように構成される。
【選択図】図2
特許請求の範囲【請求項1】
分類モデルを生成するための方法であって、
エンコーダ、及び前記エンコーダの出力端に接続される第一ポストモジュールを含む補助分類モデルに対して反復訓練を行い;及び
反復訓練後の補助分類モデルにおけるエンコーダと、第二ポストモジュールとを接続することで前記分類モデルを生成することを含み、
前記エンコーダは入力画像の分類用の表現特徴を確定するように構成され、
前記第一ポストモジュールは前記表現特徴に基づいて、前記エンコーダによるバイアスを拡大する方式で分類確率ベクトルを確定するように構成され、
前記反復訓練における少なくとも1つの訓練反復ループが、
前記エンコーダにより、現在のバッチにおける複数のサンプル画像の表現特徴を確定し;
前記第一ポストモジュールにより、前記複数のサンプル画像の表現特徴に基づいて分類を実行し、前記複数のサンプル画像の表現特徴の分類確率ベクトルを確定し;
前記複数のサンプル画像の表現特徴の分類確率ベクトルに基づいて、前記複数のサンプル画像の表現特徴をバイアス組と非バイアス組に分割し;
前記バイアス組及び前記非バイアス組に基づいて、前記複数のサンプル画像の表現特徴の教師有り対照学習損失を確定し;及び
前記教師有り対照学習損失に基づいて前記エンコーダを調整することで前記バイアスを軽減することを含む、方法。
続きを表示(約 2,000 文字)【請求項2】
請求項1に記載の方法であって、
前記反復訓練における少なくとも1つの訓練反復ループは、
前記複数のサンプル画像のラベル分類確率と関連付けられる一般化クロスエントロピー損失に基づいて、前記第一ポストモジュールを調整することをさらに含み、
前記複数のサンプル画像のラベル分類確率のうちの各々が、対応サンプル画像の表現特徴の分類確率ベクトルにおける、該対応サンプル画像のラベル分類に対応する予測確率である、方法。
【請求項3】
請求項1に記載の方法であって、
前記複数のサンプル画像の予測分類確率に基づいて、前記複数のサンプル画像の表現特徴を前記バイアス組と前記非バイアス組に分割し、
前記複数のサンプル画像の予測分類確率のうちの各々が、対応サンプル画像の表現特徴の分類確率ベクトルにおける、該対応サンプル画像の予測分類に対応する予測確率である、方法。
【請求項4】
請求項1に記載の方法であって、
前記複数のサンプル画像の表現特徴の教師有り対照学習損失を確定することは、
前記複数のサンプル画像の表現特徴のうちの各表現特徴について、前記バイアス組のうちから、該表現特徴の負サンプル対におけるペア表現特徴を選択し、前記非バイアス組のうちから、該表現特徴の正サンプル対におけるペア表現特徴を選択し;及び
前記複数のサンプル画像の負サンプル対及び正サンプル対に基づいて、前記複数のサンプル画像の表現特徴の教師有り対照学習損失を確定することを含み、
該表現特徴の正サンプル対におけるペア表現特徴及び該表現特徴は同じ分類ラベルを有し、該表現特徴の負サンプル対におけるペア表現特徴及び該表現特徴は異なる分類ラベルを有する、方法。
【請求項5】
請求項3に記載の方法であって、
前記複数のサンプル画像の予測分類確率に基づいて、前記複数のサンプル画像の表現特徴を前記バイアス組と前記非バイアス組に分割することは、
前記複数のサンプル画像の予測分類確率の平均値及び標準偏差に基づいて、バイアス確率閾値を確定し;及び
前記バイアス確率閾値に基づいて、前記複数のサンプル画像の表現特徴を前記バイアス組と前記非バイアス組に分割することを含む、方法。
【請求項6】
請求項1に記載の方法であって、
前記第二ポストモジュールのパラメータ設定は前記第一ポストモジュールとは異なる、方法。
【請求項7】
請求項1に記載の方法であって、
前記補助分類モデルに対して反復訓練を行う前に、事前訓練分類モデルのエンコーダを前記補助分類モデルのエンコーダとして提供する、方法。
【請求項8】
請求項7に記載の方法であって、
前記第二ポストモジュールは前記事前訓練分類モデルのポストモジュールである、方法。
【請求項9】
画像を分類する方法であって、
請求項1に記載の方法に基づいて生成される分類モデルにより、テスト画像の分類結果を確定することを含み、
反復訓練後の補助分類モデルにおけるエンコーダにより、前記テスト画像の表現特徴を確定し、
第二ポストモジュールにより、前記テスト画像の表現特徴に基づいて、前記テスト画像の分類確率ベクトルを確定する、方法。
【請求項10】
エンコーダ、及び前記エンコーダの出力端に接続される第一ポストモジュールを含む補助分類モデルを訓練するための装置であって、
プログラムが記憶されている記憶器;及び
前記記憶器に接続される少なくとも1つの処理器を含み、
前記処理器は前記プログラムを実行して前記補助分類モデルに対して反復訓練を行うように構成され、
前記エンコーダは入力画像の分類用の表現特徴を確定するように構成され、
前記第一ポストモジュールは前記表現特徴に基づいて、前記エンコーダによるバイアスを拡大する方式で分類確率ベクトルを確定するように構成され、
前記反復訓練における少なくとも1つの訓練反復ループが、
前記エンコーダにより、現在のバッチにおける複数のサンプル画像の表現特徴を確定し;
前記第一ポストモジュールにより、前記複数のサンプル画像の表現特徴に基づいて分類を実行し、前記複数のサンプル画像の表現特徴の分類確率ベクトルを確定し;
前記複数のサンプル画像の表現特徴の分類確率ベクトルに基づいて、前記複数のサンプル画像の表現特徴をバイアス組と非バイアス組に分割し;
前記バイアス組及び前記非バイアス組に基づいて、前記複数のサンプル画像の表現特徴の教師有り対照学習損失を確定し;及び
前記教師有り対照学習損失に基づいて前記エンコーダを調整することで前記バイアスを軽減することを含む、方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、情報処理の技術分野に関し、特に、分類モデルを生成するための方法、画像分類方法、及び補助(支援)分類モデルを訓練するための装置に関する。
続きを表示(約 2,800 文字)【背景技術】
【0002】
コンピュータ科学や人工知能の発展に伴い、コンピュータを用いて人工知能モデルを実行することで情報処理を実現することは益々一般的かつ効果的になっている。例えば、ニューラルネットワークモデルを使用して入力画像を分類できる。分類を行う前に、サンプル画像集合における画像を用いて初期ニューラルネットワークモデルに対して反復(iteration)訓練を行ってモデルのパラメータを調整することで、モデルが満足のいく分類結果を出力し得るようにさせる必要がある。
【0003】
多くの深層学習モデルが大規模データ集合をもとに訓練されることで、モデルのパフォーマンスは効果的に向上し得る。しかし、懸念されるのは、モデル予測目標がデータに存在する疑似相関に依存し過ぎるため、バイアス(偏見)もモデルによって学習されてしまうことである。バイアス有りのモデルは公平性を大きく損ない得るため、広く適用できない。
【0004】
よって、人工知能モデルに存在するバイアスを如何に軽減(緩和)するかは、解決すべき課題である。
【発明の概要】
【発明が解決しようとする課題】
【0005】
モデルのバイアスを抑制する必要性を考慮して、発明者は本発明の解決策を考案した。本発明が解決しようとする課題は、少なくとも、分類モデルのバイアスを軽減することを含む。
【課題を解決するための手段】
【0006】
本発明の1つの側面によれば、分類モデルを生成するための方法が提供される。該方法は、
エンコーダ(encoder)及びエンコーダの出力端に接続される第一ポスト(post)モジュールを含む補助分類モデルを反復して訓練し;及び
反復訓練後の補助分類モデルにおけるエンコーダと第二ポストモジュールとを接続することで分類モデルを生成することを含み、
そのうち、エンコーダは入力画像の分類用の表現特徴を確定するように構成され、第一ポストモジュールは表現特徴に基づいて、エンコーダによるバイアスを拡大する方式で分類確率ベクトルを確定するように構成される。
【0007】
本発明の1つの側面によれば、エンコーダ及びエンコーダの出力端に接続される第一ポストモジュールを含む補助分類モデルを訓練するための方法が提供される。該方法は、
補助分類モデルを反復して訓練することを含み、
そのうち、エンコーダは入力画像の分類用の表現特徴を確定するように構成され、第一ポストモジュールは表現特徴に基づいて、エンコーダによるバイアスを拡大する方式で分類確率ベクトルを確定するように構成され、
反復訓練における少なくとも1つの訓練反復ループが以下の操作を含み、即ち、
エンコーダが現在のバッチにおける複数のサンプル画像の表現特徴を確定し;
第一ポストモジュールが複数のサンプル画像の表現特徴に基づいて分類を実行し、複数のサンプル画像の表現特徴の分類確率ベクトルを確定し;
複数のサンプル画像の表現特徴の分類確率ベクトルに基づいて複数のサンプル画像の表現特徴をバイアス組と非バイアス組に分割(分類)し;
バイアス組及び非バイアス組に基づいて複数のサンプル画像の表現特徴の教師有り対照学習損失を確定し;及び
教師有り対照学習損失に基づいてエンコーダを調整してバイアスを軽減する操作である。
【0008】
本発明の1つの側面によれば、分類モデルを生成するための方法が提供される。該方法は、
エンコーダ及びエンコーダの出力端に接続される第一ポストモジュールを含む補助分類モデルを反復して訓練し;及び
反復訓練後の補助分類モデルにおけるエンコーダと第二ポストモジュールとを接続することで分類モデルを生成することを含み、
そのうち、エンコーダは入力画像の分類用の表現特徴を確定するように構成され、第一ポストモジュールは表現特徴に基づいて、エンコーダによるバイアスを拡大する方式で分類確率ベクトルを確定するように構成され、
反復訓練における少なくとも1つの訓練反復ループが以下の操作を含み、即ち、
エンコーダが現在のバッチにおける複数のサンプル画像の表現特徴を確定し;
第一ポストモジュールが複数のサンプル画像の表現特徴に基づいて分類を実行し、複数のサンプル画像の表現特徴の分類確率ベクトルを確定し;
複数のサンプル画像の表現特徴の分類確率ベクトルに基づいて複数のサンプル画像の表現特徴をバイアス組と非バイアス組に分割し;
バイアス組及び非バイアス組に基づいて複数のサンプル画像の表現特徴の教師有り対照学習損失を確定し;及び
教師有り対照学習損失に基づいてエンコーダを調整してバイアスを軽減する操作である。
【0009】
本発明の1つの側面によれば、画像分類方法が提供される。該画像分類方法は、
上述の分類モデル生成方法により生成された分類モデルを用いてテスト画像の分類結果を確定することを含み、
そのうち、反復訓練後の補助分類モデルにおけるエンコーダがテスト画像の表現特徴を確定し、第二ポストモジュールがテスト画像の表現特徴に基づいてテスト画像の分類確率ベクトルを確定する。
【0010】
本発明の1つの側面によれば、エンコーダ及びエンコーダの出力端に接続される第一ポストモジュールを含む補助分類モデルを訓練するための装置が提供される。該装置は、命令(プログラム)が記憶されている記憶器;及び、少なくとも1つの処理器を含み、処理器は命令を実行して補助分類モデルを反復して訓練するように構成され、
そのうち、エンコーダは入力画像の分類用の表現特徴を確定するように構成され、第一ポストモジュールは表現特徴に基づいて、エンコーダによるバイアスを拡大する方式で分類確率ベクトルを確定するように構成され、
反復訓練における少なくとも1つの訓練反復ループが以下の操作を含み、
エンコーダが現在のバッチにおける複数のサンプル画像の表現特徴を確定し;
第一ポストモジュールが複数のサンプル画像の表現特徴に基づいて分類を実行し、複数のサンプル画像の表現特徴の分類確率ベクトルを確定し;
複数のサンプル画像の表現特徴の分類確率ベクトルに基づいて複数のサンプル画像の表現特徴をバイアス組と非バイアス組に分割し;
バイアス組及び非バイアス組に基づいて複数のサンプル画像の表現特徴の教師有り対照学習損失を確定し;及び
教師有り対照学習損失に基づいてエンコーダを調整してバイアスを軽減する操作である。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
光信号増幅
1日前
富士通株式会社
算出方法及び算出プログラム
15日前
富士通株式会社
光通信装置および伝送制御方法
7日前
富士通株式会社
光通信装置および伝送制御方法
1か月前
富士通株式会社
画像探索方法及び画像探索プログラム
21日前
富士通株式会社
計算資源管理装置及び計算資源管理方法
10日前
富士通株式会社
制御プログラム,制御方法及び制御装置
8日前
富士通株式会社
画像識別方法および画像識別プログラム
15日前
富士通株式会社
プログラム、評価方法および情報処理装置
7日前
富士通株式会社
監視プログラム,監視装置および監視方法
8日前
富士通株式会社
類似度判定方法および類似度判定プログラム
1か月前
富士通株式会社
習熟度推定方法および習熟度推定プログラム
1日前
富士通株式会社
評価プログラム、評価方法および情報処理装置
16日前
富士通株式会社
検出プログラム、検出方法および情報処理装置
16日前
富士通株式会社
判定プログラム、判定方法および情報処理装置
15日前
富士通株式会社
プログラム、情報処理方法および情報処理装置
14日前
富士通株式会社
パターン抽出方法及びパターン抽出プログラム
13日前
富士通株式会社
設定プログラム、設定方法および情報処理装置
13日前
富士通株式会社
特定プログラム、特定方法および情報処理装置
13日前
富士通株式会社
倫理学に基づくマルチモーダルユーザ投稿監視
2日前
富士通株式会社
移動時間予測方法および移動時間予測プログラム
13日前
富士通株式会社
半導体装置、半導体装置の製造方法及び電子装置
1か月前
富士通株式会社
転写基板、電子デバイス及び転写基板の製造方法
6日前
富士通株式会社
カメラキャリブレーション方法の評価方法及び装置
20日前
富士通株式会社
署名支援プログラム、署名支援方法、署名支援装置
1か月前
富士通株式会社
並列処理プログラム,並列処理装置及び並列処理方法
20日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
2日前
富士通株式会社
情報処理プログラム,情報処理方法及び情報処理装置
7日前
富士通株式会社
情報処理プログラム、情報処理方法、およびシステム
20日前
富士通株式会社
画像選択プログラム、画像選択方法及び画像選択装置
9日前
富士通株式会社
取引処理プログラム、取引処理方法および情報処理装置
29日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
22日前
富士通株式会社
機械学習プログラム、情報処理装置および機械学習方法
9日前
富士通株式会社
広告管理プログラム、広告管理方法、および情報処理装置
1か月前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
1か月前
富士通株式会社
機械学習プログラム、機械学習方法、及び、情報処理装置
29日前
続きを見る