TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025018969
公報種別公開特許公報(A)
公開日2025-02-06
出願番号2024112886
出願日2024-07-12
発明の名称機械学習方法および情報処理装置
出願人富士通株式会社,インディアン インスティテュート オブ サイエンス
代理人弁理士法人酒井国際特許事務所
主分類G06N 20/00 20190101AFI20250130BHJP(計算;計数)
要約【課題】汎化性能を向上させつつ、精度のよい分類器を得ることを課題とする。
【解決手段】情報処理装置は、訓練データセットに含まれる訓練データの組み合わせに基づいて機械学習モデルを訓練した場合の、前記機械学習モデルにかかる評価指標を向上させる度合いを推定し、推定した前記度合いに基づいて前記訓練データセットから訓練データの組を選定し、選定した前記訓練データの組に基づいて他の訓練データを生成し、生成した前記他の訓練データと、前記訓練データセットとに基づいて前記機械学習モデルを訓練する。
【選択図】図1
特許請求の範囲【請求項1】
訓練データセットに含まれる訓練データの組み合わせに基づいて機械学習モデルを訓練した場合の、前記機械学習モデルにかかる評価指標を向上させる度合いを推定し、
推定した前記度合いに基づいて前記訓練データセットから訓練データの組を選定し、
選定した前記訓練データの組に基づいて他の訓練データを生成し、
生成した前記他の訓練データと、前記訓練データセットとに基づいて前記機械学習モデルを訓練する、
処理をコンピュータが実行することを特徴とする機械学習方法。
続きを表示(約 1,400 文字)【請求項2】
前記推定する処理は、特定のクラスに属する訓練データの特徴量の平均に基づいて推定する処理を含む、ことを特徴とする請求項1に記載の機械学習方法。
【請求項3】
前記選定する処理は、前記訓練データセットに付された複数のラベルのうち、前記度合いに基づいて、第1のラベルと第2のラベルを選択し、前記訓練データセットから前記第1のラベルが付された第1の訓練データと前記第2のラベルが付された第2の訓練データとを前記訓練データの組として選定する処理を含む、
ことを特徴とする請求項1に記載の機械学習方法。
【請求項4】
前記第1のラベルは、前記第1の訓練データに付される正解ラベルであり、
前記第2のラベルは、訓練前の前記機械学習モデルに前記第2の訓練データを入力することによって出力される疑似ラベルである、
ことを特徴とする請求項3に記載の機械学習方法。
【請求項5】
前記訓練する処理は、新たな訓練データに基づく前記機械学習モデルの訓練において、前記新たな訓練データのもととなる前記第1の訓練データに付与されたラベルを前記新たな訓練データのラベルとしたときの損失関数の値に基づいて前記機械学習モデルのパラメータを訓練する、
ことを特徴とする請求項3に記載の機械学習方法。
【請求項6】
訓練データセットに含まれる訓練データの組み合わせに基づいて機械学習モデルを訓練した場合の、前記機械学習モデルにかかる評価指標を向上させる度合いを推定し、
推定した前記度合いに基づいて前記訓練データセットから訓練データの組を選定し、
選定した前記訓練データの組に基づいて他の訓練データを生成し、
生成した前記他の訓練データと、前記訓練データセットとに基づいて前記機械学習モデルを訓練する、
制御部を有することを特徴とする情報処理装置。
【請求項7】
前記制御部は、特定のクラスに属する訓練データの特徴量の平均に基づいて推定することを特徴とする請求項6に記載の情報処理装置。
【請求項8】
前記制御部は、前記訓練データセットに付された複数のラベルのうち、前記度合いに基づいて、第1のラベルと第2のラベルを選択し、前記訓練データセットから前記第1のラベルが付された第1の訓練データと前記第2のラベルが付された第2の訓練データとを前記訓練データの組として選定する、
ことを特徴とする請求項6に記載の情報処理装置。
【請求項9】
前記第1のラベルは、前記第1の訓練データに付される正解ラベルであり、
前記第2のラベルは、訓練前の前記機械学習モデルに前記第2の訓練データを入力することによって出力される疑似ラベルである、
ことを特徴とする請求項8に記載の情報処理装置。
【請求項10】
前記制御部は、新たな訓練データに基づく前記機械学習モデルの訓練において、前記新たな訓練データのもととなる前記第1の訓練データに付与されたラベルを前記新たな訓練データのラベルとしたときの損失関数の値に基づいて前記機械学習モデルのパラメータを訓練する、
ことを特徴とする請求項8に記載の情報処理装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、訓練データを用いて機械学習モデルの訓練を行う機械学習技術に関する。
続きを表示(約 1,600 文字)【背景技術】
【0002】
近年、機械学習アルゴリズムを適用し、複数の訓練データを含む訓練データセットを用いて訓練した分類器(機械学習モデル)が、異常検知や医療における画像診断などに用いられている。この分類器の訓練においては、訓練データセットに含まれる訓練データを組み合わせて混合することで新たな訓練データを生成するMixupによりデータ拡張を行い、拡張した訓練データセットを用いて分類器を訓練することで分類器の汎化性能をより向上させることが知られている。
【先行技術文献】
【特許文献】
【0003】
特開2022-181204号公報
特開2022-80213号公報
特開2022-124989号公報
米国特許出願公開第2021/0124993号明細書
国際公開第2021/100818号
【発明の概要】
【発明が解決しようとする課題】
【0004】
訓練データセットを用いて分類器の訓練を行う場合、分類器の精度だけでは、機械学習アルゴリズムの性能を適切に評価することが難しいため、より複雑な評価指標が用いられる場合がある。より複雑な評価指標とは、分類器の予測が特定のクラスに偏らなくするための制約付きの評価指標である。しかしながら、上記の従来技術のようにMixupにより訓練データセットのデータ拡張を行う場合、分類器の汎化性能をより向上させることには役立つが、より複雑な評価指標を最適化させることは困難であるという問題がある。
【0005】
1つの側面では、本発明は、汎化性能を向上させつつ、精度のよい分類器を得ることができる機械学習方法および情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
第1の案では、機械学習方法は、訓練データセットに含まれる訓練データの組み合わせに基づいて機械学習モデルを訓練した場合の、前記機械学習モデルにかかる評価指標を向上させる度合いを推定し、推定した前記度合いに基づいて前記訓練データセットから訓練データの組を選定し、選定した前記訓練データの組に基づいて他の訓練データを生成し、生成した前記他の訓練データと、前記訓練データセットとに基づいて前記機械学習モデルを訓練する、処理をコンピュータが実行することを特徴とする。
【図面の簡単な説明】
【0007】
図1は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。
図2は、本実施例に係る情報処理装置の処理手順を示すフローチャートである。
図3は、本実施例の情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0008】
以下、図面に基づいて、本願の開示する情報処理装置、機械学習方法および機械学習プログラムの実施例を詳細に説明する。なお、本実施例により、開示技術が限定されるものではない。また、以下の実施例は、矛盾しない範囲で適宜組み合わせてもよい。
【実施例】
【0009】
参考文献1:Narasimhan, H., Menon, A.K.: Training over-parameterized models with non-decomposable objectives, NeurIPS 2021
【0010】
まず、参考文献1などに用いられている分類器の予測精度に関する基本的な評価指標、および、基本的な評価指標より複雑な評価指標(例えば制約付きの評価指標)について説明を行う。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

富士通株式会社
プロセッサ
5日前
富士通株式会社
金融システム
20日前
富士通株式会社
異常な挙動の検出
6日前
富士通株式会社
基地局装置及び通信方法
19日前
富士通株式会社
機械学習方法および情報処理装置
6日前
富士通株式会社
異常検知装置および異常検知方法
5日前
富士通株式会社
画像視角変化類型検出装置と方法
6日前
富士通株式会社
連携装置、連携方法、連携プログラム
19日前
富士通株式会社
疾患予測根拠表示方法及びプログラム
19日前
富士通株式会社
ネットワーク装置及びモデル学習方法
5日前
富士通株式会社
歪み補正係数算出方法およびプログラム
13日前
富士通株式会社
モジュール搭載装置、及び、情報処理装置
19日前
富士通株式会社
データ連携方法及びデータ連携プログラム
13日前
富士通株式会社
支援プログラム、支援方法及び情報処理装置
5日前
富士通株式会社
制御プログラム、制御方法および制御システム
12日前
富士通株式会社
推定プログラム、推定方法、及び情報処理装置
5日前
富士通株式会社
プログラム、データ処理装置及びデータ処理方法
13日前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
19日前
富士通株式会社
通信制御装置、通信装置、端末、及び通信システム
19日前
富士通株式会社
移動目標検出のためのレーダ点群の処理方法及び装置
14日前
富士通株式会社
割当制御プログラム、割当制御方法および情報処理装置
12日前
富士通株式会社
情報処理プログラム、情報処理方法、及び情報処理装置
19日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
20日前
富士通株式会社
機械学習パイプライン部品判定プログラム、方法、及び装置
6日前
富士通株式会社
データ処理装置、データ処理プログラム及びデータ処理方法
5日前
富士通株式会社
光給電/通信装置、光給電監視システム、及び光給電監視方法
13日前
富士通株式会社
レポート作成プログラム、レポート作成方法、レポート作成装置
5日前
富士通株式会社
データ管理プログラム、データ管理装置、およびデータ管理システム
6日前
富士通株式会社
ニューラルネットワークの訓練方法、装置及びニューラルネットワーク
20日前
富士通株式会社
ジョブスケジューリングプログラム、ジョブスケジューリング方法および情報処理装置
13日前
富士通株式会社
フィードバック情報の送受信方法及び装置
20日前
個人
情報提示方法
20日前
個人
自動精算システム
2か月前
個人
アカウントマップ
13日前
個人
自動精算システム
28日前
個人
RFタグ読取装置
1か月前
続きを見る