TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025018969
公報種別
公開特許公報(A)
公開日
2025-02-06
出願番号
2024112886
出願日
2024-07-12
発明の名称
機械学習方法および情報処理装置
出願人
富士通株式会社
,
インディアン インスティテュート オブ サイエンス
代理人
弁理士法人酒井国際特許事務所
主分類
G06N
20/00 20190101AFI20250130BHJP(計算;計数)
要約
【課題】汎化性能を向上させつつ、精度のよい分類器を得ることを課題とする。
【解決手段】情報処理装置は、訓練データセットに含まれる訓練データの組み合わせに基づいて機械学習モデルを訓練した場合の、前記機械学習モデルにかかる評価指標を向上させる度合いを推定し、推定した前記度合いに基づいて前記訓練データセットから訓練データの組を選定し、選定した前記訓練データの組に基づいて他の訓練データを生成し、生成した前記他の訓練データと、前記訓練データセットとに基づいて前記機械学習モデルを訓練する。
【選択図】図1
特許請求の範囲
【請求項1】
訓練データセットに含まれる訓練データの組み合わせに基づいて機械学習モデルを訓練した場合の、前記機械学習モデルにかかる評価指標を向上させる度合いを推定し、
推定した前記度合いに基づいて前記訓練データセットから訓練データの組を選定し、
選定した前記訓練データの組に基づいて他の訓練データを生成し、
生成した前記他の訓練データと、前記訓練データセットとに基づいて前記機械学習モデルを訓練する、
処理をコンピュータが実行することを特徴とする機械学習方法。
続きを表示(約 1,400 文字)
【請求項2】
前記推定する処理は、特定のクラスに属する訓練データの特徴量の平均に基づいて推定する処理を含む、ことを特徴とする請求項1に記載の機械学習方法。
【請求項3】
前記選定する処理は、前記訓練データセットに付された複数のラベルのうち、前記度合いに基づいて、第1のラベルと第2のラベルを選択し、前記訓練データセットから前記第1のラベルが付された第1の訓練データと前記第2のラベルが付された第2の訓練データとを前記訓練データの組として選定する処理を含む、
ことを特徴とする請求項1に記載の機械学習方法。
【請求項4】
前記第1のラベルは、前記第1の訓練データに付される正解ラベルであり、
前記第2のラベルは、訓練前の前記機械学習モデルに前記第2の訓練データを入力することによって出力される疑似ラベルである、
ことを特徴とする請求項3に記載の機械学習方法。
【請求項5】
前記訓練する処理は、新たな訓練データに基づく前記機械学習モデルの訓練において、前記新たな訓練データのもととなる前記第1の訓練データに付与されたラベルを前記新たな訓練データのラベルとしたときの損失関数の値に基づいて前記機械学習モデルのパラメータを訓練する、
ことを特徴とする請求項3に記載の機械学習方法。
【請求項6】
訓練データセットに含まれる訓練データの組み合わせに基づいて機械学習モデルを訓練した場合の、前記機械学習モデルにかかる評価指標を向上させる度合いを推定し、
推定した前記度合いに基づいて前記訓練データセットから訓練データの組を選定し、
選定した前記訓練データの組に基づいて他の訓練データを生成し、
生成した前記他の訓練データと、前記訓練データセットとに基づいて前記機械学習モデルを訓練する、
制御部を有することを特徴とする情報処理装置。
【請求項7】
前記制御部は、特定のクラスに属する訓練データの特徴量の平均に基づいて推定することを特徴とする請求項6に記載の情報処理装置。
【請求項8】
前記制御部は、前記訓練データセットに付された複数のラベルのうち、前記度合いに基づいて、第1のラベルと第2のラベルを選択し、前記訓練データセットから前記第1のラベルが付された第1の訓練データと前記第2のラベルが付された第2の訓練データとを前記訓練データの組として選定する、
ことを特徴とする請求項6に記載の情報処理装置。
【請求項9】
前記第1のラベルは、前記第1の訓練データに付される正解ラベルであり、
前記第2のラベルは、訓練前の前記機械学習モデルに前記第2の訓練データを入力することによって出力される疑似ラベルである、
ことを特徴とする請求項8に記載の情報処理装置。
【請求項10】
前記制御部は、新たな訓練データに基づく前記機械学習モデルの訓練において、前記新たな訓練データのもととなる前記第1の訓練データに付与されたラベルを前記新たな訓練データのラベルとしたときの損失関数の値に基づいて前記機械学習モデルのパラメータを訓練する、
ことを特徴とする請求項8に記載の情報処理装置。
発明の詳細な説明
【技術分野】
【0001】
本発明は、訓練データを用いて機械学習モデルの訓練を行う機械学習技術に関する。
続きを表示(約 1,600 文字)
【背景技術】
【0002】
近年、機械学習アルゴリズムを適用し、複数の訓練データを含む訓練データセットを用いて訓練した分類器(機械学習モデル)が、異常検知や医療における画像診断などに用いられている。この分類器の訓練においては、訓練データセットに含まれる訓練データを組み合わせて混合することで新たな訓練データを生成するMixupによりデータ拡張を行い、拡張した訓練データセットを用いて分類器を訓練することで分類器の汎化性能をより向上させることが知られている。
【先行技術文献】
【特許文献】
【0003】
特開2022-181204号公報
特開2022-80213号公報
特開2022-124989号公報
米国特許出願公開第2021/0124993号明細書
国際公開第2021/100818号
【発明の概要】
【発明が解決しようとする課題】
【0004】
訓練データセットを用いて分類器の訓練を行う場合、分類器の精度だけでは、機械学習アルゴリズムの性能を適切に評価することが難しいため、より複雑な評価指標が用いられる場合がある。より複雑な評価指標とは、分類器の予測が特定のクラスに偏らなくするための制約付きの評価指標である。しかしながら、上記の従来技術のようにMixupにより訓練データセットのデータ拡張を行う場合、分類器の汎化性能をより向上させることには役立つが、より複雑な評価指標を最適化させることは困難であるという問題がある。
【0005】
1つの側面では、本発明は、汎化性能を向上させつつ、精度のよい分類器を得ることができる機械学習方法および情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
第1の案では、機械学習方法は、訓練データセットに含まれる訓練データの組み合わせに基づいて機械学習モデルを訓練した場合の、前記機械学習モデルにかかる評価指標を向上させる度合いを推定し、推定した前記度合いに基づいて前記訓練データセットから訓練データの組を選定し、選定した前記訓練データの組に基づいて他の訓練データを生成し、生成した前記他の訓練データと、前記訓練データセットとに基づいて前記機械学習モデルを訓練する、処理をコンピュータが実行することを特徴とする。
【図面の簡単な説明】
【0007】
図1は、本実施例に係る情報処理装置の構成を示す機能ブロック図である。
図2は、本実施例に係る情報処理装置の処理手順を示すフローチャートである。
図3は、本実施例の情報処理装置と同様の機能を実現するコンピュータのハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0008】
以下、図面に基づいて、本願の開示する情報処理装置、機械学習方法および機械学習プログラムの実施例を詳細に説明する。なお、本実施例により、開示技術が限定されるものではない。また、以下の実施例は、矛盾しない範囲で適宜組み合わせてもよい。
【実施例】
【0009】
参考文献1:Narasimhan, H., Menon, A.K.: Training over-parameterized models with non-decomposable objectives, NeurIPS 2021
【0010】
まず、参考文献1などに用いられている分類器の予測精度に関する基本的な評価指標、および、基本的な評価指標より複雑な評価指標(例えば制約付きの評価指標)について説明を行う。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
非正規コート
26日前
個人
人物再現システム
23日前
個人
在宅介護システム
8日前
個人
RFタグ読取装置
8日前
個人
AI飲食最適化プラグイン
16日前
個人
電話管理システム及び管理方法
17日前
有限会社ノア
データ読取装置
24日前
個人
広告提供システムおよびその方法
26日前
株式会社ザメディア
出席管理システム
1か月前
株式会社CROSLAN
支援装置
8日前
個人
日誌作成支援システム
23日前
株式会社タクテック
商品取出集品システム
1か月前
長屋印刷株式会社
画像形成システム
8日前
個人
ポイント還元付き配送システム
24日前
ひびきの電子株式会社
認証システム
10日前
ミサワホーム株式会社
情報処理装置
1か月前
トヨタ自動車株式会社
作業判定方法
1か月前
トヨタ自動車株式会社
工程計画装置
1か月前
オムロン株式会社
回転装置及びマウス
12日前
オベック実業株式会社
接続構造
23日前
株式会社村田製作所
動き検知装置
1か月前
個人
アルバム作成システム及びアルバム作成方法
10日前
株式会社ドクター中松創研
生成AIの適切使用法
23日前
株式会社実身美
ワーキングシェアリングシステム
24日前
個人
コンテンツ配信システム
1か月前
株式会社エスシーシー
置き配システム
24日前
個人
プラットフォームシステム
1か月前
ブラザー工業株式会社
ラベルプリンタ
1か月前
株式会社半導体エネルギー研究所
情報処理システム
8日前
株式会社デンソー
電子制御装置
2日前
株式会社ノーリツ
リモートコントローラ
9日前
アスエネ株式会社
温室効果ガス排出量管理方法
9日前
株式会社知財事業研究所
運行計画作成システム
1か月前
株式会社K-model
運用設計資料作成装置
26日前
アスエネ株式会社
温室効果ガス排出量管理方法
9日前
アスエネ株式会社
温室効果ガス排出量管理方法
9日前
続きを見る
他の特許を見る