TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025026182
公報種別公開特許公報(A)
公開日2025-02-21
出願番号2023131606
出願日2023-08-10
発明の名称能動学習プログラム、方法、及び装置
出願人富士通株式会社
代理人弁理士法人太陽国際特許事務所
主分類G06N 3/091 20230101AFI20250214BHJP(計算;計数)
要約【課題】なるべく少ないラベル付きデータで機械学習モデルの精度を向上させるための能動学習による訓練コストを抑制する。
【解決手段】能動学習装置は、誤差予測訓練データ群34を用いて訓練された誤差予測モデル26に基づいて、ラベル無しデータ群36に含まれる複数のラベル無しデータの各々に対するエネルギー予測モデル24の予測誤差を予測し(E)、複数のラベル無しデータから予測誤差が大きいラベル無しデータを選択して、正解ラベルとなるエネルギーの情報を付与してラベル付きデータを生成し(F)、生成したラベル付きデータをエネルギー予測訓練データとして用いて、エネルギー予測モデル24を訓練する(A)。
【選択図】図10
特許請求の範囲【請求項1】
複数のデータと、前記複数のデータの各々に対する第1機械学習モデルの予測誤差との組を訓練データとして用いて訓練された第2機械学習モデルに基づいて、複数のラベル無しデータの各々に対する前記第1機械学習モデルの予測誤差を予測し、
予測された前記予測誤差に基づいて、前記複数のラベル無しデータから選択したラベル無しデータに正解ラベルを付与してラベル付きデータを生成し、
生成した前記ラベル付きデータを用いて、前記第1機械学習モデルを再訓練する、
ことを含む処理をコンピュータに実行させるための能動学習プログラム。
続きを表示(約 1,300 文字)【請求項2】
前記複数のラベル無しデータから、予測された前記予測誤差が所定値以上のラベル無しデータ、又は予測された前記予測誤差が上位所定個のラベル無しデータを選択する請求項1に記載の能動学習プログラム。
【請求項3】
複数のラベル付きデータの各々を前記第1機械学習モデルに入力して得られる予測結果の各々と、前記複数のラベル付きデータの正解ラベルの各々とから前記予測誤差の各々を算出し、算出した予測誤差の各々と前記複数のラベル付きデータの各々とから複数の前記訓練データを生成し、
前記訓練データを用いて前記第2機械学習モデルを訓練する、
ことをさらに含む処理を前記コンピュータに実行させるための請求項1又は請求項2に記載の能動学習プログラム。
【請求項4】
再訓練された前記第1機械学習モデルの精度が所定の基準を満たすまで、前記予測誤差の予測、及び前記ラベル付きデータの生成を繰り返す請求項1又は請求項2に記載の能動学習プログラム。
【請求項5】
前記選択したラベル無しデータから生成された前記ラベル付きデータに基づいて生成した前記訓練データを用いて、前記第2機械学習モデルを再訓練する請求項4に記載の能動学習プログラム。
【請求項6】
前記ラベル付きデータは、分子の構造データに正解ラベルとして分子のエネルギーの情報が付与されたデータであり、
前記第1機械学習モデルは、分子の構造データが入力された場合に、前記分子のエネルギーを予測結果として出力する機械学習モデルである、
請求項1又は請求項2に記載の能動学習プログラム。
【請求項7】
前記ラベル付きデータを生成することは、前記選択したラベル無しデータである前記分子の構造データから、密度汎関数理論を用いて前記分子のエネルギーを計算することを含む請求項6に記載の能動学習プログラム。
【請求項8】
複数のデータと、前記複数のデータの各々に対する第1機械学習モデルの予測誤差との組を訓練データとして用いて訓練された第2機械学習モデルに基づいて、複数のラベル無しデータの各々に対する前記第1機械学習モデルの予測誤差を予測し、
予測された前記予測誤差に基づいて、前記複数のラベル無しデータから選択したラベル無しデータに正解ラベルを付与してラベル付きデータを生成し、
生成した前記ラベル付きデータを用いて、前記第1機械学習モデルを再訓練する、
ことを含む処理をコンピュータが実行する能動学習方法。
【請求項9】
複数のデータと、前記複数のデータの各々に対する第1機械学習モデルの予測誤差との組を訓練データとして用いて訓練された第2機械学習モデルに基づいて、複数のラベル無しデータの各々に対する前記第1機械学習モデルの予測誤差を予測する誤差予測部と、
予測された前記予測誤差に基づいて、前記複数のラベル無しデータから選択したラベル無しデータに正解ラベルを付与してラベル付きデータを生成する第1生成部と、
生成した前記ラベル付きデータを用いて、前記第1機械学習モデルを再訓練する第1訓練部と、
を含む能動学習装置。

発明の詳細な説明【技術分野】
【0001】
開示の技術は、能動学習プログラム、能動学習方法、及び能動学習装置に関する。
続きを表示(約 2,500 文字)【背景技術】
【0002】
従来、分子の構造データに基づいて、その分子のエネルギーを予測するニューラルネットワークが提案されている。このニューラルネットワークは、「構造」と「エネルギー」とからなるラベル付きデータを用いて教師あり学習により訓練される。この「エネルギー」は、例えば、密度汎関数理論(DFT:Density Functional Theory)と呼ばれる数値計算手法で計算される。DFTによる分子のエネルギーの計算時間は非常に長く、1つの構造のエネルギーの計算に、半日から3日かかる場合もある。そのため、教師あり学習のためのラベル付きデータを大量に集めることが困難である。
【0003】
そこで、可能な限り少ないラベル付きデータでニューラルネットワークを高精度化するための能動学習の手法が提案されている。例えば、ニューラルネットワークによるエネルギーの予測値の不確かさを予測する機械学習モデルを用いて、ラベル無しデータについて、エネルギーの予測値の不確かさを予測する技術が提案されている。この技術は、予測された不確かさが大きいラベル無しデータに対してラベル付けを行い、ラベル付けされたデータを用いて、エネルギーを予測するニューラルネットワークの訓練を行う。
【0004】
また、能動学習に関連する技術として、特徴量からなる訓練用例を受け付け、訓練用例にラベルを付与し、ラベルが付与された訓練用例を用いて1つ以上の生徒モデルを生成し、生徒モデルによる予測とラベルとの誤差を算出する情報処理装置が提案されている。この装置は、誤差を予測するモデルである誤差予測モデルを生成し、誤差予測モデルに基づき、誤差が大きくなると予測される用例を出力する。
【先行技術文献】
【特許文献】
【0005】
国際公開2022/113338号
Kristof T. Schutt, Oliver T. Unke, and Michael Gastegger, "Equivariant Message Passing for the Prediction of Tensorial Properties and Molecular Spectra," PMLR, 2021.
Johannes Gasteiger, Muhammed Shuaibi, Anuroop Sriram, Stephan Gunnemann, Zachary Ulissi, C. Lawrence Zitnick, and Abhishek Das, "GemNet-OC: Developing Graph Neural Networks for Large and Diverse Molecular Simulation Datasets," Transactions on Machine Learning Research, 2022.
Joseph Musielewicz, Xiaoxiao Wang, Tian Tian, and Zachary Ulissi, "FINETUNA: Fine-tuning Accelerated Molecular Simulations," arXiv:2205.01223v2 [physics.comp-ph] 1 Jul 2022.
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、ニューラルネットワークによるエネルギーの予測値の不確かさを予測する機械学習モデルを用いる従来技術では、不確かさを予測するために複数のニューラルネットワークを必要とする。すなわち、この従来技術は、能動学習のために複数のニューラルネットワークを用意する必要があり、能動学習による訓練コストが高いという問題がある。
【0007】
一つの側面として、開示の技術は、なるべく少ないラベル付きデータで機械学習モデルの精度を向上させるための能動学習による訓練コストを抑制することを目的とする。
【課題を解決するための手段】
【0008】
一つの態様として、開示の技術は、第2機械学習モデルに基づいて、複数のラベル無しデータの各々に対する前記第1機械学習モデルの予測誤差を予測する。第2機械学習モデルは、複数のデータと、前記複数のデータの各々に対する第1機械学習モデルの予測誤差との組を訓練データとして用いて訓練されている。そして、開示の技術は、予測された前記予測誤差に基づいて、前記複数のラベル無しデータから選択したラベル無しデータに正解ラベルを付与してラベル付きデータを生成し、生成した前記ラベル付きデータを用いて、前記第1機械学習モデルを再訓練する。
【発明の効果】
【0009】
一つの側面として、なるべく少ないラベル付きデータで機械学習モデルの精度を向上させるための能動学習による訓練コストを抑制することができる、という効果を有する。
【図面の簡単な説明】
【0010】
分子のエネルギー予測のNNについて説明するための図である。
背景技術を説明するための図である。
背景技術における不確かさ予測NNを説明するための図である。
本実施形態に係る能動学習装置の機能ブロック図である。
エネルギー予測モデルを説明するための図である。
誤差予測モデルを説明するための図である。
DFTによるエネルギーの計算値と、エネルギー予測モデルによるエネルギーの予測値との関係の一例を示す図である。
能動学習装置として機能するコンピュータの概略構成を示すブロック図である。
能動学習処理の一例を示すフローチャートである。
能動学習装置における処理の概略を示す図である。
本手法の効果についての検証結果を示す図である。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

富士通株式会社
予測
8日前
富士通株式会社
プロセッサ
15日前
富士通株式会社
シーン検出
8日前
富士通株式会社
異常な挙動の検出
16日前
富士通株式会社
冷却部品、及び冷却装置
2日前
富士通株式会社
機械学習方法および情報処理装置
16日前
富士通株式会社
画像視角変化類型検出装置と方法
16日前
富士通株式会社
異常検知装置および異常検知方法
15日前
富士通株式会社
能動学習プログラム、方法、及び装置
1日前
富士通株式会社
ネットワーク装置及びモデル学習方法
15日前
富士通株式会社
光伝送装置および送信光パワー制御方法
9日前
富士通株式会社
サーバ監視システムおよびサーバ監視方法
1日前
富士通株式会社
支援プログラム、支援方法及び情報処理装置
15日前
富士通株式会社
評価プログラム、評価方法および情報処理装置
8日前
富士通株式会社
制御プログラム、制御方法および制御システム
22日前
富士通株式会社
推定プログラム、推定方法、及び情報処理装置
15日前
富士通株式会社
生成プログラム、生成方法および情報処理装置
8日前
富士通株式会社
データ処理装置、プログラム及びデータ処理方法
5日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
8日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
9日前
富士通株式会社
割当制御プログラム、割当制御方法および情報処理装置
22日前
富士通株式会社
データ処理装置、データ処理プログラム及びデータ処理方法
15日前
富士通株式会社
通知先決定プログラム、通知先決定方法及び通知先決定装置
8日前
富士通株式会社
機械学習パイプライン部品判定プログラム、方法、及び装置
16日前
富士通株式会社
光送信器、これを用いた光トランシーバ、及び波長制御方法
9日前
富士通株式会社
アバター生成プログラム、アバター生成方法および情報処理装置
8日前
富士通株式会社
レポート作成プログラム、レポート作成方法、レポート作成装置
15日前
富士通株式会社
データ管理プログラム、データ管理装置、およびデータ管理システム
16日前
個人
情報提示方法
1か月前
個人
自動精算システム
1か月前
個人
RFタグ読取装置
1か月前
個人
プログラム
22日前
個人
アカウントマップ
23日前
個人
プログラム
29日前
個人
売買システム
1か月前
個人
管理サーバ
1か月前
続きを見る