TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024170949
公報種別
公開特許公報(A)
公開日
2024-12-11
出願番号
2023087740
出願日
2023-05-29
発明の名称
機械学習プログラム、機械学習方法および情報処理装置
出願人
富士通株式会社
代理人
弁理士法人扶桑国際特許事務所
主分類
G06N
20/00 20190101AFI20241204BHJP(計算;計数)
要約
【課題】機械学習モデルの予測精度を向上させる。
【解決手段】情報処理装置10は、データサンプル14a,14b,14cそれぞれを機械学習モデル13に入力することで、特徴量15a,15b,15cを機械学習モデル13から抽出する。情報処理装置10は、特徴量15a,15b,15cを正規化特徴量16a,16b,16cに正規化する。情報処理装置10は、正規化特徴量16a,16b,16cに基づいて、データサンプル14a,14b,14cの中から、データサンプル14a,14b,14cの一部である1以上のデータサンプルを選択する。情報処理装置10は、1以上のデータサンプルを用いて、機械学習モデル13を訓練する。
【選択図】図1
特許請求の範囲
【請求項1】
複数のデータサンプルそれぞれを機械学習モデルに入力することで、前記複数のデータサンプルそれぞれに対応する複数の特徴量を前記機械学習モデルから抽出し、
前記複数の特徴量それぞれを、一定の数値範囲に収まる複数の正規化特徴量に正規化し、
前記複数の正規化特徴量に基づいて、前記複数のデータサンプルの中から、前記複数のデータサンプルの一部である1以上のデータサンプルを選択し、
前記1以上のデータサンプルを用いて、前記機械学習モデルを訓練する、
処理をコンピュータに実行させる機械学習プログラム。
続きを表示(約 970 文字)
【請求項2】
前記機械学習モデルは、グラフデータが示す複数のノードの接続関係に基づいて前記複数のノードそれぞれの特徴量を更新するグラフニューラルネットワークを含み、前記複数の特徴量は、前記グラフニューラルネットワークを通過した後の特徴量である、
請求項1記載の機械学習プログラム。
【請求項3】
前記1以上のデータサンプルの選択は、主成分分析により、前記複数の正規化特徴量それぞれを複数の主成分特徴量に変換し、前記複数の主成分特徴量の間の距離に基づいて、前記1以上のデータサンプルを選択する処理を含む、
請求項1記載の機械学習プログラム。
【請求項4】
前記機械学習モデルは、複数の原子を含む分子を示す分子データから分子エネルギーを予測し、前記複数の特徴量は、前記複数の原子に対して算出される特徴量である、
請求項1から3の何れか一項に記載の機械学習プログラム。
【請求項5】
複数のデータサンプルそれぞれを機械学習モデルに入力することで、前記複数のデータサンプルそれぞれに対応する複数の特徴量を前記機械学習モデルから抽出し、
前記複数の特徴量それぞれを、一定の数値範囲に収まる複数の正規化特徴量に正規化し、
前記複数の正規化特徴量に基づいて、前記複数のデータサンプルの中から、前記複数のデータサンプルの一部である1以上のデータサンプルを選択し、
前記1以上のデータサンプルを用いて、前記機械学習モデルを訓練する、
処理をコンピュータが実行する機械学習方法。
【請求項6】
複数のデータサンプルと機械学習モデルとを記憶する記憶部と、
前記複数のデータサンプルそれぞれを前記機械学習モデルに入力することで、前記複数のデータサンプルそれぞれに対応する複数の特徴量を前記機械学習モデルから抽出し、前記複数の特徴量それぞれを、一定の数値範囲に収まる複数の正規化特徴量に正規化し、前記複数の正規化特徴量に基づいて、前記複数のデータサンプルの中から、前記複数のデータサンプルの一部である1以上のデータサンプルを選択し、前記1以上のデータサンプルを用いて、前記機械学習モデルを訓練する処理部と、
を有する情報処理装置。
発明の詳細な説明
【技術分野】
【0001】
本発明は機械学習プログラム、機械学習方法および情報処理装置に関する。
続きを表示(約 1,300 文字)
【背景技術】
【0002】
コンピュータは、訓練された機械学習モデルを用いて、説明変数に相当する入力データから目的変数に相当する予測データを生成することがある。コンピュータは、説明変数に相当する入力データと目的変数に相当する正解ラベルとをそれぞれ対応付けた複数のデータサンプルを用いて、機械学習によって機械学習モデルを訓練することがある。
【0003】
機械学習モデルは、入力データから、入力データの特徴を表す特徴量を算出することがあり、算出された特徴量を用いて予測データを生成することがある。特徴量の算出には、ニューラルネットワークが用いられることがある。
【0004】
また、機械学習モデルは、計算量が大きいコンピュータシミュレーションのシミュレーション結果を、短時間で予測するために用いられることがある。このような機械学習モデルは、代替モデル(サロゲートモデル)と呼ばれることがある。例えば、グラフ畳み込みニューラルネットワークを用いて、剛性マトリクスと力ベクトルとから変位ベクトルを予測する構造解析シミュレーションが提案されている。
【先行技術文献】
【特許文献】
【0005】
特開2023-9904号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
データセットに含まれるデータサンプルが多い場合、全てのデータサンプルを用いて機械学習モデルを訓練することは、コンピュータの負荷を増大させて訓練時間を長くするおそれがある。そこで、コンピュータは、データセットから一部のデータサンプルを選択し、選択されたデータサンプルを用いて機械学習モデルを訓練することが考えられる。
【0007】
このとき、どの様に一部のデータサンプルを選択するかが重要である。データサンプル数が同じであっても、何れのデータサンプルを選択するかによって、訓練された機械学習モデルの予測精度が異なることがある。そこで、1つの側面では、本発明は、機械学習モデルの予測精度を向上させることを目的とする。
【課題を解決するための手段】
【0008】
1つの態様では、以下の処理をコンピュータに実行させる機械学習プログラムが提供される。複数のデータサンプルそれぞれを機械学習モデルに入力することで、複数のデータサンプルそれぞれに対応する複数の特徴量を機械学習モデルから抽出する。複数の特徴量それぞれを、一定の数値範囲に収まる複数の正規化特徴量に正規化する。複数の正規化特徴量に基づいて、複数のデータサンプルの中から、複数のデータサンプルの一部である1以上のデータサンプルを選択する。1以上のデータサンプルを用いて、機械学習モデルを訓練する。
【0009】
また、1つの態様では、コンピュータが実行する機械学習方法が提供される。また、1つの態様では、記憶部と処理部とを有する情報処理装置が提供される。
【発明の効果】
【0010】
1つの側面では、機械学習モデルの予測精度が向上する。
【図面の簡単な説明】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
他の特許を見る