TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025025505
公報種別公開特許公報(A)
公開日2025-02-21
出願番号2023130323
出願日2023-08-09
発明の名称分散学習システムおよび学習データ評価方法
出願人株式会社日立製作所
代理人青稜弁理士法人
主分類G06N 3/098 20230101AFI20250214BHJP(計算;計数)
要約【課題】中央サーバーを用いない分散システムにおいて、任意の計算機が自身が格納する学習データの除外することが、分散学習によって得られる全計算機の機械学習モデルの性能の合計に与える影響を評価する。
【解決手段】分散学習システムは、一つ以上の分散学習装置が通信可能なようにネットワークで接続されていて、分散学習装置は、学習モデル情報に学習済みパラメータを含む。検証データは、分散学習装置の各々が保持する学習データに含まれない評価対象データを一つ以上有し、分散学習装置は、それに接続された他の分散学習装置から各々の分散学習装置における検証データの損失の総和に基づいた受渡値を受信し、学習済みパラメータと評価対象データを引数とする損失関数の勾配と、受渡値とにより、評価対象データに対する学習における寄与値を推定する。
【選択図】 図5
特許請求の範囲【請求項1】
一つ以上の分散学習装置が通信可能なようにネットワークで接続された分散学習システムであって、
前記分散学習装置は、
学習データと、
検証データと、
学習に関する学習モデル情報とを保持し、
前記学習モデル情報は、機械学習モデル構造情報とモデルパラメータとを含み、
学習済みパラメータは、前記分散学習システムのモデルパラメータと学習データを引数とする損失関数の前記分散学習システムの分散学習装置にわたる総和を最小化するモデルパラメータであり、
前記検証データは、前記分散学習装置の各々が保持する学習データに含まれない評価対象データを一つ以上有し、
前記分散学習装置は、前記分散学習装置に接続された自他の分散学習装置から各々の分散学習装置における検証データの損失の総和に基づいた受渡値を受信し、
前記学習済みパラメータと前記評価対象データを引数とする損失関数の勾配と、前記受渡値とにより、前記評価対象データに対する学習における寄与値を推定することを特徴とする分散学習システム。
続きを表示(約 1,300 文字)【請求項2】
前記受渡値は、複数のステップにより計算され、
あるステップの受渡値は、
直前のステップにおける前記分散学習装置の受渡値と直前のステップにおける自他の分散学習装置から受信した受渡値とにそれぞれ重み付けた値の総和と、
前記学習済みパラメータと前記分散学習装置の学習データを引数とする損失関数の二階微分の行列と直前のステップにおける前記分散学習装置の受渡値をかけた値の全ての学習データにわたる総和と、
前記学習済みパラメータと前記分散学習装置の検証データの損失関数の勾配の全ての検証データにわたる総和とに基づいて計算されることを特徴とする請求項1記載の分散学習システム。
【請求項3】
前記評価対象データに対して、推定された寄与値に基づいて、前記学習データを修正することを特徴とする請求項1記載の分散学習システム。
【請求項4】
前記評価対象データに対して、推定された寄与値を表示し、前記学習データを修正する入力手段を有することを特徴とする請求項1記載の分散学習システム。
【請求項5】
一つ以上の分散学習装置が通信可能なようにネットワークで接続された分散学習システムの学習データ評価方法であって、
前記分散学習装置は、
学習データと、
検証データと、
学習に関する学習モデル情報とを保持し、
前記学習モデル情報は、機械学習モデル構造情報とモデルパラメータとを含み、
学習済みパラメータは、前記分散学習システムのモデルパラメータと学習データを引数とする損失関数の前記分散学習システムの分散学習装置にわたる総和を最小化するモデルパラメータであり、
前記検証データは、前記分散学習装置の各々が保持する学習データに含まれない評価対象データを一つ以上有し、
前記分散学習装置は、前記分散学習装置に接続された他の分散学習装置から各々の分散学習装置における検証データの損失の総和に基づいた受渡値を受信するステップと、
前記分散学習装置は、前記学習済みパラメータと前記評価対象データを引数とする損失関数の勾配と、前記受渡値とにより、前記評価対象データに対する学習における寄与値を推定するステップを有することを特徴とする学習データ評価方法。
【請求項6】
前記受渡値は、複数のステップにより計算され、
あるステップの受渡値は、
直前のステップにおける前記分散学習装置の受渡値と直前のステップにおける他の分散学習装置から受信した受渡値とにそれぞれ重み付けた値の総和と、
前記学習済みパラメータと前記分散学習装置の学習データを引数とする損失関数の二階微分の行列と直前のステップにおける前記分散学習装置の受渡値をかけた値の全ての学習データにわたる総和と、
前記学習済みパラメータと前記分散学習装置の検証データの損失関数の勾配の全ての検証データにわたる総和とに基づいて計算されることを特徴とする請求項5記載の学習データ評価方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、分散学習システムおよび学習データ評価方法に係り、特に、教師データあり機械学習に関して、分散型の計算機システムに適した学習データの学習に関する寄与度を評価するのに好適な分散学習システムおよび学習データ評価方法に関する。
続きを表示(約 2,400 文字)【背景技術】
【0002】
教師データあり機械学習は、大量の学習データを学習することにより、解決しようとする問題の推論のための学習モデルを最適なものに近づけていくことにより、計算機により最適な問題解決を図る手法である。
【0003】
そのときに、学習データとして最適なものを与えることで、ユーザに対して、より性能の高い学習モデルを与えることができる。そのために、学習データの学習に対する寄与度という概念を導入することが考えられる。
【0004】
機械学習システムに対して、寄与度という概念を用いた技術は、例えば、特許文献1がある。特許文献1の記載された技術では、機械学習システムでは、評価対象データは、初期データ群に対して追加又は除外するデータであり、寄与度計算部が、学習モデルによる出力値と、初期データ群に対して評価対象データを追加又は除外して学習した再学習モデルによる出力値とに基づいて、評価対象データが学習モデルの性能に与える影響を評価する寄与度を計算するとしている。
【0005】
これにより、学習データに対する評価対象データの除外及び追加が機械学習モデルの性能に与える影響の良否を知り得ることができるとしている。
【0006】
また、パラメータの予測に対する影響を影響関数(influence function)として評価する技術が、非特許文献1に開示されている。
【0007】
非特許文献1には、「影響関数が専門家に注意を惹起させて、実際に役立つ事項のみを検査することができることを説明する」(We show that influence functions can help human experts prioritize their attention, allowing them to inspect only the examples that actually matter)という記載と、「L
up,loss
(Z

,Z

)により、Z

の影響を測定する。これにより、訓練データセットから、Z

を削除した場合のZ

に発生する誤差を近似する」(we measure the influence of Z
i
with L
up,loss
(Z
i
,Z
i
), which approximates the error incurred on Z
i
if we remove Z
i
from the training set)との記載がある(いずれも、5.4 Fixing mislabeled examples)。
【0008】
また、非特許文献2には、中央サーバーと複数の計算機間の通信を介して実行される機械学習において、ある計算機を除外することにより、機械学習で得られるモデルの性能に与える影響を推定する技術が記載されている。非特許文献2には、「広範な研究が、グローバルモデルのパフォーマンス保証について行われているが、個々のクライアントが共同トレーニングプロセスにどのような影響を与えるかは、いまだに明らかにされていない。この研究では、モデルパラメータに対するこの影響を定量化するために『Fed-Influence』と呼ばれる新しい概念を定義し、この指標を推定するための効果的かつ効率的なアルゴリズムを提案する。」(Extensive works have studied the performance guarantee of the global model however, it is still unclear how each individual client influences the collaborative training process. In this work, we defined a new notion, called Fed-Influence, to quantify this influence over the model parameters, and proposed an effective and efficient algorithm to estimate this metric.)との記載(Abstracts)と、「集中型の学習のサーバーは、影響を評価するものとして、考慮されるサンプリングデータを完全にコントロールできるが、一方、連合学習では、サーバーは、プライバシーの要請のために、クライアントのデータにアクセスできない。(The server in centralized learning, as the influence evaluator, has the full control over the considered sampling data, while in federated learning, the server would not be able to access clients’ raw data because of the privacy requirement)との記載(Introduction)がある。
【0009】
また、複数のエージェントによる分散最適化に関する技術については、非特許文献3に開示がある。
【先行技術文献】
【特許文献】
【0010】
特開2021-149842号公報
【非特許文献】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
情報提示方法
1か月前
個人
プログラム
1か月前
個人
プログラム
1か月前
株式会社理研
演算装置
4日前
個人
アカウントマップ
1か月前
個人
日本語入力支援システム
4日前
個人
発想支援方法及びシステム
1か月前
個人
AI旅行最適化プラグイン
3日前
個人
分類処理プログラム及び方法
1か月前
個人
学習装置及び推論装置
1か月前
個人
案件管理装置および端末装置
18日前
株式会社発明屋
電池指向の構造設計
25日前
富士通株式会社
金融システム
1か月前
トヨタ自動車株式会社
管理装置
26日前
キヤノン株式会社
情報処理装置
4日前
株式会社プレニーズ
仲介システム
1か月前
富士通株式会社
プロセッサ
24日前
トヨタ自動車株式会社
電気自動車
10日前
株式会社イズミ
総合代行システム
14日前
個人
ダブルオークションシステム
14日前
村田機械株式会社
人員配置システム
1か月前
富士通株式会社
予測
17日前
トヨタ自動車株式会社
生成装置
1か月前
合同会社IPマネジメント
料金収受システム
17日前
株式会社SUBARU
車両用操作装置
10日前
ローム株式会社
半導体集積回路
今日
マクセル株式会社
リーダライタ用ホルダ
17日前
個人
株式投資コンペティションシステム
17日前
西日本電信電話株式会社
分析装置
17日前
株式会社アジラ
行動体存在推定システム
24日前
個人
収納装置および収納システム
3日前
トヨタ自動車株式会社
電池性能推定方法
17日前
トヨタ自動車株式会社
情報処理装置
1か月前
トヨタ自動車株式会社
駐車場発電システム
1か月前
旭精工株式会社
自動サービス装置、管理システム
1か月前
日清紡マイクロデバイス株式会社
二乗回路
25日前
続きを見る