TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025006956
公報種別
公開特許公報(A)
公開日
2025-01-17
出願番号
2023108028
出願日
2023-06-30
発明の名称
学習予測装置、学習予測方法および学習予測プログラム
出願人
国立大学法人九州大学
,
学校法人杏林学園
,
キヤノンメディカルシステムズ株式会社
代理人
弁理士法人鈴榮特許綜合事務所
主分類
G06N
20/00 20190101AFI20250109BHJP(計算;計数)
要約
【課題】モデルの訓練を支援すること。
【解決手段】本実施形態に係る学習予測装置は、算出部と、判定部と、出力部とを含む。算出部は、機械学習モデルを特徴づける多次元データと前記多次元データに関連する関連データとを算出する。判定部は、前記多次元データおよび前記関連データが所定の基準に適合するか否かに基づき、データセットによる前記機械学習モデルの学習状況の判定を支援する支援情報を生成する。出力部は、前記支援情報を出力する。
【選択図】図1
特許請求の範囲
【請求項1】
機械学習モデルを特徴づける多次元データと前記多次元データに関連する関連データとを算出する算出部と、
前記多次元データおよび前記関連データが所定の基準に適合するか否かに基づき、データセットによる前記機械学習モデルの学習状況の判定を支援する支援情報を生成する判定部と、
前記支援情報を出力する出力部と、
を具備する学習予測装置。
続きを表示(約 1,100 文字)
【請求項2】
前記出力部は、前記多次元データおよび前記支援情報をGUI(Graphical User Interface)上に表示する、請求項1に記載の学習予測装置。
【請求項3】
ユーザから前記機械学習モデルの訓練を実行するためのフレームワーク種別の選択結果を取得する取得部をさらに具備する、請求項1に記載の学習予測装置。
【請求項4】
前記出力部は、前記フレームワークに対するプラグインコードの作成ボタンが配置されるGUI(Graphical User Interface)を表示し、
前記取得部は、前記作成ボタンが押下されることにより、ユーザからの作成指示を取得し、
前記算出部は、前記作成指示の取得に応じて、前記機械学習モデルの訓練に関する前記プラグインコードを作成する、請求項3に記載の学習予測装置。
【請求項5】
データセットおよび損失関数を用いて、機械学習モデルを訓練する訓練部と、
前記機械学習モデルを特徴づける多次元データと前記多次元データに関連する関連データとを算出する算出部と、
前記多次元データおよび前記関連データが所定の基準に適合するか否かに基づき、前記データセットによる前記機械学習モデルの学習状況を判定する判定部と、
を具備する学習予測装置。
【請求項6】
前記多次元データは、前記機械学習モデルの訓練において利用される損失関数の変化率を特徴づける行列の前記データセットに関する固有値集合であり、
前記関連データは、前記固有値集合に関する境界値である、請求項1または請求項5に記載の学習予測装置。
【請求項7】
前記判定部は、前記固有値集合のうちの前記境界値以上の値を有する1以上の固有値が前記所定の基準に適合する場合、前記データセットによる訓練で十分であると判定する、請求項6に記載の学習予測装置。
【請求項8】
前記判定部は、前記境界値以上の値を有する前記1以上の固有値が前記所定の基準に適合しない場合、前記データセットによる訓練では不十分であると判定する、請求項6に記載の学習予測装置。
【請求項9】
前記所定の基準は、前記境界値以上の値を有する前記1以上の固有値の数が閾値以上である、請求項6に記載の学習予測装置。
【請求項10】
前記データセットによる訓練では不十分であると判定された場合、データの追加取得が必要である旨を出力する出力部をさらに具備する、請求項8に記載の学習予測装置。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本明細書及び図面に開示の実施形態は、学習予測装置、学習予測方法および学習予測プログラムに関する。
続きを表示(約 2,600 文字)
【背景技術】
【0002】
機械学習では、学習性能を予測したいニーズがある。学習性能の予測としては、一例として汎化誤差を推定して汎化性能を判定できればよく、推定すべきパラメータの数に対して入力データ数が十分に多い場合は、例えば古典的な統計学における中心極限定理に基づき汎化誤差(汎化性能)の推定は可能となる。しかし、深層ニューラルネットワークなどの一般的な機械学習モデルでは、推定すべきパラメータ数に対して入力データ数が大幅に少ないことが多いため、古典的な統計学に基づく推定をそのまま適用できない。そのため、十分な学習データを収集できない場合、汎化誤差の推定は難しく、例えばモデルの学習において追加の学習データがどれくらい必要であるかを見積もることが難しい。
また、仮に数学的にこの見積もりがなしえたとしても、それをユーザが理解できなければ追加の学習データを集める実作業を進めることは難しい。
【先行技術文献】
【非特許文献】
【0003】
Z.Liao et al., “Approximate Fisher Information Matrix to Characterize the Training of Deep Neural Networks”, IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 42, no. 1, pp. 15-26, 2020.
Y. Takeishi, et al., “Approximate Spectral Decomposition of Fisher Information Matrix for Simple ReLU Networks” [Online], 2021年11月30日,[2023年5月16日検索]、インターネット<URL:https://arxiv.org/pdf/2111.15256>
Jacot et al., “Neural Tangent Kernel: Convergence and Generalization in Neural Networks” [Online], 2020年2月10日,[2023年5月24日検索]、インターネット<URL:https://arxiv.org/pdf/1806.07572>
Hidenori Takeshima, “Deep Learning and Its Application to Function Approximation for MR in Medicine: An Overview”、[Online]、2021年9月17日、Magnetic Resonance in Medical Sciences、[2023年4月24日検索]、インターネット<URL:https://doi.org/10.2463/mrms.rev.2021-0040>
【発明の概要】
【発明が解決しようとする課題】
【0004】
本明細書及び図面に開示の実施形態が解決しようとする課題の一つは、モデルの訓練を支援するための情報をユーザが理解しやすい形で提示すること、およびその裏付けとなる数学的根拠を確立させることである。ただし、本明細書及び図面に開示の実施形態により解決しようとする課題は上記課題に限られない。後述する実施形態に示す各構成による各効果に対応する課題を他の課題として位置づけることもできる。
【課題を解決するための手段】
【0005】
本実施形態に係る学習予測装置は、算出部と、判定部と、出力部とを含む。算出部は、機械学習モデルを特徴づける多次元データと前記多次元データに関連する関連データとを算出する。判定部は、前記多次元データおよび前記関連データが所定の基準に適合するか否かに基づき、データセットによる前記機械学習モデルの学習状況の判定を支援する支援情報を生成する。出力部は、前記支援情報を出力する。
【図面の簡単な説明】
【0006】
図1は、本実施形態に係る学習予測装置を示すブロック図である。
図2は、本実施形態に係る学習予測装置の動作の一例を示すフローチャートである。
図3は、本実施形態に係る学習予測装置の操作および出力に関するグラフィカルユーザインタフェース(GUI)の一例を示す図である。
図4は、学習予測装置の訓練処理の詳細を示すフローチャートである。
図5は、本実施形態に係る固有値分布の第1例を示す図である。
図6は、本実施形態に係る固有値分布の第2例を示す図である。
【発明を実施するための形態】
【0007】
以下、図面を参照しながら本実施形態に係る学習予測装置、学習予測方法および学習予測プログラムについて説明する。以下の実施形態では、同一の参照符号を付した部分は同様の動作をおこなうものとして、重複する説明を適宜省略する。以下、一実施形態について図面を用いて説明する。
【0008】
本実施形態に係る学習予測装置について図1のブロック図を参照して説明する。
本実施形態に係る学習予測装置1は、処理回路10と、メモリ11と、入力インタフェース12と、通信インタフェース13と、ディスプレイ14とを含む。
【0009】
処理回路10は、取得機能101と、訓練機能102と、算出機能103と、判定機能104と、出力機能105とを含む。
【0010】
取得機能101は、ユーザからの入力情報を取得する。また、取得機能101は、データセットおよび機械学習モデルを取得する。データセットは、訓練データとなるデータであり、例えば医用画像を想定する。なお、医用画像に限らず、他の2次元データでもよいし、音声データ、センサデータなどの1次元データであってもよい。機械学習モデルは、多層パーセプトロン、畳み込みニューラルネットワーク、ResNet、DenseNetなどのショートカット構造を有するニューラルネットワークなど機械学習分野で用いられるどのようなネットワーク構造でもよい。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
国立大学法人九州大学
金及び/又は銀の回収方法
29日前
国立大学法人九州大学
重水素化化合物の製造方法
29日前
国立大学法人九州大学
化学反応装置および化学反応方法
29日前
株式会社安藤・間
廃棄物埋立て方法
11日前
株式会社安藤・間
焼却残渣処分方法
11日前
国立大学法人九州大学
固体電解質、積層体、及び、燃料電池
8日前
国立大学法人九州大学
ガラクトシルセラミドの製造方法及び糸状菌
24日前
株式会社不動テトラ
地盤改良効果の解析方法
22日前
株式会社アキモ
包装容器入り浅漬けおよびその製造方法
1か月前
国立大学法人九州大学
無隔膜式アルカリ水電解方法及び無隔膜式アルカリ水電解装置
23日前
富士電機株式会社
回転機の固定子
1か月前
日本電信電話株式会社
レーザ駆動回路、およびレーザ駆動方法
1か月前
国立大学法人九州大学
有機エレクトロルミネッセンス素子、その設計方法およびプログラム
3日前
国立大学法人九州大学
フォトン・アップコンバージョン多孔質体およびその製造方法、光照射方法、光照射用流路
22日前
愛知電機株式会社
抽出溶媒系廃棄物の減容化方法
1か月前
株式会社 レオロジー機能食品研究所
筋肉増強剤、筋肉増強用経口組成物及びプラズマローゲンの使用
1か月前
国立大学法人九州大学
アルミニウム合金材およびアルミニウム合金材の水素脆化防止剤
1か月前
国立大学法人九州大学
PPRモチーフを利用したRNA結合性蛋白質の設計方法及びその利用
1か月前
個人
プログラム
1か月前
株式会社理研
演算装置
1か月前
個人
情報検索システム
10日前
個人
日本語入力支援システム
1か月前
個人
AI旅行最適化プラグイン
1か月前
個人
確率場データ同化演算手法
22日前
キヤノン株式会社
電子機器
9日前
シャープ株式会社
電子機器
23日前
個人
技術実行管理システム
24日前
キヤノン株式会社
電子機器
9日前
キヤノン株式会社
電子機器
9日前
個人
納骨堂システム
29日前
個人
不動産情報提供システム
19日前
キヤノン電子株式会社
通信システム
2日前
株式会社イノベイト
広告装置
12日前
キヤノン株式会社
情報処理装置
1か月前
トヨタ自動車株式会社
電気自動車
1か月前
合同会社IPマネジメント
内部不正対策
17日前
続きを見る
他の特許を見る