TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025037142
公報種別公開特許公報(A)
公開日2025-03-17
出願番号2023143924
出願日2023-09-05
発明の名称学習装置、方法およびプログラム
出願人株式会社東芝
代理人弁理士法人鈴榮特許綜合事務所
主分類G06N 20/00 20190101AFI20250310BHJP(計算;計数)
要約【課題】モデルの学習を効率的に行うこと。
【解決手段】一実施形態に係る学習装置は、取得部と、重要度算出部と、学習データ生成部と、学習部とを備える。取得部は、複数の対象データと、複数の対象データに対応する複数の付帯データとを取得する。重要度算出部は、複数の付帯データの分布に基づいて、複数の対象データのそれぞれの重要度を算出する。学習データ生成部は、複数の対象データ毎に、重要度に応じた学習データ数を決定し、学習データ数の複数の学習データを生成する。学習部は、複数の対象データ毎の複数の学習データを教師なし学習することによって学習モデルを反復学習する。
【選択図】図1

特許請求の範囲【請求項1】
複数の対象データと、前記複数の対象データに対応する複数の付帯データとを取得する取得部と、
前記複数の付帯データの分布に基づいて、前記複数の対象データのそれぞれの重要度を算出する重要度算出部と、
前記複数の対象データ毎に、前記重要度に応じた学習データ数を決定し、前記学習データ数の複数の学習データを生成する学習データ生成部と、
前記複数の対象データ毎の前記複数の学習データを教師なし学習することによって学習モデルを反復学習する学習部と
を具備する、学習装置。
続きを表示(約 810 文字)【請求項2】
前記重要度算出部は、発生頻度が低い対象データに対応する付帯データの重要度を大きく算出する、
請求項1に記載の学習装置。
【請求項3】
前記重要度算出部は、前記複数の付帯データを分類した頻度に反比例するように前記重要度を算出する、
請求項1に記載の学習装置。
【請求項4】
前記重要度算出部は、前記分布の平均または中央から離れている付帯データほど前記重要度を大きく算出する、
請求項1に記載の学習装置。
【請求項5】
前記学習データ生成部は、前記重要度が大きい対象データほど前記学習データ数を大きく決定する、
請求項1に記載の学習装置。
【請求項6】
前記分布は、正規分布であり、
前記重要度算出部は、前記正規分布の確率密度関数に基づいて前記重要度を算出する、
請求項1に記載の学習装置。
【請求項7】
前記学習部は、前記複数の対象データのうちの異なる対象データから得られた第1の特徴ベクトルと第2の特徴ベクトルとの誤差が大きいほど損失が小さくなる手法を用いて前記損失を計算する、
請求項1に記載の学習装置。
【請求項8】
特徴ベクトルを異なる複数の成分で表した相関図を表示させる表示制御部
を更に具備する。
請求項1に記載の学習装置。
【請求項9】
前記表示制御部は、前記相関図と、前記相関図上で選択された座標点に対応する学習データとを表示させる、
請求項8に記載の学習装置。
【請求項10】
前記表示制御部は、前記相関図と、前記相関図上で選択された座標点を含むクラスタに対応する複数の学習データとを表示させる、
請求項8に記載の学習装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明の実施形態は、学習装置、方法およびプログラムに関する。
続きを表示(約 1,900 文字)【背景技術】
【0002】
従来、付帯データとして予後情報が紐づいた病理画像をパッチ分割して教師なし学習を行い、教師なし学習によって得られたパッチ画像の特徴ベクトルと付帯データとの関係からそれぞれのパッチ画像を分類し、付帯データに関係するパッチ画像を提示する技術が知られている。
【0003】
上記技術において、付帯情報は必ずしも教師なし学習に好適な分布をしているとは限らない。例えば、データの少ない付帯情報に関心がある場合に学習効率が低下する場合がある。具体的には、学習対象が上述の病理画像の場合、全体として、病気が進行していない(或いは病気のない)病理画像の割合が多くなることが多い。また、病気が進行している病理画像でも、病変している箇所は一部であり、残りの多くの箇所は異常がないことが多い。このようなことから、病理画像をパッチ分割して生成したパッチ画像群も異常なしの画像パターンが殆どであり、マイノリティであるものの注目したい局所的な異常パターンを抽出するためには、モデルの学習時間が長くなるという問題がある。
【先行技術文献】
【特許文献】
【0004】
国際公開第2020/066257号
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明が解決しようとする課題は、モデルの学習を効率的に行うことができる学習装置、方法およびプログラムを提供することである。
【課題を解決するための手段】
【0006】
一実施形態に係る学習装置は、取得部と、重要度算出部と、学習データ生成部と、学習部とを備える。取得部は、複数の対象データと、複数の対象データに対応する複数の付帯データとを取得する。重要度算出部は、複数の付帯データの分布に基づいて、複数の対象データのそれぞれの重要度を算出する。学習データ生成部は、複数の対象データ毎に、重要度に応じた学習データ数を決定し、学習データ数の複数の学習データを生成する。学習部は、複数の対象データ毎の複数の学習データを教師なし学習することによって学習モデルを反復学習する。
【図面の簡単な説明】
【0007】
実施形態に係る学習装置の構成を例示するブロック図。
実施形態における特性値および確率密度の関係を例示するグラフ。
実施形態における特性値および画像数の関係を例示するグラフ。
図1の学習部の具体的な構成を例示するブロック図。
図4の損失算出部の具体的な構成を例示するブロック図。
実施形態に係る学習装置の動作を例示するフローチャート。
従来の手法による学習進捗毎に特徴ベクトルを可視化した散布図。
実施形態の手法による学習進捗毎に特徴ベクトルを可視化した散布図。
実施形態の変形例における特性値を反映させた散布図を含む表示データの例。
実施形態の変形例における特性値を反映させた散布図とパッチ画像とを含む表示データの例。
実施形態の変形例における特徴クラスタラベルを反映させた散布図とパッチ画像群とを含む表示データの例。
一実施形態に係るコンピュータのハードウェア構成を例示するブロック図。
【発明を実施するための形態】
【0008】
以下、図面を参照しながら、学習装置の実施形態について詳細に説明する。実施形態では、製品(例えば、アルミナを焼結した基板)の断面を走査電子顕微鏡(Scanning Electron Microscope:SEM)などによって撮影した画像(以降、SEM像)を、教師なし学習によってクラスタリングする機械学習の学習モデルを例に説明する。また、機械学習として、例えば、ニューラルネットワークを利用するものとする。即ち、実施形態の学習モデルは、ニューラルネットワークモデルである。
【0009】
(実施形態)
図1は、実施形態に係る学習装置100の構成を例示するブロック図である。学習装置100は、機械学習の学習モデルを教師なし学習することによって学習済みモデルを生成するためのコンピュータである。学習装置100は、取得部110と、重要度算出部120と、学習データ生成部130と、学習部140と、表示制御部150とを備える。
【0010】
取得部110は、複数の対象データと、複数の対象データに対応する複数の付帯データとを取得する。取得部110は、複数の付帯データを重要度算出部120へと出力し、複数の対象データを学習データ生成部130へと出力する。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

株式会社東芝
センサ
11日前
株式会社東芝
発券機
1日前
株式会社東芝
センサ
25日前
株式会社東芝
回転電機
11日前
株式会社東芝
電子装置
25日前
株式会社東芝
電子機器
18日前
株式会社東芝
遮断装置
25日前
株式会社東芝
計測装置
19日前
株式会社東芝
電子機器
18日前
株式会社東芝
計算装置
1か月前
株式会社東芝
電源回路
1か月前
株式会社東芝
計算装置
6日前
株式会社東芝
計算装置
6日前
株式会社東芝
試験装置
今日
株式会社東芝
半導体装置
2か月前
株式会社東芝
半導体装置
11日前
株式会社東芝
半導体装置
15日前
株式会社東芝
水処理装置
1か月前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
6日前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
11日前
株式会社東芝
ガス遮断器
1か月前
株式会社東芝
穴検出装置
19日前
株式会社東芝
ICカード
1か月前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
1か月前
株式会社東芝
蓄電池装置
1か月前
株式会社東芝
半導体装置
29日前
株式会社東芝
半導体装置
25日前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
26日前
続きを見る