TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024148934
公報種別公開特許公報(A)
公開日2024-10-18
出願番号2023062528
出願日2023-04-07
発明の名称学習方法、学習装置、及びプログラム
出願人国立大学法人 東京大学,トヨタ自動車株式会社
代理人個人
主分類G06N 20/00 20190101AFI20241010BHJP(計算;計数)
要約【課題】一部の学習データに真のラベルを付した学習データセットを用いて全ての学習データに真のラベルを付した学習データセットで機械学習した場合に近い性能の学習モデルを生成する。
【解決手段】本開示に係る学習方法は、生成対象の学習モデルの係数を算出するために用意した、真のラベルを付した正解の学習データについてのデータセット、雑音ラベルを付した学習データについてのデータセットを、それぞれソースドメイン、ターゲットドメインとして入力する。学習方法は、ソースドメインのデータセットとターゲットドメインのデータセットとが同じラベルについて所定の変換式を用いて同じ値となることを条件として、ソースドメイン及びターゲットドメインのデータセットを用いて、各ラベルについての、ソースドメインのデータセットとターゲットドメインのデータセットとの比である重みと、生成対象の学習モデルの係数とを、機械学習により算出する。
【選択図】図1
特許請求の範囲【請求項1】
生成対象の学習モデルの係数を算出するために用意した、真のラベルを付した正解の学習データについてのデータセットを、ソースドメインとして入力し、
前記生成対象の学習モデルの係数を算出するために用意した、雑音ラベルを付した学習データについてのデータセットを、ターゲットドメインとして入力し、
前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとが、同じラベルについて所定の変換式を用いて同じ値となることを条件として、前記ソースドメインのデータセット及び前記ターゲットドメインのデータセットを用いて、各ラベルについての、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとの比である重みと、前記生成対象の学習モデルの係数とを、機械学習により算出する、
学習方法。
続きを表示(約 1,700 文字)【請求項2】
γをγ∈[0,1]を満たすハイパーパラメータ、T
jk
を前記ソースドメインでの(j,k)成分のタスク、


jk
を前記ターゲットドメインでの(j,k)成分のタスク、P
S
を前記ソースドメインでの真のラベルの確率分布、P
T
を前記ターゲットドメインでの雑音ラベルの確率分布、gを前記所定の変換式としての、前記ソースドメイン及び前記ターゲットドメインに共通の学習モデルを表現する関数、hを前記ソースドメインについての学習モデルを表現する関数、lを前記ターゲットドメインについての学習モデルを表現する関数、前記重みの(j,k)成分を下式のw
jk
とし、確率分布P
S
と確率分布P
T
とを合わせるように、前記重みと前記生成対象の学習モデルの係数とを、機械学習により算出する、

jk
=(1-γ){T
jk
-1

T
(h(g(X)))}+γ{


jk
-1

T


Y)}
ここで、


jk
=P

(l(g(X))=j,Y=k)
請求項1に記載の学習方法。
【請求項3】
生成対象の学習モデルの係数を算出するために用意した、真のラベルを付した正解の学習データについてのデータセットを、ソースドメインとして入力し、前記生成対象の学習モデルの係数を算出するために用意した、雑音ラベルを付した学習データについてのデータセットを、ターゲットドメインとして入力する入力部と、
前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとが、同じラベルについて所定の変換式を用いて同じ値となることを条件として、前記ソースドメインのデータセット及び前記ターゲットドメインのデータセットを用いて、各ラベルについての、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとの比である重みと、前記生成対象の学習モデルの係数とを、機械学習により算出する算出部と、
を備えた学習装置。
【請求項4】
前記算出部は、γをγ∈[0,1]を満たすハイパーパラメータ、T
jk
を前記ソースドメインでの(j,k)成分のタスク、


jk
を前記ターゲットドメインでの(j,k)成分のタスク、P
S
を前記ソースドメインでの真のラベルの確率分布、P
T
を前記ターゲットドメインでの雑音ラベルの確率分布、gを前記所定の変換式としての、前記ソースドメイン及び前記ターゲットドメインに共通の学習モデルを表現する関数、hを前記ソースドメインについての学習モデルを表現する関数、lを前記ターゲットドメインについての学習モデルを表現する関数、前記重みの(j,k)成分を下式のw
jk
とし、確率分布P
S
と確率分布P
T
とを合わせるように、前記重みと前記生成対象の学習モデルの係数とを、機械学習により算出する、

jk
=(1-γ){T
jk
-1

T
(h(g(X)))}+γ{


jk
-1

T


Y)}
ここで、


jk
=P

(l(g(X))=j,Y=k)
請求項3に記載の学習装置。
【請求項5】
コンピュータに、請求項1又は2に記載の学習方法を実行させるためのプログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、学習方法、学習装置、及びプログラムに関する。
続きを表示(約 2,100 文字)【背景技術】
【0002】
学習モデルは、教師データにラベルを付与して生成することができる。しかしながら、ラベル付きのデータの収集には時間を要する。そこで、少数のラベル付きデータを用いて、ラベルを生成することも多い。この問題を解決するための技術の一つとして、教師なしドメイン適応(Unsupervised Domain Adaptation; UDA)がある。非特許文献1には、教師なしドメイン適応についての技術が記載されている。
【先行技術文献】
【非特許文献】
【0003】
Tachet des Combes, R., Zhao, H., Wang, Y. X., & Gordon, G. J.、“Domain adaptation with conditional distribution matching and generalized label shift”、34th Conference on Neural Information Processing Systems (NeurIPS 2020)、2020年
【発明の概要】
【発明が解決しようとする課題】
【0004】
教師なしドメイン適応では、学習データの重みが重要となるが、非特許文献1に記載の技術では重みが判定結果に依存した推論で算出されており、真の値に収束しない可能性がある。よって、一部の学習データに真のラベルを付した学習データセットを用いて全ての学習データに真のラベルを付した学習データセットで機械学習した場合に近い性能の学習モデルを生成する技術の開発が望まれる。
【0005】
本開示は、このような問題を解決するためになされたもので、その目的は、一部の学習データに真のラベルを付した学習データセットを用いて全ての学習データに真のラベルを付した学習データセットで機械学習した場合に近い性能の学習モデルを生成することが可能な学習方法、学習装置、及びプログラムを提供することにある。
【課題を解決するための手段】
【0006】
本開示に係る学習方法は、生成対象の学習モデルの係数を算出するために用意した、真のラベルを付した正解の学習データについてのデータセットを、ソースドメインとして入力し、前記生成対象の学習モデルの係数を算出するために用意した、雑音ラベルを付した学習データについてのデータセットを、ターゲットドメインとして入力し、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとが、同じラベルについて所定の変換式を用いて同じ値となることを条件として、前記ソースドメインのデータセット及び前記ターゲットドメインのデータセットを用いて、各ラベルについての、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとの比である重みと、前記生成対象の学習モデルの係数とを、機械学習により算出する、ものである。
【0007】
本開示に係る学習装置は、生成対象の学習モデルの係数を算出するために用意した、真のラベルを付した正解の学習データについてのデータセットを、ソースドメインとして入力し、前記生成対象の学習モデルの係数を算出するために用意した、雑音ラベルを付した学習データについてのデータセットを、ターゲットドメインとして入力する入力部と、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとが、同じラベルについて所定の変換式を用いて同じ値となることを条件として、前記ソースドメインのデータセット及び前記ターゲットドメインのデータセットを用いて、各ラベルについての、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとの比である重みと、前記生成対象の学習モデルの係数とを、機械学習により算出する算出部と、を備えたものである。
【0008】
本開示に係るプログラムは、コンピュータに、前記学習方法を実行させるためのプログラムである。
【発明の効果】
【0009】
本開示により、一部の学習データに真のラベルを付した学習データセットを用いて全ての学習データに真のラベルを付した学習データセットで機械学習した場合に近い性能の学習モデルを生成することが可能な学習方法、学習装置、及びプログラムを提供することができる。
【図面の簡単な説明】
【0010】
実施の形態に係る学習装置の一構成例を示すブロック図である。
図1の学習装置で実施される学習方法の一例を説明するためのフロー図である。
実施の形態に係る学習方法のアルゴリズムの一例を示す図である。
図3のアルゴリズムでの実験結果と比較例に係るアルゴリズムでの実験結果を示す図である。
図3のアルゴリズムでの実験結果を示す図である。
図3のアルゴリズムでの実験結果を示す図である。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

国立大学法人 東京大学
磁場発生装置
11日前
国立大学法人 東京大学
ゲート駆動装置
22日前
国立大学法人 東京大学
気泡による情報表示媒体
19日前
国立大学法人 東京大学
多系統萎縮症治療用の医薬組成物
5日前
国立大学法人 東京大学
pH応答性タンパク質送達用担体
22日前
国立大学法人 東京大学
タンパク質送達用pH応答性担体
22日前
国立大学法人 東京大学
学習方法、学習装置、及びプログラム
4日前
ダイキン工業株式会社
熱交換器及び冷凍装置
7日前
国立大学法人信州大学
放射性廃液の処理方法および放射性物質捕捉剤
21日前
国立大学法人 東京大学
電磁波吸収体、及び電磁波吸収体形成用ペースト
15日前
国立大学法人 東京大学
情報処理システム、情報処理方法及びプログラム
28日前
ダイキン工業株式会社
電力システム及び電気機器
7日前
国立大学法人 東京大学
超音波デバイス、制御装置、プログラム及びシステム
18日前
国立大学法人 東京大学
VHH抗体とストレプトアビジン変異体との融合タンパク質
11日前
国立大学法人 東京大学
目的タンパク質の単離方法、及び目的タンパク質の単離キット
12日前
国立大学法人 東京大学
異常ネルンスト効果材、熱電変換モジュールおよび熱流センサ
7日前
株式会社京三製作所
信号情報提供システムおよび生成制御方法
13日前
宇部エクシモ株式会社
光ファイバセンサ用ケーブル及びその製造方法
7日前
ダイキン工業株式会社
電気機器および電気機器を備える電力システム
7日前
国立大学法人 東京大学
アラルキル基を有するホスフィン-スルホン酸エステル化合物の製造方法
7日前
国立大学法人 東京大学
音声合成装置、予測装置、音声合成システム、音声合成方法及びプログラム
21日前
エア・ウォーター株式会社
情報処理装置、予測方法、および予測プログラム
7日前
株式会社日立製作所
人工衛星システム、人工衛星システム群、並びにその制御方法
25日前
関西電力株式会社
ガスタービン設備、水素供給設備、水素供給方法、及び、ボイラ設備
7日前
AGC株式会社
ペプチド及びその製造方法
14日前
国立大学法人 東京大学
静止期肝星細胞の調製方法と活性化評価モデル
6日前
株式会社ノバケア
フレイル・MCI・認知症予防計画作成支援・推奨生活提案装置及びシステム
4日前
出光興産株式会社
二酸化炭素の固定化方法及び固定化システム並びに炭酸カルシウムの製造方法
27日前
国立大学法人 東京大学
制御性T細胞の増殖または集積を誘導するヒト由来細菌
26日前
個人
GPSロガー
27日前
個人
マウス用テーブル
13日前
個人
デトろぐシステム
26日前
個人
情報処理システム
1か月前
日本精機株式会社
表示装置
1か月前
個人
管理装置
19日前
個人
指先受の付いたマウス。
1か月前
続きを見る