TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024148934
公報種別公開特許公報(A)
公開日2024-10-18
出願番号2023062528
出願日2023-04-07
発明の名称学習方法、学習装置、及びプログラム
出願人国立大学法人 東京大学,トヨタ自動車株式会社
代理人個人
主分類G06N 20/00 20190101AFI20241010BHJP(計算;計数)
要約【課題】一部の学習データに真のラベルを付した学習データセットを用いて全ての学習データに真のラベルを付した学習データセットで機械学習した場合に近い性能の学習モデルを生成する。
【解決手段】本開示に係る学習方法は、生成対象の学習モデルの係数を算出するために用意した、真のラベルを付した正解の学習データについてのデータセット、雑音ラベルを付した学習データについてのデータセットを、それぞれソースドメイン、ターゲットドメインとして入力する。学習方法は、ソースドメインのデータセットとターゲットドメインのデータセットとが同じラベルについて所定の変換式を用いて同じ値となることを条件として、ソースドメイン及びターゲットドメインのデータセットを用いて、各ラベルについての、ソースドメインのデータセットとターゲットドメインのデータセットとの比である重みと、生成対象の学習モデルの係数とを、機械学習により算出する。
【選択図】図1
特許請求の範囲【請求項1】
生成対象の学習モデルの係数を算出するために用意した、真のラベルを付した正解の学習データについてのデータセットを、ソースドメインとして入力し、
前記生成対象の学習モデルの係数を算出するために用意した、雑音ラベルを付した学習データについてのデータセットを、ターゲットドメインとして入力し、
前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとが、同じラベルについて所定の変換式を用いて同じ値となることを条件として、前記ソースドメインのデータセット及び前記ターゲットドメインのデータセットを用いて、各ラベルについての、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとの比である重みと、前記生成対象の学習モデルの係数とを、機械学習により算出する、
学習方法。
続きを表示(約 1,700 文字)【請求項2】
γをγ∈[0,1]を満たすハイパーパラメータ、T
jk
を前記ソースドメインでの(j,k)成分のタスク、


jk
を前記ターゲットドメインでの(j,k)成分のタスク、P
S
を前記ソースドメインでの真のラベルの確率分布、P
T
を前記ターゲットドメインでの雑音ラベルの確率分布、gを前記所定の変換式としての、前記ソースドメイン及び前記ターゲットドメインに共通の学習モデルを表現する関数、hを前記ソースドメインについての学習モデルを表現する関数、lを前記ターゲットドメインについての学習モデルを表現する関数、前記重みの(j,k)成分を下式のw
jk
とし、確率分布P
S
と確率分布P
T
とを合わせるように、前記重みと前記生成対象の学習モデルの係数とを、機械学習により算出する、

jk
=(1-γ){T
jk
-1

T
(h(g(X)))}+γ{


jk
-1

T


Y)}
ここで、


jk
=P

(l(g(X))=j,Y=k)
請求項1に記載の学習方法。
【請求項3】
生成対象の学習モデルの係数を算出するために用意した、真のラベルを付した正解の学習データについてのデータセットを、ソースドメインとして入力し、前記生成対象の学習モデルの係数を算出するために用意した、雑音ラベルを付した学習データについてのデータセットを、ターゲットドメインとして入力する入力部と、
前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとが、同じラベルについて所定の変換式を用いて同じ値となることを条件として、前記ソースドメインのデータセット及び前記ターゲットドメインのデータセットを用いて、各ラベルについての、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとの比である重みと、前記生成対象の学習モデルの係数とを、機械学習により算出する算出部と、
を備えた学習装置。
【請求項4】
前記算出部は、γをγ∈[0,1]を満たすハイパーパラメータ、T
jk
を前記ソースドメインでの(j,k)成分のタスク、


jk
を前記ターゲットドメインでの(j,k)成分のタスク、P
S
を前記ソースドメインでの真のラベルの確率分布、P
T
を前記ターゲットドメインでの雑音ラベルの確率分布、gを前記所定の変換式としての、前記ソースドメイン及び前記ターゲットドメインに共通の学習モデルを表現する関数、hを前記ソースドメインについての学習モデルを表現する関数、lを前記ターゲットドメインについての学習モデルを表現する関数、前記重みの(j,k)成分を下式のw
jk
とし、確率分布P
S
と確率分布P
T
とを合わせるように、前記重みと前記生成対象の学習モデルの係数とを、機械学習により算出する、

jk
=(1-γ){T
jk
-1

T
(h(g(X)))}+γ{


jk
-1

T


Y)}
ここで、


jk
=P

(l(g(X))=j,Y=k)
請求項3に記載の学習装置。
【請求項5】
コンピュータに、請求項1又は2に記載の学習方法を実行させるためのプログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、学習方法、学習装置、及びプログラムに関する。
続きを表示(約 2,100 文字)【背景技術】
【0002】
学習モデルは、教師データにラベルを付与して生成することができる。しかしながら、ラベル付きのデータの収集には時間を要する。そこで、少数のラベル付きデータを用いて、ラベルを生成することも多い。この問題を解決するための技術の一つとして、教師なしドメイン適応(Unsupervised Domain Adaptation; UDA)がある。非特許文献1には、教師なしドメイン適応についての技術が記載されている。
【先行技術文献】
【非特許文献】
【0003】
Tachet des Combes, R., Zhao, H., Wang, Y. X., & Gordon, G. J.、“Domain adaptation with conditional distribution matching and generalized label shift”、34th Conference on Neural Information Processing Systems (NeurIPS 2020)、2020年
【発明の概要】
【発明が解決しようとする課題】
【0004】
教師なしドメイン適応では、学習データの重みが重要となるが、非特許文献1に記載の技術では重みが判定結果に依存した推論で算出されており、真の値に収束しない可能性がある。よって、一部の学習データに真のラベルを付した学習データセットを用いて全ての学習データに真のラベルを付した学習データセットで機械学習した場合に近い性能の学習モデルを生成する技術の開発が望まれる。
【0005】
本開示は、このような問題を解決するためになされたもので、その目的は、一部の学習データに真のラベルを付した学習データセットを用いて全ての学習データに真のラベルを付した学習データセットで機械学習した場合に近い性能の学習モデルを生成することが可能な学習方法、学習装置、及びプログラムを提供することにある。
【課題を解決するための手段】
【0006】
本開示に係る学習方法は、生成対象の学習モデルの係数を算出するために用意した、真のラベルを付した正解の学習データについてのデータセットを、ソースドメインとして入力し、前記生成対象の学習モデルの係数を算出するために用意した、雑音ラベルを付した学習データについてのデータセットを、ターゲットドメインとして入力し、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとが、同じラベルについて所定の変換式を用いて同じ値となることを条件として、前記ソースドメインのデータセット及び前記ターゲットドメインのデータセットを用いて、各ラベルについての、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとの比である重みと、前記生成対象の学習モデルの係数とを、機械学習により算出する、ものである。
【0007】
本開示に係る学習装置は、生成対象の学習モデルの係数を算出するために用意した、真のラベルを付した正解の学習データについてのデータセットを、ソースドメインとして入力し、前記生成対象の学習モデルの係数を算出するために用意した、雑音ラベルを付した学習データについてのデータセットを、ターゲットドメインとして入力する入力部と、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとが、同じラベルについて所定の変換式を用いて同じ値となることを条件として、前記ソースドメインのデータセット及び前記ターゲットドメインのデータセットを用いて、各ラベルについての、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとの比である重みと、前記生成対象の学習モデルの係数とを、機械学習により算出する算出部と、を備えたものである。
【0008】
本開示に係るプログラムは、コンピュータに、前記学習方法を実行させるためのプログラムである。
【発明の効果】
【0009】
本開示により、一部の学習データに真のラベルを付した学習データセットを用いて全ての学習データに真のラベルを付した学習データセットで機械学習した場合に近い性能の学習モデルを生成することが可能な学習方法、学習装置、及びプログラムを提供することができる。
【図面の簡単な説明】
【0010】
実施の形態に係る学習装置の一構成例を示すブロック図である。
図1の学習装置で実施される学習方法の一例を説明するためのフロー図である。
実施の形態に係る学習方法のアルゴリズムの一例を示す図である。
図3のアルゴリズムでの実験結果と比較例に係るアルゴリズムでの実験結果を示す図である。
図3のアルゴリズムでの実験結果を示す図である。
図3のアルゴリズムでの実験結果を示す図である。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

ニプロ株式会社
施術用袋状体
5日前
個人
情報提示方法
1か月前
個人
プログラム
1か月前
個人
アカウントマップ
27日前
個人
プログラム
26日前
個人
自動精算システム
1か月前
個人
市場受発注システム
1か月前
個人
発想支援方法及びシステム
1か月前
個人
分類処理プログラム及び方法
1か月前
個人
案件管理装置および端末装置
13日前
個人
学習装置及び推論装置
26日前
株式会社発明屋
電池指向の構造設計
20日前
富士通株式会社
金融システム
1か月前
井関農機株式会社
ロボット作業車両
1か月前
トヨタ自動車株式会社
管理装置
21日前
トヨタ自動車株式会社
電気自動車
5日前
株式会社イズミ
総合代行システム
9日前
個人
ダブルオークションシステム
9日前
株式会社プレニーズ
仲介システム
27日前
富士通株式会社
プロセッサ
19日前
ブラザー工業株式会社
無線通信装置
1か月前
個人
販売支援システム
1か月前
村田機械株式会社
人員配置システム
1か月前
トヨタ自動車株式会社
作業管理装置
1か月前
トヨタ自動車株式会社
情報通知方法
1か月前
富士通株式会社
予測
12日前
NISSHA株式会社
入力装置
1か月前
トヨタ自動車株式会社
生成装置
1か月前
AICRO株式会社
情報処理システム
1か月前
合同会社IPマネジメント
料金収受システム
12日前
株式会社SUBARU
車両用操作装置
5日前
個人
株式投資コンペティションシステム
12日前
株式会社半導体エネルギー研究所
検索システム
1か月前
中国電力株式会社
業務依頼支援システム
1か月前
株式会社アジラ
行動体存在推定システム
19日前
トヨタ自動車株式会社
電池性能推定方法
12日前
続きを見る