TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024148934
公報種別公開特許公報(A)
公開日2024-10-18
出願番号2023062528
出願日2023-04-07
発明の名称学習方法、学習装置、及びプログラム
出願人国立大学法人 東京大学,トヨタ自動車株式会社
代理人個人
主分類G06N 20/00 20190101AFI20241010BHJP(計算;計数)
要約【課題】一部の学習データに真のラベルを付した学習データセットを用いて全ての学習データに真のラベルを付した学習データセットで機械学習した場合に近い性能の学習モデルを生成する。
【解決手段】本開示に係る学習方法は、生成対象の学習モデルの係数を算出するために用意した、真のラベルを付した正解の学習データについてのデータセット、雑音ラベルを付した学習データについてのデータセットを、それぞれソースドメイン、ターゲットドメインとして入力する。学習方法は、ソースドメインのデータセットとターゲットドメインのデータセットとが同じラベルについて所定の変換式を用いて同じ値となることを条件として、ソースドメイン及びターゲットドメインのデータセットを用いて、各ラベルについての、ソースドメインのデータセットとターゲットドメインのデータセットとの比である重みと、生成対象の学習モデルの係数とを、機械学習により算出する。
【選択図】図1
特許請求の範囲【請求項1】
生成対象の学習モデルの係数を算出するために用意した、真のラベルを付した正解の学習データについてのデータセットを、ソースドメインとして入力し、
前記生成対象の学習モデルの係数を算出するために用意した、雑音ラベルを付した学習データについてのデータセットを、ターゲットドメインとして入力し、
前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとが、同じラベルについて所定の変換式を用いて同じ値となることを条件として、前記ソースドメインのデータセット及び前記ターゲットドメインのデータセットを用いて、各ラベルについての、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとの比である重みと、前記生成対象の学習モデルの係数とを、機械学習により算出する、
学習方法。
続きを表示(約 1,700 文字)【請求項2】
γをγ∈[0,1]を満たすハイパーパラメータ、T
jk
を前記ソースドメインでの(j,k)成分のタスク、


jk
を前記ターゲットドメインでの(j,k)成分のタスク、P
S
を前記ソースドメインでの真のラベルの確率分布、P
T
を前記ターゲットドメインでの雑音ラベルの確率分布、gを前記所定の変換式としての、前記ソースドメイン及び前記ターゲットドメインに共通の学習モデルを表現する関数、hを前記ソースドメインについての学習モデルを表現する関数、lを前記ターゲットドメインについての学習モデルを表現する関数、前記重みの(j,k)成分を下式のw
jk
とし、確率分布P
S
と確率分布P
T
とを合わせるように、前記重みと前記生成対象の学習モデルの係数とを、機械学習により算出する、

jk
=(1-γ){T
jk
-1

T
(h(g(X)))}+γ{


jk
-1

T


Y)}
ここで、


jk
=P

(l(g(X))=j,Y=k)
請求項1に記載の学習方法。
【請求項3】
生成対象の学習モデルの係数を算出するために用意した、真のラベルを付した正解の学習データについてのデータセットを、ソースドメインとして入力し、前記生成対象の学習モデルの係数を算出するために用意した、雑音ラベルを付した学習データについてのデータセットを、ターゲットドメインとして入力する入力部と、
前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとが、同じラベルについて所定の変換式を用いて同じ値となることを条件として、前記ソースドメインのデータセット及び前記ターゲットドメインのデータセットを用いて、各ラベルについての、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとの比である重みと、前記生成対象の学習モデルの係数とを、機械学習により算出する算出部と、
を備えた学習装置。
【請求項4】
前記算出部は、γをγ∈[0,1]を満たすハイパーパラメータ、T
jk
を前記ソースドメインでの(j,k)成分のタスク、


jk
を前記ターゲットドメインでの(j,k)成分のタスク、P
S
を前記ソースドメインでの真のラベルの確率分布、P
T
を前記ターゲットドメインでの雑音ラベルの確率分布、gを前記所定の変換式としての、前記ソースドメイン及び前記ターゲットドメインに共通の学習モデルを表現する関数、hを前記ソースドメインについての学習モデルを表現する関数、lを前記ターゲットドメインについての学習モデルを表現する関数、前記重みの(j,k)成分を下式のw
jk
とし、確率分布P
S
と確率分布P
T
とを合わせるように、前記重みと前記生成対象の学習モデルの係数とを、機械学習により算出する、

jk
=(1-γ){T
jk
-1

T
(h(g(X)))}+γ{


jk
-1

T


Y)}
ここで、


jk
=P

(l(g(X))=j,Y=k)
請求項3に記載の学習装置。
【請求項5】
コンピュータに、請求項1又は2に記載の学習方法を実行させるためのプログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、学習方法、学習装置、及びプログラムに関する。
続きを表示(約 2,100 文字)【背景技術】
【0002】
学習モデルは、教師データにラベルを付与して生成することができる。しかしながら、ラベル付きのデータの収集には時間を要する。そこで、少数のラベル付きデータを用いて、ラベルを生成することも多い。この問題を解決するための技術の一つとして、教師なしドメイン適応(Unsupervised Domain Adaptation; UDA)がある。非特許文献1には、教師なしドメイン適応についての技術が記載されている。
【先行技術文献】
【非特許文献】
【0003】
Tachet des Combes, R., Zhao, H., Wang, Y. X., & Gordon, G. J.、“Domain adaptation with conditional distribution matching and generalized label shift”、34th Conference on Neural Information Processing Systems (NeurIPS 2020)、2020年
【発明の概要】
【発明が解決しようとする課題】
【0004】
教師なしドメイン適応では、学習データの重みが重要となるが、非特許文献1に記載の技術では重みが判定結果に依存した推論で算出されており、真の値に収束しない可能性がある。よって、一部の学習データに真のラベルを付した学習データセットを用いて全ての学習データに真のラベルを付した学習データセットで機械学習した場合に近い性能の学習モデルを生成する技術の開発が望まれる。
【0005】
本開示は、このような問題を解決するためになされたもので、その目的は、一部の学習データに真のラベルを付した学習データセットを用いて全ての学習データに真のラベルを付した学習データセットで機械学習した場合に近い性能の学習モデルを生成することが可能な学習方法、学習装置、及びプログラムを提供することにある。
【課題を解決するための手段】
【0006】
本開示に係る学習方法は、生成対象の学習モデルの係数を算出するために用意した、真のラベルを付した正解の学習データについてのデータセットを、ソースドメインとして入力し、前記生成対象の学習モデルの係数を算出するために用意した、雑音ラベルを付した学習データについてのデータセットを、ターゲットドメインとして入力し、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとが、同じラベルについて所定の変換式を用いて同じ値となることを条件として、前記ソースドメインのデータセット及び前記ターゲットドメインのデータセットを用いて、各ラベルについての、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとの比である重みと、前記生成対象の学習モデルの係数とを、機械学習により算出する、ものである。
【0007】
本開示に係る学習装置は、生成対象の学習モデルの係数を算出するために用意した、真のラベルを付した正解の学習データについてのデータセットを、ソースドメインとして入力し、前記生成対象の学習モデルの係数を算出するために用意した、雑音ラベルを付した学習データについてのデータセットを、ターゲットドメインとして入力する入力部と、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとが、同じラベルについて所定の変換式を用いて同じ値となることを条件として、前記ソースドメインのデータセット及び前記ターゲットドメインのデータセットを用いて、各ラベルについての、前記ソースドメインのデータセットと前記ターゲットドメインのデータセットとの比である重みと、前記生成対象の学習モデルの係数とを、機械学習により算出する算出部と、を備えたものである。
【0008】
本開示に係るプログラムは、コンピュータに、前記学習方法を実行させるためのプログラムである。
【発明の効果】
【0009】
本開示により、一部の学習データに真のラベルを付した学習データセットを用いて全ての学習データに真のラベルを付した学習データセットで機械学習した場合に近い性能の学習モデルを生成することが可能な学習方法、学習装置、及びプログラムを提供することができる。
【図面の簡単な説明】
【0010】
実施の形態に係る学習装置の一構成例を示すブロック図である。
図1の学習装置で実施される学習方法の一例を説明するためのフロー図である。
実施の形態に係る学習方法のアルゴリズムの一例を示す図である。
図3のアルゴリズムでの実験結果と比較例に係るアルゴリズムでの実験結果を示す図である。
図3のアルゴリズムでの実験結果を示す図である。
図3のアルゴリズムでの実験結果を示す図である。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

国立大学法人 東京大学
センサ装置
10日前
国立大学法人 東京大学
内視鏡補助装置
24日前
国立大学法人 東京大学
生産性判定装置
10日前
国立大学法人 東京大学
タンパク質シンチレーター
3日前
国立大学法人 東京大学
繊維シート及びその製造方法
1か月前
国立大学法人 東京大学
人工培養皮膚およびその製造方法
10日前
国立大学法人 東京大学
放射性物質アスタチン-211除去材
1か月前
国立大学法人 東京大学
ジルコニア焼結体およびその製造方法
1か月前
国立大学法人 東京大学
酵素の検出方法及び酵素の検出キット
24日前
国立大学法人 東京大学
中間形状算出装置及び中間形状算出方法
1か月前
株式会社京三製作所
信号制御システム
2日前
国立大学法人 東京大学
触覚提示デバイス及び触覚提示システム
10日前
国立大学法人 東京大学
静水圧による脱細胞化組織又は臓器の製造方法
4日前
国立大学法人 東京大学
低炭素高炉製鉄のためのクリーンな還元ガスの製造方法
1か月前
国立大学法人 東京大学
鮮明画像取得システム、鮮明画像取得方法及びプログラム
10日前
日東電工株式会社
触覚センサ及び触覚センサの製造方法
11日前
ダイキン工業株式会社
ガス検出システム、およびガス検出方法
3日前
日本電信電話株式会社
最適化装置、最適化方法、及びプログラム
24日前
国立大学法人 東京大学
ウイルス阻害分子とストレプトアビジン変異体との融合タンパク質
25日前
国立大学法人 東京大学
ヘルペスウイルスの感染に起因する疾患の予防又は治療のための医薬組成物
10日前
ダイキン工業株式会社
槽内付着物除去用デバイスおよび槽内付着物除去方法
3日前
日本電信電話株式会社
環境影響予測装置、環境影響予測方法、及びプログラム
10日前
国立大学法人 東京大学
熱電変換素子及び熱電変換装置
26日前
株式会社京三製作所
踏切位置演算装置、踏切位置演算プログラム及び踏切位置演算方法
2日前
株式会社ジャパンディスプレイ
検出装置
24日前
三菱ケミカル株式会社
異常ネルンスト効果素子及びその製造方法、並びに熱電変換デバイス
26日前
三菱ケミカル株式会社
異常ネルンスト効果素子の製造方法、及び熱電変換デバイスの製造方法
26日前
国立大学法人 東京大学
腫瘍溶解性遺伝子改変麻疹ウイルスの新規用途
1か月前
日本電信電話株式会社
モデル学習装置、行動認識装置、モデル学習方法、およびモデル学習プログラム
26日前
日本電信電話株式会社
ネットワーク障害箇所特定装置、ネットワーク障害箇所特定方法、及びプログラム
25日前
ウィスコンシン アルムニ リサーチ ファンデイション
卵における複製のための安定化されたHAを有する組換えインフルエンザウイルス
1か月前
個人
自動精算システム
4日前
個人
RFタグ読取装置
13日前
個人
自動精算システム
1か月前
個人
売買システム
10日前
個人
管理サーバ
24日前
続きを見る