TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025043121
公報種別
公開特許公報(A)
公開日
2025-03-28
出願番号
2023150449
出願日
2023-09-15
発明の名称
機械学習プログラム、機械学習方法および情報処理装置
出願人
富士通株式会社
代理人
弁理士法人酒井国際特許事務所
主分類
G06N
3/0455 20230101AFI20250321BHJP(計算;計数)
要約
【課題】生成モデルの機械学習時における安定性を向上させる。
【解決手段】実施形態の機械学習プログラムは、第3のデータを取得する処理と、第4のデータを取得する処理と、実行する処理とをコンピュータに実行させる。第3のデータを取得する処理は、第1のデータをエンコーダに入力し、エンコーダが出力した第2のデータにノイズを加えた第3のデータを取得する。第4のデータを取得する処理は、第3のデータをエンコーダの逆計算に相当するデコーダに入力し、デコーダが出力した第4のデータを取得する。実行する処理は、第3のデータと、第1のデータと第4のデータの誤差とを含む損失関数に基づいて、エンコーダとデコーダとの訓練を実行する。
【選択図】図4
特許請求の範囲
【請求項1】
第1のデータをエンコーダに入力し、前記エンコーダが出力した第2のデータにノイズを加えた第3のデータを取得し、
前記第3のデータを前記エンコーダの逆計算に相当するデコーダに入力し、前記デコーダが出力した第4のデータを取得し、
前記第3のデータと、前記第1のデータと前記第4のデータの誤差とを含む損失関数に基づいて、前記エンコーダと前記デコーダとの訓練を実行する、
処理をコンピュータに実行させることを特徴とする機械学習プログラム。
続きを表示(約 780 文字)
【請求項2】
前記第3のデータを取得する処理は、前記第1のデータを多チャンネル化して前記エンコーダに入力して多チャンネル化した前記第3のデータを取得し、
前記第4のデータを取得する処理は、多チャンネル化した前記第3のデータを前記デコーダに入力し、当該デコーダの出力を単チャンネル化して前記第4のデータを取得する、
ことを特徴とする請求項1に記載の機械学習プログラム。
【請求項3】
前記損失関数は、前記誤差に、前記第3のデータの確率分布と事前分布との符号化情報に対して補正係数を乗算した値を加える、
ことを特徴とする請求項1に記載の機械学習プログラム。
【請求項4】
第1のデータをエンコーダに入力し、前記エンコーダが出力した第2のデータにノイズを加えた第3のデータを取得し、
前記第3のデータを前記エンコーダの逆計算に相当するデコーダに入力し、前記デコーダが出力した第4のデータを取得し、
前記第3のデータと、前記第1のデータと前記第4のデータの誤差とを含む損失関数に基づいて、前記エンコーダと前記デコーダとの訓練を実行する、
処理をコンピュータが実行することを特徴とする機械学習方法。
【請求項5】
第1のデータをエンコーダに入力し、前記エンコーダが出力した第2のデータにノイズを加えた第3のデータを取得し、
前記第3のデータを前記エンコーダの逆計算に相当するデコーダに入力し、前記デコーダが出力した第4のデータを取得し、
前記第3のデータと、前記第1のデータと前記第4のデータの誤差とを含む損失関数に基づいて、前記エンコーダと前記デコーダとの訓練を実行する、
処理を実行する制御部を含むことを特徴とする情報処理装置。
発明の詳細な説明
【技術分野】
【0001】
本発明の実施形態は、機械学習プログラム、機械学習方法および情報処理装置に関する。
続きを表示(約 1,700 文字)
【背景技術】
【0002】
従来、画像や自然言語処理等の分野において、生成型深層学習モデル(以下、生成モデルまたはモデルと呼ぶ)を利用し、データの特徴を捉えた潜在表現(潜在変数、潜在空間とも呼ぶ)を生成することが行われている。この生成モデルは、大量のラベル無しデータに基づく機械学習により、訓練される。生成モデルは、オートエンコーダ(AutoEncoder)とも呼ばれる。
【0003】
生成モデルは、エンコーダと、デコーダとを有する。エンコーダに、入力データを入力することで、入力データよりも低次元、かつ、データ量を少なくした潜在表現が生成される。また、デコーダに、潜在表現を入力することで、入力データを復元したデータとなる出力データが生成される。
【0004】
エンコーダおよびデコーダは、入力データと出力データとの復元誤差が小さくなるように機械学習を行うことで訓練される。訓練済みの生成モデルのエンコーダに、入力データを入力することで、入力データの特徴を捉えた潜在表現が得られる。すなわち、訓練済みの生成モデルは、入力データに関するサンプリング、特徴量生成、説明変数生成、データの分布獲得などの入力データの特徴を定量的に求める役割を持つ。したがって、生成モデルは、入力データに基づく予測・識別等に活用できる。
【先行技術文献】
【特許文献】
【0005】
特開2022-20138号公報
特開2022-15573号公報
特表2022-533264号公報
米国特許出願公開第2019/0327501号明細書
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上記の従来技術では、機械学習時において、復元誤差の変動により、エンコーダおよびデコーダのパラメータの収束性が悪化し、機械学習が不安定になりやすいという問題がある。例えば、エンコーダおよびデコーダのパラメータ数が多くなり、モデルサイズが大きい場合は、パラメータの収束が困難なものとなる。
【0007】
1つの側面では、生成モデルの機械学習時における安定性を向上できる機械学習プログラム、機械学習方法および情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
1つの案では、機械学習プログラムは、第3のデータを取得する処理と、第4のデータを取得する処理と、実行する処理とをコンピュータに実行させる。第3のデータを取得する処理は、第1のデータをエンコーダに入力し、エンコーダが出力した第2のデータにノイズを加えた第3のデータを取得する。第4のデータを取得する処理は、第3のデータをエンコーダの逆計算に相当するデコーダに入力し、デコーダが出力した第4のデータを取得する。実行する処理は、第3のデータと、第1のデータと第4のデータの誤差とを含む損失関数に基づいて、エンコーダとデコーダとの訓練を実行する。
【発明の効果】
【0009】
生成モデルの機械学習時における安定性を向上できる。
【図面の簡単な説明】
【0010】
図1は、従来のモデルを説明する説明図である。
図2は、従来のモデルを説明する説明図である。
図3は、従来のモデルを説明する説明図である。
図4は、実施形態にかかるモデルの概要を説明する説明図である。
図5は、実施形態にかかる情報処理装置の機能構成例を示すブロック図である。
図6は、実施形態にかかる情報処理装置の動作例を示すフローチャートである。
図7は、変形例にかかるモデルの概要を説明する説明図である。
図8は、変形例にかかる情報処理装置の動作例を示すフローチャートである。
図9は、コンピュータ構成の一例を説明する説明図である。
【発明を実施するための形態】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
富士通株式会社
電源装置
24日前
富士通株式会社
画像生成方法
1か月前
富士通株式会社
冷却モジュール
1か月前
富士通株式会社
車線区分装置及び方法
10日前
富士通株式会社
商品棚の検出装置及び方法
6日前
富士通株式会社
商品状態検出装置及び方法
6日前
富士通株式会社
評価プログラム、方法、及び装置
1か月前
富士通株式会社
伝送路監視装置及び伝送路監視方法
2日前
富士通株式会社
情報処理装置,プログラムおよび制御方法
10日前
富士通株式会社
予測プログラム、予測方法及び情報処理装置
25日前
富士通株式会社
分子動力学計算プログラム、方法、及び装置
10日前
富士通株式会社
プログラム、情報処理方法および情報処理装置
1か月前
富士通株式会社
方策学習装置、方策学習方法及び通信システム
25日前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
6日前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
6日前
富士通株式会社
プログラム、データ処理装置及びデータ処理方法
3日前
富士通株式会社
情報処理装置、手続きプログラムおよび手続き方法
1か月前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
1か月前
富士通株式会社
情報処理プログラム、情報処理方法、および管理装置
2日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
26日前
富士通株式会社
医薬品管理装置、医薬品管理方法、医薬品管理プログラム
11日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理システム
1か月前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
11日前
富士通株式会社
タスク制御プログラム、情報処理装置及びタスク制御方法
10日前
富士通株式会社
業務管理プログラム、業務管理方法、および情報処理装置
17日前
富士通株式会社
期待値算出システム、期待値算出装置、及び期待値算出方法
26日前
富士通株式会社
把持期間判定プログラム,把持期間判定方法及び情報処理装置
2日前
富士通株式会社
量子計算支援プログラム、量子計算支援方法、および情報処理装置
18日前
富士通株式会社
歩行訓練支援プログラム、歩行訓練支援方法、および情報処理装置
12日前
富士通株式会社
エレベータ管理プログラム、エレベータ管理方法、エレベータ管理装置
27日前
富士通株式会社
リソース割当て装置、リソース割当て方法、およびリソース割当てプログラム
24日前
富士通株式会社
基底エネルギー算出プログラム、基底エネルギー算出装置、および基底エネルギー算出方法
19日前
富士通株式会社
サイドリンクリソースの再選択方法及び装置
11日前
富士通株式会社
基地局、移動局、通信システム、及び通信方法
23日前
富士通株式会社
ワイヤーハーネス製造図設計支援プログラム、ワイヤーハーネス製造図設計支援方法、および情報処理装置
10日前
個人
非正規コート
20日前
続きを見る
他の特許を見る