TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025043121
公報種別公開特許公報(A)
公開日2025-03-28
出願番号2023150449
出願日2023-09-15
発明の名称機械学習プログラム、機械学習方法および情報処理装置
出願人富士通株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06N 3/0455 20230101AFI20250321BHJP(計算;計数)
要約【課題】生成モデルの機械学習時における安定性を向上させる。
【解決手段】実施形態の機械学習プログラムは、第3のデータを取得する処理と、第4のデータを取得する処理と、実行する処理とをコンピュータに実行させる。第3のデータを取得する処理は、第1のデータをエンコーダに入力し、エンコーダが出力した第2のデータにノイズを加えた第3のデータを取得する。第4のデータを取得する処理は、第3のデータをエンコーダの逆計算に相当するデコーダに入力し、デコーダが出力した第4のデータを取得する。実行する処理は、第3のデータと、第1のデータと第4のデータの誤差とを含む損失関数に基づいて、エンコーダとデコーダとの訓練を実行する。
【選択図】図4
特許請求の範囲【請求項1】
第1のデータをエンコーダに入力し、前記エンコーダが出力した第2のデータにノイズを加えた第3のデータを取得し、
前記第3のデータを前記エンコーダの逆計算に相当するデコーダに入力し、前記デコーダが出力した第4のデータを取得し、
前記第3のデータと、前記第1のデータと前記第4のデータの誤差とを含む損失関数に基づいて、前記エンコーダと前記デコーダとの訓練を実行する、
処理をコンピュータに実行させることを特徴とする機械学習プログラム。
続きを表示(約 780 文字)【請求項2】
前記第3のデータを取得する処理は、前記第1のデータを多チャンネル化して前記エンコーダに入力して多チャンネル化した前記第3のデータを取得し、
前記第4のデータを取得する処理は、多チャンネル化した前記第3のデータを前記デコーダに入力し、当該デコーダの出力を単チャンネル化して前記第4のデータを取得する、
ことを特徴とする請求項1に記載の機械学習プログラム。
【請求項3】
前記損失関数は、前記誤差に、前記第3のデータの確率分布と事前分布との符号化情報に対して補正係数を乗算した値を加える、
ことを特徴とする請求項1に記載の機械学習プログラム。
【請求項4】
第1のデータをエンコーダに入力し、前記エンコーダが出力した第2のデータにノイズを加えた第3のデータを取得し、
前記第3のデータを前記エンコーダの逆計算に相当するデコーダに入力し、前記デコーダが出力した第4のデータを取得し、
前記第3のデータと、前記第1のデータと前記第4のデータの誤差とを含む損失関数に基づいて、前記エンコーダと前記デコーダとの訓練を実行する、
処理をコンピュータが実行することを特徴とする機械学習方法。
【請求項5】
第1のデータをエンコーダに入力し、前記エンコーダが出力した第2のデータにノイズを加えた第3のデータを取得し、
前記第3のデータを前記エンコーダの逆計算に相当するデコーダに入力し、前記デコーダが出力した第4のデータを取得し、
前記第3のデータと、前記第1のデータと前記第4のデータの誤差とを含む損失関数に基づいて、前記エンコーダと前記デコーダとの訓練を実行する、
処理を実行する制御部を含むことを特徴とする情報処理装置。

発明の詳細な説明【技術分野】
【0001】
本発明の実施形態は、機械学習プログラム、機械学習方法および情報処理装置に関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
従来、画像や自然言語処理等の分野において、生成型深層学習モデル(以下、生成モデルまたはモデルと呼ぶ)を利用し、データの特徴を捉えた潜在表現(潜在変数、潜在空間とも呼ぶ)を生成することが行われている。この生成モデルは、大量のラベル無しデータに基づく機械学習により、訓練される。生成モデルは、オートエンコーダ(AutoEncoder)とも呼ばれる。
【0003】
生成モデルは、エンコーダと、デコーダとを有する。エンコーダに、入力データを入力することで、入力データよりも低次元、かつ、データ量を少なくした潜在表現が生成される。また、デコーダに、潜在表現を入力することで、入力データを復元したデータとなる出力データが生成される。
【0004】
エンコーダおよびデコーダは、入力データと出力データとの復元誤差が小さくなるように機械学習を行うことで訓練される。訓練済みの生成モデルのエンコーダに、入力データを入力することで、入力データの特徴を捉えた潜在表現が得られる。すなわち、訓練済みの生成モデルは、入力データに関するサンプリング、特徴量生成、説明変数生成、データの分布獲得などの入力データの特徴を定量的に求める役割を持つ。したがって、生成モデルは、入力データに基づく予測・識別等に活用できる。
【先行技術文献】
【特許文献】
【0005】
特開2022-20138号公報
特開2022-15573号公報
特表2022-533264号公報
米国特許出願公開第2019/0327501号明細書
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上記の従来技術では、機械学習時において、復元誤差の変動により、エンコーダおよびデコーダのパラメータの収束性が悪化し、機械学習が不安定になりやすいという問題がある。例えば、エンコーダおよびデコーダのパラメータ数が多くなり、モデルサイズが大きい場合は、パラメータの収束が困難なものとなる。
【0007】
1つの側面では、生成モデルの機械学習時における安定性を向上できる機械学習プログラム、機械学習方法および情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
1つの案では、機械学習プログラムは、第3のデータを取得する処理と、第4のデータを取得する処理と、実行する処理とをコンピュータに実行させる。第3のデータを取得する処理は、第1のデータをエンコーダに入力し、エンコーダが出力した第2のデータにノイズを加えた第3のデータを取得する。第4のデータを取得する処理は、第3のデータをエンコーダの逆計算に相当するデコーダに入力し、デコーダが出力した第4のデータを取得する。実行する処理は、第3のデータと、第1のデータと第4のデータの誤差とを含む損失関数に基づいて、エンコーダとデコーダとの訓練を実行する。
【発明の効果】
【0009】
生成モデルの機械学習時における安定性を向上できる。
【図面の簡単な説明】
【0010】
図1は、従来のモデルを説明する説明図である。
図2は、従来のモデルを説明する説明図である。
図3は、従来のモデルを説明する説明図である。
図4は、実施形態にかかるモデルの概要を説明する説明図である。
図5は、実施形態にかかる情報処理装置の機能構成例を示すブロック図である。
図6は、実施形態にかかる情報処理装置の動作例を示すフローチャートである。
図7は、変形例にかかるモデルの概要を説明する説明図である。
図8は、変形例にかかる情報処理装置の動作例を示すフローチャートである。
図9は、コンピュータ構成の一例を説明する説明図である。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

キヤノン電子株式会社
通信システム
7日前
株式会社ザメディア
出席管理システム
1日前
トヨタ自動車株式会社
作業判定方法
2日前
トヨタ自動車株式会社
工程計画装置
1日前
トヨタ自動車株式会社
作業評価装置
7日前
トヨタ自動車株式会社
管理システム
9日前
株式会社NURSY
再就職の支援装置
8日前
TDK株式会社
等価回路
9日前
ゼネラル株式会社
RFIDタグ付き物品
3日前
個人
公益寄付インタラクティブシステム
7日前
トヨタ自動車株式会社
情報処理システム
2日前
キオクシア株式会社
電子機器
13日前
株式会社国際電気
支援システム
3日前
株式会社インテック
触覚ディスプレイ装置
8日前
ジャペル株式会社
登録管理システム
13日前
大王製紙株式会社
作業管理システム
8日前
富士フイルム株式会社
タッチセンサ
7日前
トヨタ自動車株式会社
情報処理方法
2日前
ブラザー工業株式会社
ラベルプリンタ
2日前
個人
チャットボットを用いたシステム
13日前
株式会社デンソー
情報処理方法
7日前
富士通株式会社
画像生成方法
6日前
甍エンジニアリング株式会社
屋根材買い取りシステム
6日前
日立建機株式会社
作業支援システム
9日前
アスエネ株式会社
温室効果ガス排出量管理方法
13日前
株式会社鷺宮製作所
制御システム
13日前
アスエネ株式会社
温室効果ガス排出量管理方法
13日前
アスエネ株式会社
温室効果ガス排出量管理方法
13日前
アスエネ株式会社
温室効果ガス排出量管理方法
13日前
アスエネ株式会社
温室効果ガス排出量管理方法
13日前
株式会社鷺宮製作所
制御システム
13日前
株式会社鷺宮製作所
制御システム
13日前
株式会社マーケットヴィジョン
情報処理システム
7日前
株式会社USEN-ALMEX
サービスロボット
10日前
日立建機株式会社
潤滑油診断システム
1日前
株式会社日立製作所
設計支援装置
1日前
続きを見る