TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024103463
公報種別公開特許公報(A)
公開日2024-08-01
出願番号2024006142
出願日2024-01-18
発明の名称情報処理装置、情報処理方法及びコンピュータプログラム
出願人富士通株式会社
代理人個人,個人
主分類G06N 3/08 20230101AFI20240725BHJP(計算;計数)
要約【課題】新しい訓練サンプルセットを使用して、元のモデルをさらに再訓練する場合に良好な予測パフォーマンスを有するモデルを得る。
【解決手段】情報処理装置100は、第二タスクについての第二訓練サンプルセットに基づいて得られたサンプル生成ネットワークを利用して、第一タスクについての第一シミュレットサンプルセットを生成するサンプル生成ユニット及び第一所定条件の下で、第二訓練サンプルセットを利用して、第一タスクについての事前訓練の第一モデルを再訓練し、第二タスクとは異なる第一タスク及び/又は第二タスクに関する予測待ち対象を予測するための再訓練の第一モデルを取得する第1モデル訓練ユニットを含む。前記第一所定条件は、第一シミュレットサンプルセットに対しての事前訓練の第一モデルの予測結果と、第一シミュレットサンプルセットに対しての再訓練の第一モデルの予測結果との間の差が、所定範囲内にあることを含む。
【選択図】図1
特許請求の範囲【請求項1】
情報を処理する装置であって、
第二タスクについての第二訓練サンプルセットに基づいて得られたサンプル生成ネットワークを利用して、第一タスクについての第一シミュレットサンプルセットを生成するように構成されるサンプル生成ユニット;及び
第一所定条件の下で、前記第二訓練サンプルセットを利用して、前記第一タスクについての事前訓練の第一モデルを再訓練し、予測待ち対象を予測するための再訓練の第一モデルを取得するように構成される第一モデル訓練ユニットを含み、
前記第一所定条件は、前記事前訓練の第一モデルの、前記第一シミュレットサンプルセットに対しての予測結果と、前記再訓練の第一モデルの、前記第一シミュレットサンプルセットに対しての予測結果との間の差が所定範囲内にあることを含み、
前記第一タスクは前記第二タスクとは異なり、
前記予測待ち対象は第一タスク及び/又は第二タスクに関する、装置。
続きを表示(約 2,000 文字)【請求項2】
請求項1に記載の装置であって、
サンプル生成ネットワーク取得ユニットをさらに含み、
前記サンプル生成ネットワーク取得ユニットは、
前記第二訓練サンプルセットに基づいて、初期の敵対的生成ネットワークを訓練することで、訓練済みの敵対的生成ネットワークを取得し;及び
前記訓練済みの敵対的生成ネットワークを、第二所定条件に達するように調整することで、調整済みの敵対的生成ネットワークを前記サンプル生成ネットワークとして得る
ように構成され、
前記第二所定条件は、ランダムベクトルを前記調整済みの敵対的生成ネットワークの入力として利用する場合に、前記事前訓練の第一モデルの、前記調整済みの敵対的生成ネットワークの出力としての第二シミュレットサンプルセットに対しての予測結果が前記第一タスクについての予測結果に関することを含む、装置。
【請求項3】
請求項1に記載の装置であって、
サンプル生成ネットワーク取得ユニットをさらに含み、
前記サンプル生成ネットワーク取得ユニットは、
前記第二訓練サンプルセットに基づいて、1つ又は複数の符号化層を含む初期生成ネットワークを、第三所定条件に達するように訓練することで、1つ又は複数の符号化層を含む訓練済みの生成ネットワークを前記サンプル生成ネットワークとして得る
ように構成され、
前記第三所定条件は、前記第二訓練サンプルセットを前記訓練済みの生成ネットワークの入力として利用する場合に、前記事前訓練の第一モデルの、前記訓練済みの生成ネットワークの出力としての第二シミュレットサンプルセットに対しての予測結果が前記第一タスクについての予測結果に関することを含む、装置。
【請求項4】
請求項3に記載の装置であって、
前記訓練済みの生成ネットワークは1つ又は複数の復号層をさらに含み、
前記1つ又は複数の符号化層にうちの最後の1つの符号化層の出力は前記1つ又は複数の復号層のうちの1番目の復号層の入力として使用され、前記1つ又は複数の復号層のうちの最後の1つの復号層の出力は訓練済みの生成ネットワークの出力として使用される、装置。
【請求項5】
請求項2乃至4のうちの任意の1項に記載の装置であって、
前記第二シミュレットサンプルセットにおける各シミュレットサンプルにノイズを追加し、前記事前訓練の第一モデルの、ノイズが追加された各シミュレットサンプルに対しての予測結果を、前記事前訓練の第一モデルの、前記第二シミュレットサンプルセットに対しての予測結果として取得する、装置。
【請求項6】
請求項2乃至4のうちの任意の1項に記載の装置であって、
前記事前訓練の第一モデルに含まれる特徴抽出層により抽出される、前記第二シミュレットサンプルセットにおける各シミュレットサンプルの特徴にノイズを追加し、ノイズが追加された特徴に基づく予測結果を、前記事前訓練の第一モデルの、前記第二シミュレットサンプルセットに対しての予測結果として取得する、装置。
【請求項7】
請求項2乃至4のうちの任意の1項に記載の装置であって、
前記事前訓練の第一モデルに含まれる損失層の出力ベクトルにより、前記事前訓練の第一モデルの、前記第一シミュレットサンプルセットに対しての予測結果と、前記再訓練の第一モデルの、前記第一シミュレットサンプルセットに対しての予測結果との間の差を表す、装置。
【請求項8】
請求項2乃至4のうちの任意の1項に記載の装置であって、
前記事前訓練の第一モデルはニューラルネットワークモデルである、装置。
【請求項9】
情報を処理する方法であって、
第二タスクについての第二訓練サンプルセットに基づいて得られたサンプル生成ネットワークを利用して、第一タスクについての第一シミュレットサンプルセットを生成し;及び
第一所定条件の下で、前記第二訓練サンプルセットを利用して、前記第一タスクについての事前訓練の第一モデルを再訓練し、予測待ち対象を予測するための再訓練の第一モデルを取得することを含み、
前記第一所定条件は、前記事前訓練の第一モデルの、前記第一シミュレットサンプルセットに対しての予測結果と、前記再訓練の第一モデルの、前記第一シミュレットサンプルセットに対しての予測結果との間の差が所定範囲内にあることを含み、
前記第一タスクは前記第二タスクとは異なり、
前記予測待ち対象は第一タスク及び/又は第二タスクに関する、方法。
【請求項10】
コンピュータに、請求項9に記載の方法を実行させるためのプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、情報処理の技術分野に関し、具体的には、情報処理装置、情報処理方法及びコンピュータプログラムに関する。
続きを表示(約 2,000 文字)【背景技術】
【0002】
情報処理の技術分野では、生涯にわたる(持続的な)学習が重要な応用(アプリケーション)を有する。しかし、新しい訓練サンプルセットを使用して、訓練により得られた元のモデルをさらに訓練する場合に、得られた新しいモデルは元のモデルのパフォーマンスを失う可能性がある。
【発明の概要】
【発明が解決しようとする課題】
【0003】
上述の問題に鑑み、本発明の目的は、従来技術における1つ又は複数の欠点を解決し得る情報処理装置、情報処理方法及びコンピュータプログラムを提供することにある。
【課題を解決するための手段】
【0004】
本発明の1つの側面によれば、情報処理装置が提供され、それは、
第二タスクについての第二訓練サンプルセットに基づいて得られたサンプル生成ネットワークを利用して、第一タスクについての第一シミュレットサンプルセットを生成するように構成されるサンプル生成ユニット;及び
第一所定条件の下で、前記第二訓練サンプルセットを利用して、前記第一タスクについての事前訓練の第一モデルを再訓練し、予測待ち対象を予測するための再訓練の第一モデルを取得するように構成される第一モデル訓練ユニットを含み、
前記第一所定条件は、前記事前訓練の第一モデルの、前記第一シミュレットサンプルセットに対しての予測結果と、前記再訓練の第一モデルの、前記第一シミュレットサンプルセットに対しての予測結果との間の差が所定範囲内にあることを含み、
前記第一タスクは前記第二タスクとは異なり、
前記予測待ち対象は第一タスク及び/又は第二タスクに関する。
【0005】
本発明のもう1つの側面によれば、情報処理方法が提供され、それは、
第二タスクについての第二訓練サンプルセットに基づいて得られたサンプル生成ネットワークを利用して、第一タスクについての第一シミュレットサンプルセットを生成し;及び
第一所定条件の下で、前記第二訓練サンプルセットを利用して、前記第一タスクについての事前訓練の第一モデルを再訓練し、予測待ち対象を予測するための再訓練の第一モデルを取得することを含み、
前記第一所定条件は、前記事前訓練の第一モデルの、前記第一シミュレットサンプルセットに対しての予測結果と、前記再訓練の第一モデルの、前記第一シミュレットサンプルセットに対しての予測結果との間の差が所定範囲内にあることを含み、
前記第一タスクは前記第二タスクとは異なり、
前記予測待ち対象は第一タスク及び/又は第二タスクに関する。
【0006】
本発明の他の側面によれば、コンピュータプログラムがさらに提供され、前記コンピュータプログラムは前記コンピュータに、上述のような情報処理方法を実行させるためのものである。
【図面の簡単な説明】
【0007】
本発明の第一実施例による情報処理装置の機能構成例を示すブロック図である。
本発明の第二実施例による情報処理装置の機能構成例を示すブロック図である。
本発明の第二実施例によるサンプル生成ネットワーク取得ユニットが行う調整プロセスを示す図である。
第二訓練サンプルの例及びシミュレットサンプルの例を示す図である。
本発明の第三実施例による情報処理装置の機能構成例を示すブロック図である。
本発明の第三実施例によるサンプル生成ネットワーク取得ユニットが行う訓練プロセスを示す図である。
第二訓練サンプルの例及びシミュレットサンプルの他の例を示す図である。
本発明による技術と関連技術との比較を示す図である。
本発明の第四実施例による情報処理方法の例示的なフローチャートである。
本発明の実施例で採用され得るパーソナルコンピュータの構成例を示すブロック図である。
【発明を実施するための形態】
【0008】
以下、図面と併せて本発明の実施形態を具体的に説明する。なお、以下に説明される実施例は例示に過ぎず、本発明を限定しない。
【実施例】
【0009】
図1は本発明の第一実施例による情報処理装置100の機能構成例を示すブロック図である。図1に示すように、本発明の第一実施例による情報処理装置100はサンプル生成ユニット102及び第一モデル訓練ユニット104を含み得る。
【0010】
サンプル生成ユニット102は、第二タスクについての第二訓練サンプルセットに基づいて得られたサンプル生成ネットワークを利用して、第一タスクについての第一シミュレットサンプルセットを生成するように構成されても良い。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
光信号増幅
1か月前
富士通株式会社
アバター制御
4日前
富士通株式会社
半導体デバイス
26日前
富士通株式会社
評価装置及び評価方法
18日前
富士通株式会社
生命体の感知方法と装置
27日前
富士通株式会社
半導体装置及び実装方法
11日前
富士通株式会社
介入方法及び介入プログラム
19日前
富士通株式会社
ヘテロ積層デバイスの製造方法
13日前
富士通株式会社
受信器および適応等化処理方法
1日前
富士通株式会社
生体の位置の検出方法及び装置
27日前
富士通株式会社
自動探索的データ解析(EDA)
6日前
富士通株式会社
介入支援方法、介入支援プログラム
1か月前
富士通株式会社
電力分配回路、及び、電力合成回路
27日前
富士通株式会社
分散学習プログラム、方法、及び装置
13日前
富士通株式会社
施策決定方法及び施策決定プログラム
7日前
富士通株式会社
機器特定方法及び機器特定プログラム
27日前
富士通株式会社
セキュリティポリシーの判定及び適用
21日前
富士通株式会社
深層信念ネットワークのトレーニング
1日前
富士通株式会社
パケット制御回路及びパケット制御方法
25日前
富士通株式会社
信号の暗号化に関する方法及びシステム
1か月前
富士通株式会社
作業割当方法および作業割当プログラム
1か月前
富士通株式会社
推定プログラム、推定方法および推定装置
18日前
富士通株式会社
習熟度推定方法および習熟度推定プログラム
1か月前
富士通株式会社
オブジェクトの計数装置、方法及び電子機器
18日前
富士通株式会社
施策評価支援方法及び施策評価支援プログラム
5日前
富士通株式会社
推定プログラム、機械学習方法、及び推定装置
19日前
富士通株式会社
倫理学に基づくマルチモーダルユーザ投稿監視
1か月前
富士通株式会社
情報処理装置、情報処理方法およびプログラム
15日前
富士通株式会社
評価プログラム,評価方法および情報処理装置
21日前
富士通株式会社
乗降者カウントプログラムおよび情報処理装置
1日前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
1日前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
1日前
富士通株式会社
生成プログラム、生成方法、および情報処理装置
18日前
富士通株式会社
修正プログラム、修正方法、および情報処理装置
18日前
富士通株式会社
半導体装置、半導体装置の製造方法及び電子装置
15日前
富士通株式会社
窒化物半導体装置及び窒化物半導体装置の製造方法
18日前
続きを見る