TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024057518
公報種別公開特許公報(A)
公開日2024-04-24
出願番号2022164321
出願日2022-10-12
発明の名称サンプリングプログラム、サンプリング方法および情報処理装置
出願人富士通株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06N 20/00 20190101AFI20240417BHJP(計算;計数)
要約【課題】問題に依存しない適切なサンプリングを行うことを課題とする。
【解決手段】情報処理装置は、第1の確率分布に物理量である逆温度に基づく逆温度パラメータを追加して得られた第2の確率分布のサンプリングを行い、サンプリングして得られた第1のデータに基づいて第1の変分モデルを訓練する。情報処理装置は、訓練済みである第1の変分モデルを用いて、逆温度パラメータの値を増加させて得られた第3の確率分布のサンプリングを行い、サンプリングされた第2のデータに基づいて第2の変分モデルを訓練する。情報処理装置は、訓練済みである第2の変分モデルを用いた第3の確率分布のサンプリングの結果に基づき、第1の確率分布に対応するサンプルを出力する。
【選択図】図1
特許請求の範囲【請求項1】
コンピュータに、
第1の確率分布に物理量である逆温度に基づく逆温度パラメータを追加して得られた第2の確率分布のサンプリングを行い、サンプリングして得られた第1のデータに基づいて第1の変分モデルを訓練し、
訓練済みである前記第1の変分モデルを用いて、前記逆温度パラメータの値を増加させて得られた第3の確率分布のサンプリングを行い、サンプリングされた第2のデータに基づいて第2の変分モデルを訓練し、
訓練済みである前記第2の変分モデルを用いた前記第3の確率分布のサンプリングの結果に基づき、前記第1の確率分布に対応するサンプルを出力する、
処理を実行させるサンプリングプログラム。
続きを表示(約 1,600 文字)【請求項2】
前記第2の変分モデルを訓練する処理は、
訓練済みである前記第1の変分モデルのモデルパラメータを初期値とし、前記第2のデータを用いて前記第2の変分モデルを訓練する、
処理を実行する請求項1に記載のサンプリングプログラム。
【請求項3】
前記第1の変分モデルを訓練する処理は、
モンテカルロ法を用いたサンプリングにより前記第2の確率分布から前記第1のデータを取得し、前記第1のデータに基づいて前記第1の確率分布を学習する前記第1の変分モデルを訓練し、
前記第2の変分モデルを訓練する処理は、
訓練済みの前記第1の変分モデルを提案確率分布とする自己学習モンテカルロ法により、前記第3の確率分布から前記第2のデータをサンプリングし、
前記第2のデータに基づいて、前記第3の確率分布を学習する前記第2の変分モデルを訓練する、
処理を実行する請求項2に記載のサンプリングプログラム。
【請求項4】
前記第1の確率分布に前記逆温度に基づく異なる2つの逆温度パラメータそれぞれを追加して得られた異なる2つの確率分布を生成し、
一方の確率分布からサンプリングされたデータを用いて、他方の確率分布に基づく変分モデルの訓練を実行し、前記他方の確率分布からサンプリングされたデータを用いて、前記一方の確率分布に基づく変分モデルの訓練を実行する、
処理を前記コンピュータにさらに実行させる請求項1に記載のサンプリングプログラム。
【請求項5】
確率分布に前記逆温度に基づく逆温度パラメータを追加して得られた拡張確率分布から、前記確率分布からサンプリングされたデータを用いて訓練された訓練済みの変分モデルを用いてサンプリングを行い、サンプリングされたデータを用いて前記拡張確率分布を学習する変分モデルの訓練を実行する処理と、
前記逆温度パラメータの値を増加させつつ、増加させた前記逆温度パラメータの値が所定値となるまで前記訓練を実行する処理を繰り返す処理と、
前記繰り返す処理の完了後に、前記所定値の逆温度パラメータの値を増加させて得られた拡張確率分布から、直前の確率分布を学習した訓練済みの変分モデルを用いてサンプリングして得られたデータを、前記確率分布の最適解として出力する処理と、
前記コンピュータにさらに実行させる請求項1に記載のサンプリングプログラム。
【請求項6】
コンピュータが、
第1の確率分布に物理量である逆温度に基づく逆温度パラメータを追加して得られた第2の確率分布のサンプリングを行い、サンプリングして得られた第1のデータに基づいて第1の変分モデルを訓練し、
訓練済みである前記第1の変分モデルを用いて、前記逆温度パラメータの値を増加させて得られた第3の確率分布のサンプリングを行い、サンプリングされた第2のデータに基づいて第2の変分モデルを訓練し、
訓練済みである前記第2の変分モデルを用いた前記第3の確率分布のサンプリングの結果に基づき、前記第1の確率分布に対応するサンプルを出力する、
処理を実行するサンプリング方法。
【請求項7】
第1の確率分布に物理量である逆温度に基づく逆温度パラメータを追加して得られた第2の確率分布のサンプリングを行い、サンプリングして得られた第1のデータに基づいて第1の変分モデルを訓練し、
訓練済みである前記第1の変分モデルを用いて、前記逆温度パラメータの値を増加させて得られた第3の確率分布のサンプリングを行い、サンプリングされた第2のデータに基づいて第2の変分モデルを訓練し、
訓練済みである前記第2の変分モデルを用いた前記第3の確率分布のサンプリングの結果に基づき、前記第1の確率分布に対応するサンプルを出力する、
制御部を有する情報処理装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、確率分布からサンプリングを行うサンプリングプログラム等に関する。
続きを表示(約 2,100 文字)【背景技術】
【0002】
従来から、数式で明示的に与えられた確率分布から具体的なサンプルを得るサンプリングが利用されている。確率分布からサンプリングを行う手法としてモンテカルロ法が知られている。また、モンテカルロ法としては、マルコフ連鎖を用いずに確率分布からサンプリングを行う静的なモンテカルロ法と、マルコフ連鎖を用いて確率分布からサンプリングを行うマルコフ連鎖モンテカルロ法(MCMC:Markov Chain Monte Carlo methods)が知られている。
【0003】
現実的な時間で確率変数の空間の多くの領域に遷移でき、直前の状態とはできるだけ異なる状態に遷移可能なMCMCは、正確かつ、サンプル列の自己相関が小さくなり独立と見なせる有効なサンプル数が増加するため効率的である。
【0004】
近年、MCMCはベイズ統計を中心に広い範囲の統計の問題に応用されている。例えば、物理学で現れる多体問題は一般的に解析的な計算は不可能となることが多く、物理系の状態をサンプリングして性質を調べることが要求される。また、近年注目されている量子計算のシミュレーションにもMCMCが使用される。また、実験により得られたデータをある有効モデルに当てはめることを考える場合、ベイズ推定では事後分布からのサンプリングが要求される。
【先行技術文献】
【非特許文献】
【0005】
Koji Hukushima and Koji Nemoto,「Exchange Monte Carlo method and application to spin glass simulations」,Journal of the Physical Society of Japan,vol.65,no.6,pp.1604-1608,1996/06/15
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上記技術では、特定の問題に対して、適切なサンプリングを行うことができない。例えば、多峰的な分布に対してMCMCを行った場合、ある状態への遷移確率が小さくなり、実質的に遷移が行われず、結果として、統計問題を間違えた結果に導くことがある。また、相転移点近傍に対して、確率変数の空間の中である局所的な空間に留まり続け、初期条件に強く依存し、適切なサンプリングが難しくなる。
【0007】
一つの側面では、問題に依存しない適切なサンプリングを行うことができるサンプリングプログラム、サンプリング方法および情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
第1の案では、サンプリングプログラムは、コンピュータに、第1の確率分布に物理量である逆温度に基づく逆温度パラメータを追加して得られた第2の確率分布のサンプリングを行い、サンプリングして得られた第1のデータに基づいて第1の変分モデルを訓練し、訓練済みである前記第1の変分モデルを用いて、前記逆温度パラメータの値を増加させて得られた第3の確率分布のサンプリングを行い、サンプリングされた第2のデータに基づいて第2の変分モデルを訓練し、訓練済みである前記第2の変分モデルを用いた前記第3の確率分布のサンプリングの結果に基づき、前記第1の確率分布に対応するサンプルを出力する、処理を実行させる。
【発明の効果】
【0009】
一実施形態によれば、問題に依存しない適切なサンプリングを行うことができる。
【図面の簡単な説明】
【0010】
図1は、実施例1にかかる情報処理装置を説明する図である。
図2は、メトロポリス法を説明する図である。
図3は、特定問題に対する問題点を説明する図である。
図4は、自己学習モンテカルロ法を説明する図である。
図5は、実施例1にかかる情報処理装置の機能構成を示す機能ブロック図である。
図6は、実施例1にかかる逆温度拡張の効果を説明する図である。
図7は、実施例1にかかるアニーリングSLMCを説明する図である。
図8は、実施例1にかかる処理の流れを説明するフローチャートである。
図9は、数値実験の結果を説明する図である。
図10は、数値実験の結果を説明する図である。
図11は、採択率の監視により逆温度の間隔制御を説明する図である。
図12は、アニーリングの逐次学習を説明する図である。
図13は、実施例2にかかるアニーリングプロセスのパラレル実行を説明する図である。
図14は、最適化問題への応用を説明する図である。
図15は、ハードウェア構成例を説明する図である。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
光送信機
5日前
富士通株式会社
プロセッサ
12日前
富士通株式会社
光リンク電力プロファイル推定
5日前
富士通株式会社
光送信機、及びバイアス制御方法
24日前
富士通株式会社
演算処理装置および演算処理方法
17日前
富士通株式会社
評価プログラム、評価方法、評価装置
12日前
富士通株式会社
プログラム,方法,及び情報処理装置
11日前
富士通株式会社
性能監視プログラムおよび性能監視方法
5日前
富士通株式会社
機械学習プログラムおよび機械学習方法
5日前
富士通株式会社
検出プログラム,検出方法および検出装置
11日前
富士通株式会社
優先度決定方法及び優先度決定プログラム
20日前
富士通株式会社
抽出プログラム、抽出方法および情報処理装置
11日前
富士通株式会社
光伝送システム、波長変換器、及び光伝送装置
18日前
富士通株式会社
判定プログラム、判定方法、および情報処理装置
12日前
富士通株式会社
指標項目特定方法および指標項目特定プログラム
20日前
富士通株式会社
多重化変換器の伝送劣化を評価する方法及び装置
5日前
富士通株式会社
制御方法、制御プログラム、および情報処理装置
20日前
富士通株式会社
最適化プログラム、最適化方法および情報処理装置
5日前
富士通株式会社
最適化プログラム、最適化装置、および最適化方法
25日前
富士通株式会社
機械学習プログラム,機械学習方法及び情報処理装置
12日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
17日前
富士通株式会社
機械学習プログラム,機械学習方法及び情報処理装置
17日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
5日前
富士通株式会社
機械学習プログラム、情報処理装置および機械学習方法
17日前
富士通株式会社
機械学習プログラム、機械学習方法および情報処理装置
4日前
富士通株式会社
制御システム、制御装置、制御方法および制御プログラム
24日前
富士通株式会社
ソフトウェア・パッケージのためのバージョン更新の推奨
24日前
富士通株式会社
劣化診断プログラム、劣化診断方法、および情報処理装置
20日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
24日前
富士通株式会社
データ管理プログラム、データ管理方法及びデータ管理装置
24日前
富士通株式会社
フロー生成プログラム、フロー生成方法および情報処理装置
25日前
富士通株式会社
量子コンピュータを用いた浅い回路上での最適化問題の解法
10日前
富士通株式会社
商品購入支援プログラム、情報処理装置及び商品購入支援方法
19日前
富士通株式会社
トレーニング方法,演算処理装置及びトレーニングプログラム
10日前
富士通株式会社
サンプリングプログラム、サンプリング方法および情報処理装置
11日前
富士通株式会社
データ同期プログラム及びデータ同期方法、並びに情報処理装置
24日前
続きを見る