TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024124254
公報種別
公開特許公報(A)
公開日
2024-09-12
出願番号
2023032272
出願日
2023-03-02
発明の名称
探索プログラム、探索方法および情報処理装置
出願人
富士通株式会社
代理人
弁理士法人酒井国際特許事務所
主分類
G06F
17/15 20060101AFI20240905BHJP(計算;計数)
要約
【課題】データ間に相関がある条件の組み合わせ探索の高速化を支援する。
【解決手段】実施形態の探索プログラムは、各データを行、当該データに含まれる属性が所定の条件を満たすか否かを列とする行列に基づいて各データにおいて相関を有する1または複数の条件を探索する際に、算出する処理と、ソートする処理と、割り当てる処理とをコンピュータに実行させる。算出する処理は、行列の列ごとに、条件を満たすデータ数を算出する。ソートする処理は、算出した列ごとのデータ数に基づいて、行列の列の並び順をソートする。割り当てる処理は、ソートした列の並び順に基づいて、列に対応する条件の組み合わせを、相関の有無を計算する各プロセスに割り当てる。
【選択図】図1
特許請求の範囲
【請求項1】
各データを行、当該データに含まれる属性が所定の条件を満たすか否かを列とする行列に基づいて前記各データにおいて相関を有する1または複数の条件を探索する際に、
前記行列の列ごとに、前記条件を満たすデータ数を算出し、
算出した前記列ごとのデータ数に基づいて、前記行列の列の並び順をソートし、
ソートした前記列の並び順に基づいて、前記列に対応する条件の組み合わせを、前記相関の有無を計算する各プロセスに割り当てる、
処理をコンピュータに実行させることを特徴とする探索プログラム。
続きを表示(約 850 文字)
【請求項2】
前記割り当てる処理は、前記列の並び順に1または複数の列を選択して得られた前記条件の組み合わせを順に前記各プロセスに割り当てる、
ことを特徴とする請求項1に記載の探索プログラム。
【請求項3】
前記行列は、前記条件を満たすか否かを0または1の2値で表し、
前記算出する処理は、前記行列の列ごとに、値が1である行数をカウントして前記データ数を算出する、
ことを特徴とする請求項1に記載の探索プログラム。
【請求項4】
前記各プロセスは、前記データ数が所定値以上である組み合わせについて前記相関の有無を計算する、
ことを特徴とする請求項1に記載の探索プログラム。
【請求項5】
各データを行、当該データに含まれる属性が所定の条件を満たすか否かを列とする行列に基づいて前記各データにおいて相関を有する1または複数の条件を探索する際に、
前記行列の列ごとに、前記条件を満たすデータ数を算出し、
算出した前記列ごとのデータ数に基づいて、前記行列の列の並び順をソートし、
ソートした前記列の並び順に基づいて、前記列に対応する条件の組み合わせを、前記相関の有無を計算する各プロセスに割り当てる、
処理をコンピュータが実行することを特徴とする探索方法。
【請求項6】
各データを行、当該データに含まれる属性が所定の条件を満たすか否かを列とする行列に基づいて前記各データにおいて相関を有する1または複数の条件を探索する際に、
前記行列の列ごとに、前記条件を満たすデータ数を算出し、
算出した前記列ごとのデータ数に基づいて、前記行列の列の並び順をソートし、
ソートした前記列の並び順に基づいて、前記列に対応する条件の組み合わせを、前記相関の有無を計算する各プロセスに割り当てる、
処理を実行する制御部を含むことを特徴とする情報処理装置。
発明の詳細な説明
【技術分野】
【0001】
本発明の実施形態は、探索プログラム、探索方法および情報処理装置に関する。
続きを表示(約 1,400 文字)
【背景技術】
【0002】
従来、消費者の購買傾向などを分析するため、顧客の購買履歴などのサンプルデータ群をもとに、サンプルデータ間に相関がある条件の組み合わせを求めるデータ解析が行われている。
【0003】
図7は、従来の相関計算を説明する説明図である。図7に示すように、従来の情報処理装置では、サンプルデータ群をもとに、サンプルデータのそれぞれが各条件を満たすか否かを示す行列D100を作成する。この行列D100の各行は、識別情報(サンプルid)で識別されるサンプルデータを示す。また、行列D100の各列は、サンプルデータに含まれる属性(例えば年齢)が所定の条件(例えば20歳未満)を満たすか否かを1/0の2値で示す。
【0004】
従来の情報処理装置では、探索対象とする条件の組み合わせについて、行列D100をもとに、組み合わせた条件に該当するサンプルデータを抽出する。例えば、「年齢が20歳未満」、「体重が50kg以上」の条件の組み合わせについては、両方の条件に対応する2列の値が1(条件を満たす)であるサンプルデータ(図示例ではid=1,4)が抽出される。ついで、従来の情報処理装置では、抽出したサンプルデータについて、2つの属性を抜き出して属性間の相関を示す相関係数を計算する。従来の情報処理装置は、この相関係数の計算結果をもとに、相関係数が閾値を超える属性ペアが1または複数ある場合、探索対象とする条件の組み合わせ(例えば、「年齢が20歳未満」、「体重が50kg以上」)についてサンプルデータ間に相関があるものとする。
【0005】
このように条件を組み合わせて相関計算を行う探索は、条件の数をdx、組み合わせる条件の数をkとすると、
dx
C
k
回実施される。このため、dxやkが大きくなると探索回数は爆発的に増加する。例えば、dx=10000、k=3とすると、
10000
C
3
=1.33×10
12
となる。
【0006】
この探索は、条件の組み合わせごとに独立して行うことができるため、条件の組み合わせを各プロセスに割り当てて並列化することで、処理を高速化することができる。
【先行技術文献】
【特許文献】
【0007】
特開2003-44280号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、上記の従来技術では、並列化したプロセス間の計算量に不均衡が生じ、プロセス間の計算時間にばらつきが生じるという問題がある。このため、計算量が過大なプロセスの計算時間によって全プロセスの終了時間が遅くなり、結果的に処理の高速化が実現できないことがある。
【0009】
図8は、従来の相関計算を説明する説明図である。図8に示す行列D100に対し、従来の情報処理装置が条件(列)の組を順に2プロセス(rank0,rank1)に割り当てて並列に処理する場合を考える。
【0010】
条件(列)の組み合わせ数がk=1の場合、rank0のプロセスに割り当てる組み合わせは、(x0)、(x2)、(x4)となる。また、rank1のプロセスに割り当てる組み合わせは、(x1)、(x3)、(x5)となる。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
富士通株式会社
情報処理プログラム
5日前
富士通株式会社
プロセッサパッケージ
1か月前
富士通株式会社
光伝送装置及び光伝送方法
10日前
富士通株式会社
光増幅器および光増幅方法
1か月前
富士通株式会社
プロセッサ及び情報処理装置
24日前
富士通株式会社
変換プログラムおよび変換方法
1か月前
富士通株式会社
故障監視装置および故障監視方法
17日前
富士通株式会社
歩容認識装置、方法及び電子機器
1か月前
富士通株式会社
光伝送装置および光伝送システム
17日前
富士通株式会社
エラー訂正装置及びエラー訂正方法
11日前
富士通株式会社
ラマン増幅装置およびラマン増幅方法
10日前
富士通株式会社
光送受信機制御方法および光送受信機
16日前
富士通株式会社
機械学習プログラム、方法、及び装置
5日前
富士通株式会社
収入特定方法および収入特定プログラム
23日前
富士通株式会社
OD決定方法およびOD決定プログラム
16日前
富士通株式会社
マルチチャネルパワープロファイル推定
1か月前
富士通株式会社
情報処理方法および情報処理プログラム
10日前
富士通株式会社
データ生成プログラム、方法、及び装置
5日前
富士通株式会社
キャッシュコントローラ及び演算処理装置
4日前
富士通株式会社
制御プログラム、制御装置、及び制御方法
3日前
富士通株式会社
評価プログラム、評価装置及び評価システム
1か月前
富士通株式会社
自己教師あり学習プログラム、方法、及び装置
17日前
富士通株式会社
自己教師あり学習プログラム、方法、及び装置
17日前
富士通株式会社
位置情報処理装置およびサービス提供システム
24日前
富士通株式会社
データ処理装置、プログラム及びデータ処理方法
18日前
富士通株式会社
半導体装置、半導体装置の製造方法及び電子装置
3日前
富士通株式会社
行動要因推定方法および行動要因推定プログラム
4日前
富士通株式会社
半導体装置、半導体装置の製造方法及び電子装置
5日前
富士通株式会社
タスク割り当て方法、タスク割り当てプログラム
24日前
富士通株式会社
情報処理システム、情報処理方法及びプログラム
25日前
富士通株式会社
特定プログラム、特定方法、および情報処理装置
3日前
富士通株式会社
プログラム、データ処理装置及びデータ処理方法
18日前
富士通株式会社
機械学習プログラム、機械学習方法及び機械学習装置
4日前
富士通株式会社
コンパイラ、コンパイル方法、およびコンパイル装置
5日前
富士通株式会社
コンパイラプログラム、判定方法および情報処理装置
24日前
富士通株式会社
情報管理プログラム、情報管理方法及び情報管理装置
3日前
続きを見る
他の特許を見る