TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024124254
公報種別公開特許公報(A)
公開日2024-09-12
出願番号2023032272
出願日2023-03-02
発明の名称探索プログラム、探索方法および情報処理装置
出願人富士通株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06F 17/15 20060101AFI20240905BHJP(計算;計数)
要約【課題】データ間に相関がある条件の組み合わせ探索の高速化を支援する。
【解決手段】実施形態の探索プログラムは、各データを行、当該データに含まれる属性が所定の条件を満たすか否かを列とする行列に基づいて各データにおいて相関を有する1または複数の条件を探索する際に、算出する処理と、ソートする処理と、割り当てる処理とをコンピュータに実行させる。算出する処理は、行列の列ごとに、条件を満たすデータ数を算出する。ソートする処理は、算出した列ごとのデータ数に基づいて、行列の列の並び順をソートする。割り当てる処理は、ソートした列の並び順に基づいて、列に対応する条件の組み合わせを、相関の有無を計算する各プロセスに割り当てる。
【選択図】図1
特許請求の範囲【請求項1】
各データを行、当該データに含まれる属性が所定の条件を満たすか否かを列とする行列に基づいて前記各データにおいて相関を有する1または複数の条件を探索する際に、
前記行列の列ごとに、前記条件を満たすデータ数を算出し、
算出した前記列ごとのデータ数に基づいて、前記行列の列の並び順をソートし、
ソートした前記列の並び順に基づいて、前記列に対応する条件の組み合わせを、前記相関の有無を計算する各プロセスに割り当てる、
処理をコンピュータに実行させることを特徴とする探索プログラム。
続きを表示(約 850 文字)【請求項2】
前記割り当てる処理は、前記列の並び順に1または複数の列を選択して得られた前記条件の組み合わせを順に前記各プロセスに割り当てる、
ことを特徴とする請求項1に記載の探索プログラム。
【請求項3】
前記行列は、前記条件を満たすか否かを0または1の2値で表し、
前記算出する処理は、前記行列の列ごとに、値が1である行数をカウントして前記データ数を算出する、
ことを特徴とする請求項1に記載の探索プログラム。
【請求項4】
前記各プロセスは、前記データ数が所定値以上である組み合わせについて前記相関の有無を計算する、
ことを特徴とする請求項1に記載の探索プログラム。
【請求項5】
各データを行、当該データに含まれる属性が所定の条件を満たすか否かを列とする行列に基づいて前記各データにおいて相関を有する1または複数の条件を探索する際に、
前記行列の列ごとに、前記条件を満たすデータ数を算出し、
算出した前記列ごとのデータ数に基づいて、前記行列の列の並び順をソートし、
ソートした前記列の並び順に基づいて、前記列に対応する条件の組み合わせを、前記相関の有無を計算する各プロセスに割り当てる、
処理をコンピュータが実行することを特徴とする探索方法。
【請求項6】
各データを行、当該データに含まれる属性が所定の条件を満たすか否かを列とする行列に基づいて前記各データにおいて相関を有する1または複数の条件を探索する際に、
前記行列の列ごとに、前記条件を満たすデータ数を算出し、
算出した前記列ごとのデータ数に基づいて、前記行列の列の並び順をソートし、
ソートした前記列の並び順に基づいて、前記列に対応する条件の組み合わせを、前記相関の有無を計算する各プロセスに割り当てる、
処理を実行する制御部を含むことを特徴とする情報処理装置。

発明の詳細な説明【技術分野】
【0001】
本発明の実施形態は、探索プログラム、探索方法および情報処理装置に関する。
続きを表示(約 1,400 文字)【背景技術】
【0002】
従来、消費者の購買傾向などを分析するため、顧客の購買履歴などのサンプルデータ群をもとに、サンプルデータ間に相関がある条件の組み合わせを求めるデータ解析が行われている。
【0003】
図7は、従来の相関計算を説明する説明図である。図7に示すように、従来の情報処理装置では、サンプルデータ群をもとに、サンプルデータのそれぞれが各条件を満たすか否かを示す行列D100を作成する。この行列D100の各行は、識別情報(サンプルid)で識別されるサンプルデータを示す。また、行列D100の各列は、サンプルデータに含まれる属性(例えば年齢)が所定の条件(例えば20歳未満)を満たすか否かを1/0の2値で示す。
【0004】
従来の情報処理装置では、探索対象とする条件の組み合わせについて、行列D100をもとに、組み合わせた条件に該当するサンプルデータを抽出する。例えば、「年齢が20歳未満」、「体重が50kg以上」の条件の組み合わせについては、両方の条件に対応する2列の値が1(条件を満たす)であるサンプルデータ(図示例ではid=1,4)が抽出される。ついで、従来の情報処理装置では、抽出したサンプルデータについて、2つの属性を抜き出して属性間の相関を示す相関係数を計算する。従来の情報処理装置は、この相関係数の計算結果をもとに、相関係数が閾値を超える属性ペアが1または複数ある場合、探索対象とする条件の組み合わせ(例えば、「年齢が20歳未満」、「体重が50kg以上」)についてサンプルデータ間に相関があるものとする。
【0005】
このように条件を組み合わせて相関計算を行う探索は、条件の数をdx、組み合わせる条件の数をkとすると、
dx


回実施される。このため、dxやkが大きくなると探索回数は爆発的に増加する。例えば、dx=10000、k=3とすると、
10000


=1.33×10
12
となる。
【0006】
この探索は、条件の組み合わせごとに独立して行うことができるため、条件の組み合わせを各プロセスに割り当てて並列化することで、処理を高速化することができる。
【先行技術文献】
【特許文献】
【0007】
特開2003-44280号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、上記の従来技術では、並列化したプロセス間の計算量に不均衡が生じ、プロセス間の計算時間にばらつきが生じるという問題がある。このため、計算量が過大なプロセスの計算時間によって全プロセスの終了時間が遅くなり、結果的に処理の高速化が実現できないことがある。
【0009】
図8は、従来の相関計算を説明する説明図である。図8に示す行列D100に対し、従来の情報処理装置が条件(列)の組を順に2プロセス(rank0,rank1)に割り当てて並列に処理する場合を考える。
【0010】
条件(列)の組み合わせ数がk=1の場合、rank0のプロセスに割り当てる組み合わせは、(x0)、(x2)、(x4)となる。また、rank1のプロセスに割り当てる組み合わせは、(x1)、(x3)、(x5)となる。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
測定装置
28日前
富士通株式会社
画像変換機器と方法
1か月前
富士通株式会社
データセット特徴タイプ推論
14日前
富士通株式会社
信号相関量の確定装置と方法
14日前
富士通株式会社
光伝送装置および光伝送方法
1か月前
富士通株式会社
光伝送装置および光伝送システム
15日前
富士通株式会社
双方向光リンクの異常モニタリング
17日前
富士通株式会社
バイアスのための生成人工知能の検査
7日前
富士通株式会社
制御プログラム、制御方法及び決済装置
10日前
富士通株式会社
大規模言語モデルを使用したデータ調整
14日前
富士通株式会社
情報処理プログラムおよび情報処理方法
14日前
富士通株式会社
選択プログラム、選択装置、及び選択方法
17日前
富士通株式会社
圧縮プログラム、圧縮方法および圧縮装置
28日前
富士通株式会社
光送信機サブ信号光位相差の確定装置と方法
14日前
富士通株式会社
無線アクセスネットワークプロビジョニング
14日前
富士通株式会社
赤外線センサ、及び赤外線センサの製造方法
23日前
富士通株式会社
広告画像を生成する方法、装置及び記憶媒体
21日前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
14日前
富士通株式会社
量子ビットデバイス及び量子ビットデバイスの製造方法
21日前
富士通株式会社
情報処理プログラム、情報処理方法、及び情報処理装置
15日前
富士通株式会社
情報処理プログラム、情報処理装置、および情報処理方法
10日前
富士通株式会社
出力制御プログラム、出力制御方法およびナビゲーション装置
1か月前
富士通株式会社
光送信機のサブ信号の遅延差のリアルタイム監視装置及び方法
14日前
富士通株式会社
特徴抽出装置、画像マッチング機器及びコンピュータプログラム
1日前
富士通株式会社
ブロックチェーンに基づくエスクローされたマーケットプレイス
14日前
富士通株式会社
共有メモリ制御プログラム、共有メモリ制御方法および情報処理装置
14日前
富士通株式会社
光伝送路特性推定装置、光伝送システム、及び光伝送路特性推定方法
15日前
富士通株式会社
スタート支援装置、スタート支援方法、およびスタート支援プログラム
15日前
富士通株式会社
棄却なしの並列試行マルコフ連鎖モンテカルロ法を用いた統計的サンプリング
7日前
富士通株式会社
機械学習プログラム、機械学習方法、推論プログラム、推論方法及び情報処理装置
28日前
富士通株式会社
交通シミュレーションの進化を予測するための、コンピュータにより実施される方法
1か月前
富士通株式会社
依存情報を列に集約したマトリクススケジューラ及びマトリクススケジューリング方法
22日前
富士通株式会社
量子回路シミュレーションプログラム、量子回路シミュレーション方法および情報処理装置
23日前
富士通株式会社
機械学習プログラム、判定プログラム、機械学習方法、判定方法、機械学習装置、および判定装置
7日前
個人
対話装置
1か月前
個人
裁判のAI化
今日
続きを見る