TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024068340
公報種別公開特許公報(A)
公開日2024-05-20
出願番号2022178710
出願日2022-11-08
発明の名称データ操作プログラム、データ操作システム、およびデータ操作方法
出願人国立大学法人静岡大学
代理人個人,個人,個人
主分類G06F 16/901 20190101AFI20240513BHJP(計算;計数)
要約【課題】ストリーミングデータの中でクエリに対応するデータがどのくらい出現するかを検索するための仕組みを提供すること。
【解決手段】データ操作プログラムは、ストリーミングデータに含まれるトランザクションのアイテム数の最大値をmとし、トランザクションを記録するためのカウンタの衝突に関する値の種類数をpとして、それぞれがp個の配列セットを含むm個の配列セットグループを生成する生成ステップであって、各配列セットが複数の1次元配列を含み、各1次元配列の各要素がカウンタに対応する、該生成ステップと、複数のトランザクションのそれぞれについて、(i)該トランザクションのアイテム数に対応する配列セットグループを選択し、(ii)該配列セットグループ内の各1次元配列において、該トランザクションに対応するカウンタをインクリメントする登録ステップとをコンピュータに実行させる。
【選択図】図1
特許請求の範囲【請求項1】
ストリーミングデータに含まれるトランザクションのアイテム数の最大値をmとし、前記トランザクションを記録するためのカウンタの衝突に関する値の種類数をpとして、それぞれがp個の配列セットを含むm個の配列セットグループを生成する生成ステップであって、各配列セットが複数の1次元配列を含み、各1次元配列の各要素が前記カウンタに対応する、該生成ステップと、
複数の前記トランザクションのそれぞれについて、(i)該トランザクションのアイテム数に対応する前記配列セットグループを選択し、(ii)該配列セットグループ内の各1次元配列において、該トランザクションに対応する前記カウンタをインクリメントする登録ステップと、
をコンピュータに実行させるデータ操作プログラム。
続きを表示(約 3,500 文字)【請求項2】
クエリに対応する前記トランザクションの出現度を算出する検索ステップを前記コンピュータに更に実行させ、
前記検索ステップが、
前記クエリのアイテム数から前記mまでの範囲に対応する少なくとも一つの前記配列セットグループのそれぞれの各配列セットについて、カーネル密度推定による推定値を算出するステップと、
前記少なくとも一つの配列セットグループのそれぞれについて、該配列セットグループの各配列セットの前記推定値と、該配列セットグループに対応するJaccard行列とに基づいて、該配列セットグループにおける部分出現度を算出するステップと、
少なくとも一つの前記部分出現度に基づいて前記出現度を算出するステップと、
を含む、
請求項1に記載のデータ操作プログラム。
【請求項3】
ストリーミングデータに含まれる複数のトランザクションのそれぞれについてデータ構造にカウンタを記録する登録ステップをコンピュータに実行させ、
前記データ構造が、トランザクションのアイテム数の最大値をmとし、前記トランザクションを記録するためのカウンタの衝突に関する値の種類数をpとして、それぞれがp個の配列セットを含むm個の配列セットグループを含み、各配列セットが複数の1次元配列を含み、各1次元配列の各要素が前記カウンタに対応し、
前記登録ステップが、前記複数のトランザクションのそれぞれについて、(i)該トランザクションのアイテム数に対応する前記配列セットグループを選択し、(ii)該配列セットグループ内の各1次元配列において、該トランザクションに対応する前記カウンタをインクリメントするステップを含む、
データ操作プログラム。
【請求項4】
ストリーミングデータに含まれる複数のトランザクションのそれぞれについてカウンタが記録されたデータ構造を参照して、クエリに対応する前記トランザクションの出現度を算出する検索ステップをコンピュータに実行させ、
前記データ構造が、トランザクションのアイテム数の最大値をmとし、前記トランザクションを記録するためのカウンタの衝突に関する値の種類数をpとして、それぞれがp個の配列セットを含むm個の配列セットグループを含み、各配列セットが複数の1次元配列を含み、各1次元配列の各要素が前記カウンタに対応し、
各配列セットグループの各1次元配列の各要素が、該配列セットグループに対応する前記トランザクションに基づいてインクリメントされたカウンタを記録し、
前記検索ステップが、
前記クエリのアイテム数から前記mまでの範囲に対応する少なくとも一つの前記配列セットグループのそれぞれの各配列セットについて、カーネル密度推定による推定値を算出するステップと、
前記少なくとも一つの配列セットグループのそれぞれについて、該配列セットグループの各配列セットの前記推定値と、該配列セットグループに対応するJaccard行列とに基づいて、該配列セットグループにおける部分出現度を算出するステップと、
少なくとも一つの前記部分出現度に基づいて前記出現度を算出するステップと、
を含む、
データ操作プログラム。
【請求項5】
少なくとも一つのプロセッサを備え、
前記少なくとも一つのプロセッサが、
ストリーミングデータに含まれるトランザクションのアイテム数の最大値をmとし、前記トランザクションを記録するためのカウンタの衝突に関する値の種類数をpとして、それぞれがp個の配列セットを含むm個の配列セットグループを生成する生成ステップであって、各配列セットが複数の1次元配列を含み、各1次元配列の各要素が前記カウンタに対応する、該生成ステップと、
複数の前記トランザクションのそれぞれについて、(i)該トランザクションのアイテム数に対応する前記配列セットグループを選択し、(ii)該配列セットグループ内の各1次元配列において、該トランザクションに対応する前記カウンタをインクリメントする登録ステップと、
を実行するデータ操作システム。
【請求項6】
少なくとも一つのプロセッサを備えるデータ操作システムによって実行されるデータ操作方法であって、
ストリーミングデータに含まれるトランザクションのアイテム数の最大値をmとし、前記トランザクションを記録するためのカウンタの衝突に関する値の種類数をpとして、それぞれがp個の配列セットを含むm個の配列セットグループを生成する生成ステップであって、各配列セットが複数の1次元配列を含み、各1次元配列の各要素が前記カウンタに対応する、該生成ステップと、
複数の前記トランザクションのそれぞれについて、(i)該トランザクションのアイテム数に対応する前記配列セットグループを選択し、(ii)該配列セットグループ内の各1次元配列において、該トランザクションに対応する前記カウンタをインクリメントする登録ステップと、
を含むデータ操作方法。
【請求項7】
少なくとも一つのプロセッサを備え、
前記少なくとも一つのプロセッサが、ストリーミングデータに含まれる複数のトランザクションのそれぞれについてカウンタが記録されたデータ構造を参照して、クエリに対応する前記トランザクションの出現度を算出する検索ステップを実行し、
前記データ構造が、トランザクションのアイテム数の最大値をmとし、前記トランザクションを記録するためのカウンタの衝突に関する値の種類数をpとして、それぞれがp個の配列セットを含むm個の配列セットグループを含み、各配列セットが複数の1次元配列を含み、各1次元配列の各要素が前記カウンタに対応し、
各配列セットグループの各1次元配列の各要素が、該配列セットグループに対応する前記トランザクションに基づいてインクリメントされたカウンタを記録し、
前記検索ステップが、
前記クエリのアイテム数から前記mまでの範囲に対応する少なくとも一つの前記配列セットグループのそれぞれの各配列セットについて、カーネル密度推定による推定値を算出するステップと、
前記少なくとも一つの配列セットグループのそれぞれについて、該配列セットグループの各配列セットの前記推定値と、該配列セットグループに対応するJaccard行列とに基づいて、該配列セットグループにおける部分出現度を算出するステップと、
少なくとも一つの前記部分出現度に基づいて前記出現度を算出するステップと、
を含む、
データ操作システム。
【請求項8】
少なくとも一つのプロセッサを備えるデータ操作システムによって実行されるデータ操作方法であって、
ストリーミングデータに含まれる複数のトランザクションのそれぞれについてカウンタが記録されたデータ構造を参照して、クエリに対応する前記トランザクションの出現度を算出する検索ステップを含み、
前記データ構造が、トランザクションのアイテム数の最大値をmとし、前記トランザクションを記録するためのカウンタの衝突に関する値の種類数をpとして、それぞれがp個の配列セットを含むm個の配列セットグループを含み、各配列セットが複数の1次元配列を含み、各1次元配列の各要素が前記カウンタに対応し、
各配列セットグループの各1次元配列の各要素が、該配列セットグループに対応する前記トランザクションに基づいてインクリメントされたカウンタを記録し、
前記検索ステップが、
前記クエリのアイテム数から前記mまでの範囲に対応する少なくとも一つの前記配列セットグループのそれぞれの各配列セットについて、カーネル密度推定による推定値を算出するステップと、
前記少なくとも一つの配列セットグループのそれぞれについて、該配列セットグループの各配列セットの前記推定値と、該配列セットグループに対応するJaccard行列とに基づいて、該配列セットグループにおける部分出現度を算出するステップと、
少なくとも一つの前記部分出現度に基づいて前記出現度を算出するステップと、
を含む、
データ操作方法。

発明の詳細な説明【技術分野】
【0001】
本開示の一側面は、データ操作プログラム、データ操作システム、およびデータ操作方法に関する。
続きを表示(約 2,300 文字)【背景技術】
【0002】
非特許文献1には、高次元ストリーミングデータのカーネル密度推定のための効率的なスケッチアルゴリズムであるRACE(Repeated Array-of-Counts Estimator)が記載されている。非特許文献2には、ストリーミングデータにおける頻出アイテム集合検索(Frequent Itemset Mining in Streaming Data(FIM-SD))のためのアルゴリズムが記載されている。
【先行技術文献】
【非特許文献】
【0003】
Coleman, B. and Shrivastava, A.: Sub-linear RACE sketches forapproximate kernel density estimation on streaming data, Proc. of WWW'20 (2020).https://dl.acm.org/doi/fullHtml/10.1145/3366423.3380244
Yamamoto, Y., Tabei, Y. and Iwanuma, K.: PARASOL: a hybridapproximate approach for scalable frequent itemset mining in streaming data.Journal of Intelligent Information Systems (2020). https://link.springer.com/article/10.1007/s10844-019-00590-9
【発明の概要】
【発明が解決しようとする課題】
【0004】
ストリーミングデータの中でクエリに対応するデータがどのくらい出現するかを検索するための仕組みが望まれている。
【課題を解決するための手段】
【0005】
本開示の一側面に係るデータ操作プログラムは、ストリーミングデータに含まれるトランザクションのアイテム数の最大値をmとし、トランザクションを記録するためのカウンタの衝突に関する値の種類数をpとして、それぞれがp個の配列セットを含むm個の配列セットグループを生成する生成ステップであって、各配列セットが複数の1次元配列を含み、各1次元配列の各要素がカウンタに対応する、該生成ステップと、複数のトランザクションのそれぞれについて、(i)該トランザクションのアイテム数に対応する配列セットグループを選択し、(ii)該配列セットグループ内の各1次元配列において、該トランザクションに対応するカウンタをインクリメントする登録ステップとをコンピュータに実行させる。
【0006】
このような側面においては、トランザクションのアイテム数の最大値と、トランザクションを記録するためのカウンタの衝突に関する値の種類数との積の分だけ配列セットが用意される。そして、個々のトランザクションについて、トランザクションのアイテム数に対応する配列セットグループの各配列セットにおいて、対応するカウンタがインクリメントされる。このようなデータ構造の生成およびトランザクションの登録によって、ストリーミングデータの中でクエリに対応するデータがどのくらい出現するかを検索することが可能になる。
【発明の効果】
【0007】
本開示の一側面によれば、ストリーミングデータの中でクエリに対応するデータがどのくらい出現するかを検索することが可能になる。
【図面の簡単な説明】
【0008】
データ操作システムの機能構成の一例を示す図である。
データ操作システムを構成するコンピュータのハードウェア構成の一例を示す図である。
GRACEの構造の一例を示す図である。
RACEの構造の一例を示す図である。
データ操作システムによる処理の一例を示すフローチャートである。
ストリーミングデータをGRACEに登録する処理の一例を示すフローチャートである。
カウンタを記録しようとするRACEの選択を示す図である。
カウンタのインクリメントを示す図である。
クエリに基づいてGRACEを検索する処理の一例を示すフローチャートである。
検索におけるGRACEの参照を示す図である。
【発明を実施するための形態】
【0009】
以下、添付図面を参照しながら本開示での実施形態を詳細に説明する。図面の説明において同一または同等の要素には同一の符号を付し、重複する説明を省略する。
【0010】
[システムの構成]
本開示に係るデータ操作システムは、ストリーミングデータに関する操作を実行するコンピュータシステムである。一例では、データ操作システムは、ストリーミングデータの中でクエリに対応するデータがどのくらい出現(または存在)するかを検索するための環境を提供する。データ操作システムは、記憶容量を節約しつつその検索を実現するためのデータ構造を生成し、ストリーミングデータのデータレコードである複数のトランザクションについてのカウンタをそのデータ構造に登録する。別の例では、データ操作システムはクエリに基づく検索を実行して、そのクエリに対応するトランザクションがストリーミングデータ内にどのくらい出現するかを示す指数である出現度を算出する。出現度は割合、個数などの様々な数値によって表されてよい。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

国立大学法人静岡大学
移動体
3か月前
国立大学法人静岡大学
キャパシタ
2か月前
国立大学法人静岡大学
カラーフィルム及びその製造方法
3か月前
国立大学法人静岡大学
製造システム及びメタンの製造方法
3か月前
国立大学法人静岡大学
準自立型太陽光発電自家消費システム
13日前
国立大学法人静岡大学
還元型酸化グラフェン及びその製造方法
28日前
国立大学法人静岡大学
圧電体素子、及び圧電体素子の製造方法
1か月前
国立大学法人静岡大学
窒化処理方法、窒化処理装置及び表面改質処理方法
1か月前
神谷理研株式会社
クロムめっき層の製造方法及びめっき装置
3か月前
国立大学法人静岡大学
データ操作プログラム、データ操作システム、およびデータ操作方法
1か月前
横河電機株式会社
メタンの製造方法、制御装置、及びメタン製造システム
1か月前
国立大学法人静岡大学
作業データ収集方法、作業教示方法、作業実行方法、システム、及びプログラム
1か月前
横河電機株式会社
メタン生成装置
5か月前
国立大学法人静岡大学
放射線画像を生成する方法、放射線画像を生成するプログラム及び放射線画像生成装置
1か月前
国立大学法人静岡大学
ビークルデータ処理装置、ビークルデータ処理方法およびビークルデータ処理プログラム
4日前
浜松ホトニクス株式会社
蒸散異常検知方法、蒸散異常検知装置、及び蒸散異常検知プログラム
20日前
高圧ガス工業株式会社
カーボンナノチューブ製造装置およびカーボンナノチューブの製造方法
4か月前
国立研究開発法人農業・食品産業技術総合研究機構
茶樹情報推定方法及び茶樹情報推定プログラム
4か月前
国立大学法人静岡大学
作業データ収集方法、作業教示方法、作業実行方法、システム、及びプログラム
1か月前
TOPPANホールディングス株式会社
距離画像撮像装置、及び距離画像撮像方法
3か月前
株式会社大和コンピューター
メロンの等級判定システム、メロンの等級判定方法、メロンの等級判定システム用プログラムおよび記録媒体
3か月前
個人
暗号化記憶媒体
1か月前
個人
環境情報処理装置
11日前
個人
外食予約システム
11日前
個人
求人支援システム
28日前
キヤノン電子株式会社
周辺機器
1か月前
ニデック株式会社
冷却装置
5日前
個人
求人マッチングサーバ
1か月前
個人
サービス提供システム
4日前
個人
海外在住支援システム
11日前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
アスエネ株式会社
水管理の方法
1か月前
株式会社ワコム
電子ペン
14日前
続きを見る