TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025069669
公報種別
公開特許公報(A)
公開日
2025-05-01
出願番号
2023179535
出願日
2023-10-18
発明の名称
時系列の対象ログデータにおける特異期間を判定するプログラム、装置及び方法
出願人
KDDI株式会社
代理人
個人
主分類
G06F
18/2413 20230101AFI20250423BHJP(計算;計数)
要約
【課題】時系列データにおける稀な事象の特異期間を判定する判定装置、方法及びプログラムを提供する。
【解決手段】判定装置1は、訓練段階として、教師ログデータから所定期間単位の複数の教師期間特徴量を抽出し、推定段階として、対象ログデータから所定期間単位の複数の対象期間特徴量を抽出する期間特徴量抽出部、訓練段階として、当該所定期間単位で、各教師期間特徴量を入力して訓練すると共に、各教師期間潜在表現を抽出し、推定段階として、各対象期間特徴量を入力して、各対象期間潜在表現を抽出する潜在表現抽出部、所定期間単位の教師期間潜在表現を記憶する潜在表現記憶部及び推定段階として、当該所定期間単位で、潜在表現記憶手段に記憶された教師期間潜在表現と、潜在表現抽出部から出力された対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、当該所定期間単位の所定期間を特異期間と判定する特異期間判定部を有する。
【選択図】図1
特許請求の範囲
【請求項1】
時系列の教師ログデータに対して、時系列の対象ログデータにおける特異期間を判定するようにコンピュータを機能させるプログラムであって、
訓練段階として、教師ログデータを入力して、所定期間単位の複数の教師期間特徴量を抽出し、推定段階として、対象ログデータを入力して、所定期間単位の複数の対象期間特徴量を抽出する期間特徴量抽出手段と、
訓練段階として、当該所定期間単位で、各教師期間特徴量を入力して訓練すると共に、各教師期間潜在表現を抽出し、推定段階として、各対象期間特徴量を入力して、各対象期間潜在表現を抽出する潜在表現抽出手段と、
訓練段階として、所定期間単位の教師期間潜在表現を記憶する潜在表現記憶手段と、
推定段階として、当該所定期間単位で、潜在表現記憶手段に記憶された教師期間潜在表現と、潜在表現抽出手段から出力された対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、当該所定期間単位の所定期間を特異期間と判定する特異期間判定手段と
してコンピュータを機能させることを特徴とするプログラム。
続きを表示(約 3,400 文字)
【請求項2】
特異期間判定手段は、
複数の教師期間潜在表現から算出された平均ベクトルと、対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、又は、
各教師期間潜在表現と対象期間潜在表現との間のベクトル間距離を算出し、最小となるベクトル間距離が所定閾値以上離れている場合、
当該所定期間単位の所定期間を特異期間と判定する
ようにコンピュータを機能させることを特徴とする請求項1に記載のプログラム。
【請求項3】
第1の期間単位と、当該第1の期間単位よりも短い時系列の複数の第2の期間単位とを規定し、
期間特徴量抽出手段は、
訓練段階として、第1の期間単位で、教師ログデータにおける複数の第1の教師期間特徴量を抽出し、推定段階として、対象ログデータにおける複数の第1の対象期間特徴量を抽出する第1の期間特徴量抽出手段と、
訓練段階として、第2の期間単位で、教師ログデータにおける複数の第2の教師期間特徴量を抽出し、推定段階として、対象ログデータにおける複数の第2の対象期間特徴量を抽出する第2の期間特徴量抽出手段とからなり、
潜在表現抽出手段は、
訓練段階として、第1の期間単位で、各第1の教師期間特徴量を入力して訓練すると共に、各第1の教師期間潜在表現を抽出する第1の潜在表現抽出手段と、
訓練段階として、第2の期間単位で、第1の教師期間潜在表現と、各第2の教師期間特徴量とを入力して訓練すると共に、各第2の教師期間潜在表現を抽出する第2の潜在表現抽出手段とからなり、
潜在表現記憶手段は、第1の期間単位の第1の教師期間潜在表現と、第2の期間単位の第2の教師期間潜在表現とを記憶し、
第1の潜在表現抽出手段は、推定段階として、第1の期間単位で、各第1の対象期間特徴量を入力して、各第1の対象期間潜在表現を抽出し、
第2の潜在表現抽出手段は、推定段階として、第2の期間単位で、第1の対象期間潜在表現と、各第2の対象期間特徴量とを入力して、各第2の対象期間潜在表現を抽出し、
特異期間判定手段は、第2の期間単位に、潜在表現記憶手段に記憶された第2の教師期間潜在表現と、第2の潜在表現抽出手段から出力された第2の対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、第2の期間単位の所定期間を特異期間と判定する
ようにコンピュータを機能させることを特徴とする請求項1に記載のプログラム。
【請求項4】
特異期間判定手段は、
複数の第2の教師期間潜在表現から算出された平均ベクトルと、第2の対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、又は、
各第2の教師期間潜在表現と第2の対象期間潜在表現との間のベクトル間距離を算出し、最小となるベクトル間距離が所定閾値以上離れている場合、
当該所定期間単位の所定期間を特異期間と判定する
ようにコンピュータを機能させることを特徴とする請求項3に記載のプログラム。
【請求項5】
特異期間と判定された第2の対象期間特徴量を、複数の第2の対象期間特徴量に拡張するデータ拡張手段と
して更に機能させ、
第2の潜在表現抽出手段は、訓練段階として、拡張された複数の第2の対象期間特徴量を、特異期間における教師期間特徴量として入力して訓練する
ようにコンピュータを機能させることを特徴とする請求項3に記載のプログラム。
【請求項6】
第2の期間単位よりも短い時系列の複数の第3の期間単位を更に規定し、
訓練段階として、第3の期間単位で、教師ログデータにおける複数の第3の教師期間特徴量を抽出し、推定段階として、第3の期間単位に、対象ログデータにおける複数の第3の対象期間特徴量を抽出する第3の期間特徴量抽出手段と、
訓練段階として、第3の期間単位で、第2の教師期間潜在表現と、各第3の教師期間特徴量とを入力して訓練すると共に、各第3の教師期間潜在表現を抽出する第3の潜在表現抽出手段と
して更に機能させ、
前記潜在表現記憶手段は、第3の期間単位の各第3の教師期間潜在表現を更に記憶し、
第3の潜在表現抽出手段は、推定段階として、第3の期間単位で、第2の対象期間潜在表現と、各第3の対象期間特徴量とを入力して、各第3の対象期間潜在表現を抽出し、
特異期間判定手段は、第3の期間単位で、潜在表現記憶手段に記憶された第3の教師期間潜在表現と、第3の潜在表現抽出手段から出力された第3の対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、第3の期間単位の所定期間を特異期間と判定する
ようにコンピュータを機能させることを特徴とする請求項3に記載のプログラム。
【請求項7】
特異期間判定手段は、
複数の第3の教師期間潜在表現から算出された平均ベクトルと、第3の対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、又は、
各第3の教師期間潜在表現と第3の対象期間潜在表現との間のベクトル間距離を算出し、最小となるベクトル間距離が所定閾値以上離れている場合、
当該所定期間単位の所定期間を特異期間と判定する
ようにコンピュータを機能させることを特徴とする請求項6に記載のプログラム。
【請求項8】
特異期間と判定された第3の対象期間特徴量を、複数の第3の対象期間特徴量に拡張するデータ拡張手段と
して更に機能させ、
第3の潜在表現抽出手段は、訓練段階として、拡張された複数の第3の対象期間特徴量を、特異期間における教師期間特徴量として入力して訓練する
ようにコンピュータを機能させることを特徴とする請求項6に記載のプログラム。
【請求項9】
時系列の教師ログデータに対して、時系列の対象ログデータにおける特異期間を判定する判定装置であって、
訓練段階として、教師ログデータを入力して、所定期間単位の複数の教師期間特徴量を抽出し、推定段階として、対象ログデータを入力して、所定期間単位の複数の対象期間特徴量を抽出する期間特徴量抽出手段と、
訓練段階として、当該所定期間単位で、各教師期間特徴量を入力して訓練すると共に、各教師期間潜在表現を抽出し、推定段階として、各対象期間特徴量を入力して、各対象期間潜在表現を抽出する潜在表現抽出手段と、
訓練段階として、所定期間単位の教師期間潜在表現を記憶する潜在表現記憶手段と、
推定段階として、当該所定期間単位で、潜在表現記憶手段に記憶された教師期間潜在表現と、潜在表現抽出手段から出力された対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、当該所定期間単位の所定期間を特異期間と判定する特異期間判定手段と
を有することを特徴とする判定装置。
【請求項10】
時系列の教師ログデータに対して、時系列の対象ログデータにおける特異期間を判定する装置の判定方法であって、
装置は、
訓練段階として、
教師ログデータを入力して、所定期間単位の複数の教師期間特徴量を抽出する第1のステップと、
当該所定期間単位で、各教師期間特徴量を入力して訓練すると共に、各教師期間潜在表現を抽出する第2のステップと、
所定期間単位の教師期間潜在表現を記憶する第3のステップと、
推定段階として、
対象ログデータを入力して、所定期間単位の複数の対象期間特徴量を抽出する第4のステップと、
各対象期間特徴量を入力して、各対象期間潜在表現を抽出する第5のステップと、
当該所定期間単位で、第3のステップで記憶された教師期間潜在表現と、第5のステップで出力された対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、当該所定期間単位の所定期間を特異期間と判定する第6のステップと
を実行することを特徴とする判定方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、時系列のビッグデータにおける、稀な事象に基づく特異期間を判定する技術に関する。
続きを表示(約 2,400 文字)
【背景技術】
【0002】
従来、複数の道路区間について、将来の交通状況を予測する技術がある(例えば特許文献1参照)。この技術によれば、過去交通量から未来交通量を予測する教師あり学習エンジンを用いており、予め多種多量の過去データを必要とする。複数の道路区間に、交通状況データの類似性に基づいて複数のクラスタに区分されている。そして、学習エンジンは、クラスタ毎に、過去の所定時点より前の過去交通状況データを入力し、所定時点より後の過去交通状況データを出力するように予測モデルを訓練する。そして、学習エンジンは、道路区間毎に、道路情報収集端末から収集した現在交通状況データを入力し、その道路区間が属するクラスタに対応付けられた予測モデルを用いて、将来の交通状況データを予測する。
【0003】
また、少量の教師データであっても、教師あり学習エンジンを用いて、ネットワーク異常となるボットネットの司令塔サーバを検知する技術もある(例えば特許文献2参照)。この技術によれば、ネットワーク通信情報から、マルウェアに感染したボットとそのボットを制御する司令塔サーバとの間の通信プロトコルの接続構造について、少なくとも一方が類似するホスト間で通信するサーバを司令塔サーバの候補として抽出する。各々の司令塔サーバの候補について、通信情報に基づくネットワーク通信特徴を生成する。そして、ネットワーク通信特徴が類似する司令塔サーバの候補を同じ集団に分類し、外部脅威情報を、分類した各々の集団に照合して、所定量以上の司令塔サーバを含む集団に属する全ての候補を司令塔サーバとして検知する。
【先行技術文献】
【特許文献】
【0004】
特開2023-005015号公報
特開2018-169897号公報
【非特許文献】
【0005】
データ拡張(Data Augmentation)、CVMLエキスパートガイド、[online]、[令和5年10月4日検索]、インターネット<URL:https://cvml-expertguide.net/terms/dl/regularization/data-augmentation/#:~:text=%E3%83%87%E3%83%BC%E3%82%BF%E6%8B%A1%E5%BC%B5%20(Data%20Augmentation%2C%20%E3%83%87%E3%83%BC%E3%82%BF,%E3%82%92%E6%8B%A1%E3%81%92%E3%82%8B%E5%87%A6%E7%90%86%E3%81%A7%E3%81%82%E3%82%8B%EF%BC%8E>
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1によれば、教師あり学習エンジンを用いるために、大量の多種多量な過去データを必要とし、稀な事象に基づく少量の過去データに対応する予測が難しいという問題点があった。即ち、稀な事象の発生における予測精度は、過去に存在しなかった未知データが多量に集まって再訓練されるまで向上しない。
【0007】
また、特許文献2によれば、外部サーバとの通信情報も副次的に用いることによって少量のデータであっても稀なネットワーク異常検知を可能しているが、外部サーバに依存しているために、少ないコスト(計算時間及び計算量)で再訓練できないという問題点があった。
【0008】
これに対し、本願の発明者らは、時系列のビッグデータにおける、稀な事象に基づく特異期間を判定することができないか、と考えた。また、特異期間を抽出することができれば、その特異期間に発生したデータのみを拡張(水増し)することによって、学習エンジンで再訓練することができる、と考えた。即ち、稀な事象に基づく特異期間が抽出された場合であっても、平時の期間における学習エンジンの予測精度が低下しないように、学習エンジンを再訓練することができる。
【0009】
そこで、本発明は、時系列のビッグデータにおける、稀な事象に基づく特異期間を判定することができるプログラム、装置及び方法を提供することを目的とする。また、本発明によれば、判定された特異期間におけるデータのみを拡張し、その特異期間の期間単位における潜在表現のみを再訓練することによって、汎化性能を向上させることもできる。
【課題を解決するための手段】
【0010】
本発明によれば、時系列の教師ログデータに対して、時系列の対象ログデータにおける特異期間を判定するようにコンピュータを機能させるプログラムであって、
訓練段階として、教師ログデータを入力して、所定期間単位の複数の教師期間特徴量を抽出し、推定段階として、対象ログデータを入力して、所定期間単位の複数の対象期間特徴量を抽出する期間特徴量抽出手段と、
訓練段階として、当該所定期間単位で、各教師期間特徴量を入力して訓練すると共に、各教師期間潜在表現を抽出し、推定段階として、各対象期間特徴量を入力して、各対象期間潜在表現を抽出する潜在表現抽出手段と、
訓練段階として、所定期間単位の教師期間潜在表現を記憶する潜在表現記憶手段と、
推定段階として、当該所定期間単位で、潜在表現記憶手段に記憶された教師期間潜在表現と、潜在表現抽出手段から出力された対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、当該所定期間単位の所定期間を特異期間と判定する特異期間判定手段と
してコンピュータを機能させることを特徴とする。
(【0011】以降は省略されています)
特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する
関連特許
KDDI株式会社
基地局及び通信端末
26日前
KDDI株式会社
参照信号の設定方法及び装置
24日前
KDDI株式会社
画像検索装置及びプログラム
12日前
KDDI株式会社
参照信号の設定方法及び装置
24日前
KDDI株式会社
情報処理装置及び情報処理方法
25日前
KDDI株式会社
情報処理装置及び情報処理方法
25日前
KDDI株式会社
情報処理装置及び情報処理方法
24日前
KDDI株式会社
情報処理装置及び情報処理方法
25日前
KDDI株式会社
無線システム及び通信制御方法
25日前
KDDI株式会社
話し掛け判断装置及びプログラム
25日前
KDDI株式会社
通信装置、通信方法及びプログラム
25日前
KDDI株式会社
端末装置、および無線通信システム
24日前
KDDI株式会社
端末装置、および無線通信システム
24日前
KDDI株式会社
無線通信システムおよびその制御方法
25日前
KDDI株式会社
無線通信システムおよびその制御方法
25日前
KDDI株式会社
リンクアダプテーション方法及び装置
24日前
KDDI株式会社
リンクアダプテーション方法及び装置
24日前
KDDI株式会社
学習支援システム、方法及びプログラム
24日前
KDDI株式会社
制御装置、通信システムおよび制御方法
25日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
24日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
24日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
24日前
KDDI株式会社
表示制御装置、表示システム及びプログラム
26日前
KDDI株式会社
点群復号装置、点群復号方法及びプログラム
17日前
KDDI株式会社
点群復号装置、点群復号方法及びプログラム
17日前
KDDI株式会社
画像復号装置、画像復号方法及びプログラム
18日前
KDDI株式会社
点群復号装置、点群復号方法及びプログラム
17日前
KDDI株式会社
情報処理装置、情報処理方法、及びプログラム
25日前
KDDI株式会社
情報処理装置、情報処理方法、及びプログラム
26日前
KDDI株式会社
プログラム、情報処理装置、及び情報処理方法
25日前
KDDI株式会社
データ収集装置、データ収集方法及びプログラム
25日前
KDDI株式会社
物体光補正装置、物体光補正方法及びプログラム
17日前
KDDI株式会社
情報処理装置、情報処理方法及び情報処理システム
24日前
KDDI株式会社
食べ方パターン分析システム、方法及びプログラム
25日前
KDDI株式会社
メッシュ復号装置、メッシュ復号方法及びプログラム
17日前
KDDI株式会社
メッシュ復号装置、メッシュ復号方法及びプログラム
17日前
続きを見る
他の特許を見る