TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025069669
公報種別公開特許公報(A)
公開日2025-05-01
出願番号2023179535
出願日2023-10-18
発明の名称時系列の対象ログデータにおける特異期間を判定するプログラム、装置及び方法
出願人KDDI株式会社
代理人個人
主分類G06F 18/2413 20230101AFI20250423BHJP(計算;計数)
要約【課題】時系列データにおける稀な事象の特異期間を判定する判定装置、方法及びプログラムを提供する。
【解決手段】判定装置1は、訓練段階として、教師ログデータから所定期間単位の複数の教師期間特徴量を抽出し、推定段階として、対象ログデータから所定期間単位の複数の対象期間特徴量を抽出する期間特徴量抽出部、訓練段階として、当該所定期間単位で、各教師期間特徴量を入力して訓練すると共に、各教師期間潜在表現を抽出し、推定段階として、各対象期間特徴量を入力して、各対象期間潜在表現を抽出する潜在表現抽出部、所定期間単位の教師期間潜在表現を記憶する潜在表現記憶部及び推定段階として、当該所定期間単位で、潜在表現記憶手段に記憶された教師期間潜在表現と、潜在表現抽出部から出力された対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、当該所定期間単位の所定期間を特異期間と判定する特異期間判定部を有する。
【選択図】図1
特許請求の範囲【請求項1】
時系列の教師ログデータに対して、時系列の対象ログデータにおける特異期間を判定するようにコンピュータを機能させるプログラムであって、
訓練段階として、教師ログデータを入力して、所定期間単位の複数の教師期間特徴量を抽出し、推定段階として、対象ログデータを入力して、所定期間単位の複数の対象期間特徴量を抽出する期間特徴量抽出手段と、
訓練段階として、当該所定期間単位で、各教師期間特徴量を入力して訓練すると共に、各教師期間潜在表現を抽出し、推定段階として、各対象期間特徴量を入力して、各対象期間潜在表現を抽出する潜在表現抽出手段と、
訓練段階として、所定期間単位の教師期間潜在表現を記憶する潜在表現記憶手段と、
推定段階として、当該所定期間単位で、潜在表現記憶手段に記憶された教師期間潜在表現と、潜在表現抽出手段から出力された対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、当該所定期間単位の所定期間を特異期間と判定する特異期間判定手段と
してコンピュータを機能させることを特徴とするプログラム。
続きを表示(約 3,400 文字)【請求項2】
特異期間判定手段は、
複数の教師期間潜在表現から算出された平均ベクトルと、対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、又は、
各教師期間潜在表現と対象期間潜在表現との間のベクトル間距離を算出し、最小となるベクトル間距離が所定閾値以上離れている場合、
当該所定期間単位の所定期間を特異期間と判定する
ようにコンピュータを機能させることを特徴とする請求項1に記載のプログラム。
【請求項3】
第1の期間単位と、当該第1の期間単位よりも短い時系列の複数の第2の期間単位とを規定し、
期間特徴量抽出手段は、
訓練段階として、第1の期間単位で、教師ログデータにおける複数の第1の教師期間特徴量を抽出し、推定段階として、対象ログデータにおける複数の第1の対象期間特徴量を抽出する第1の期間特徴量抽出手段と、
訓練段階として、第2の期間単位で、教師ログデータにおける複数の第2の教師期間特徴量を抽出し、推定段階として、対象ログデータにおける複数の第2の対象期間特徴量を抽出する第2の期間特徴量抽出手段とからなり、
潜在表現抽出手段は、
訓練段階として、第1の期間単位で、各第1の教師期間特徴量を入力して訓練すると共に、各第1の教師期間潜在表現を抽出する第1の潜在表現抽出手段と、
訓練段階として、第2の期間単位で、第1の教師期間潜在表現と、各第2の教師期間特徴量とを入力して訓練すると共に、各第2の教師期間潜在表現を抽出する第2の潜在表現抽出手段とからなり、
潜在表現記憶手段は、第1の期間単位の第1の教師期間潜在表現と、第2の期間単位の第2の教師期間潜在表現とを記憶し、
第1の潜在表現抽出手段は、推定段階として、第1の期間単位で、各第1の対象期間特徴量を入力して、各第1の対象期間潜在表現を抽出し、
第2の潜在表現抽出手段は、推定段階として、第2の期間単位で、第1の対象期間潜在表現と、各第2の対象期間特徴量とを入力して、各第2の対象期間潜在表現を抽出し、
特異期間判定手段は、第2の期間単位に、潜在表現記憶手段に記憶された第2の教師期間潜在表現と、第2の潜在表現抽出手段から出力された第2の対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、第2の期間単位の所定期間を特異期間と判定する
ようにコンピュータを機能させることを特徴とする請求項1に記載のプログラム。
【請求項4】
特異期間判定手段は、
複数の第2の教師期間潜在表現から算出された平均ベクトルと、第2の対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、又は、
各第2の教師期間潜在表現と第2の対象期間潜在表現との間のベクトル間距離を算出し、最小となるベクトル間距離が所定閾値以上離れている場合、
当該所定期間単位の所定期間を特異期間と判定する
ようにコンピュータを機能させることを特徴とする請求項3に記載のプログラム。
【請求項5】
特異期間と判定された第2の対象期間特徴量を、複数の第2の対象期間特徴量に拡張するデータ拡張手段と
して更に機能させ、
第2の潜在表現抽出手段は、訓練段階として、拡張された複数の第2の対象期間特徴量を、特異期間における教師期間特徴量として入力して訓練する
ようにコンピュータを機能させることを特徴とする請求項3に記載のプログラム。
【請求項6】
第2の期間単位よりも短い時系列の複数の第3の期間単位を更に規定し、
訓練段階として、第3の期間単位で、教師ログデータにおける複数の第3の教師期間特徴量を抽出し、推定段階として、第3の期間単位に、対象ログデータにおける複数の第3の対象期間特徴量を抽出する第3の期間特徴量抽出手段と、
訓練段階として、第3の期間単位で、第2の教師期間潜在表現と、各第3の教師期間特徴量とを入力して訓練すると共に、各第3の教師期間潜在表現を抽出する第3の潜在表現抽出手段と
して更に機能させ、
前記潜在表現記憶手段は、第3の期間単位の各第3の教師期間潜在表現を更に記憶し、
第3の潜在表現抽出手段は、推定段階として、第3の期間単位で、第2の対象期間潜在表現と、各第3の対象期間特徴量とを入力して、各第3の対象期間潜在表現を抽出し、
特異期間判定手段は、第3の期間単位で、潜在表現記憶手段に記憶された第3の教師期間潜在表現と、第3の潜在表現抽出手段から出力された第3の対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、第3の期間単位の所定期間を特異期間と判定する
ようにコンピュータを機能させることを特徴とする請求項3に記載のプログラム。
【請求項7】
特異期間判定手段は、
複数の第3の教師期間潜在表現から算出された平均ベクトルと、第3の対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、又は、
各第3の教師期間潜在表現と第3の対象期間潜在表現との間のベクトル間距離を算出し、最小となるベクトル間距離が所定閾値以上離れている場合、
当該所定期間単位の所定期間を特異期間と判定する
ようにコンピュータを機能させることを特徴とする請求項6に記載のプログラム。
【請求項8】
特異期間と判定された第3の対象期間特徴量を、複数の第3の対象期間特徴量に拡張するデータ拡張手段と
して更に機能させ、
第3の潜在表現抽出手段は、訓練段階として、拡張された複数の第3の対象期間特徴量を、特異期間における教師期間特徴量として入力して訓練する
ようにコンピュータを機能させることを特徴とする請求項6に記載のプログラム。
【請求項9】
時系列の教師ログデータに対して、時系列の対象ログデータにおける特異期間を判定する判定装置であって、
訓練段階として、教師ログデータを入力して、所定期間単位の複数の教師期間特徴量を抽出し、推定段階として、対象ログデータを入力して、所定期間単位の複数の対象期間特徴量を抽出する期間特徴量抽出手段と、
訓練段階として、当該所定期間単位で、各教師期間特徴量を入力して訓練すると共に、各教師期間潜在表現を抽出し、推定段階として、各対象期間特徴量を入力して、各対象期間潜在表現を抽出する潜在表現抽出手段と、
訓練段階として、所定期間単位の教師期間潜在表現を記憶する潜在表現記憶手段と、
推定段階として、当該所定期間単位で、潜在表現記憶手段に記憶された教師期間潜在表現と、潜在表現抽出手段から出力された対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、当該所定期間単位の所定期間を特異期間と判定する特異期間判定手段と
を有することを特徴とする判定装置。
【請求項10】
時系列の教師ログデータに対して、時系列の対象ログデータにおける特異期間を判定する装置の判定方法であって、
装置は、
訓練段階として、
教師ログデータを入力して、所定期間単位の複数の教師期間特徴量を抽出する第1のステップと、
当該所定期間単位で、各教師期間特徴量を入力して訓練すると共に、各教師期間潜在表現を抽出する第2のステップと、
所定期間単位の教師期間潜在表現を記憶する第3のステップと、
推定段階として、
対象ログデータを入力して、所定期間単位の複数の対象期間特徴量を抽出する第4のステップと、
各対象期間特徴量を入力して、各対象期間潜在表現を抽出する第5のステップと、
当該所定期間単位で、第3のステップで記憶された教師期間潜在表現と、第5のステップで出力された対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、当該所定期間単位の所定期間を特異期間と判定する第6のステップと
を実行することを特徴とする判定方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、時系列のビッグデータにおける、稀な事象に基づく特異期間を判定する技術に関する。
続きを表示(約 2,400 文字)【背景技術】
【0002】
従来、複数の道路区間について、将来の交通状況を予測する技術がある(例えば特許文献1参照)。この技術によれば、過去交通量から未来交通量を予測する教師あり学習エンジンを用いており、予め多種多量の過去データを必要とする。複数の道路区間に、交通状況データの類似性に基づいて複数のクラスタに区分されている。そして、学習エンジンは、クラスタ毎に、過去の所定時点より前の過去交通状況データを入力し、所定時点より後の過去交通状況データを出力するように予測モデルを訓練する。そして、学習エンジンは、道路区間毎に、道路情報収集端末から収集した現在交通状況データを入力し、その道路区間が属するクラスタに対応付けられた予測モデルを用いて、将来の交通状況データを予測する。
【0003】
また、少量の教師データであっても、教師あり学習エンジンを用いて、ネットワーク異常となるボットネットの司令塔サーバを検知する技術もある(例えば特許文献2参照)。この技術によれば、ネットワーク通信情報から、マルウェアに感染したボットとそのボットを制御する司令塔サーバとの間の通信プロトコルの接続構造について、少なくとも一方が類似するホスト間で通信するサーバを司令塔サーバの候補として抽出する。各々の司令塔サーバの候補について、通信情報に基づくネットワーク通信特徴を生成する。そして、ネットワーク通信特徴が類似する司令塔サーバの候補を同じ集団に分類し、外部脅威情報を、分類した各々の集団に照合して、所定量以上の司令塔サーバを含む集団に属する全ての候補を司令塔サーバとして検知する。
【先行技術文献】
【特許文献】
【0004】
特開2023-005015号公報
特開2018-169897号公報
【非特許文献】
【0005】
データ拡張(Data Augmentation)、CVMLエキスパートガイド、[online]、[令和5年10月4日検索]、インターネット<URL:https://cvml-expertguide.net/terms/dl/regularization/data-augmentation/#:~:text=%E3%83%87%E3%83%BC%E3%82%BF%E6%8B%A1%E5%BC%B5%20(Data%20Augmentation%2C%20%E3%83%87%E3%83%BC%E3%82%BF,%E3%82%92%E6%8B%A1%E3%81%92%E3%82%8B%E5%87%A6%E7%90%86%E3%81%A7%E3%81%82%E3%82%8B%EF%BC%8E>
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、特許文献1によれば、教師あり学習エンジンを用いるために、大量の多種多量な過去データを必要とし、稀な事象に基づく少量の過去データに対応する予測が難しいという問題点があった。即ち、稀な事象の発生における予測精度は、過去に存在しなかった未知データが多量に集まって再訓練されるまで向上しない。
【0007】
また、特許文献2によれば、外部サーバとの通信情報も副次的に用いることによって少量のデータであっても稀なネットワーク異常検知を可能しているが、外部サーバに依存しているために、少ないコスト(計算時間及び計算量)で再訓練できないという問題点があった。
【0008】
これに対し、本願の発明者らは、時系列のビッグデータにおける、稀な事象に基づく特異期間を判定することができないか、と考えた。また、特異期間を抽出することができれば、その特異期間に発生したデータのみを拡張(水増し)することによって、学習エンジンで再訓練することができる、と考えた。即ち、稀な事象に基づく特異期間が抽出された場合であっても、平時の期間における学習エンジンの予測精度が低下しないように、学習エンジンを再訓練することができる。
【0009】
そこで、本発明は、時系列のビッグデータにおける、稀な事象に基づく特異期間を判定することができるプログラム、装置及び方法を提供することを目的とする。また、本発明によれば、判定された特異期間におけるデータのみを拡張し、その特異期間の期間単位における潜在表現のみを再訓練することによって、汎化性能を向上させることもできる。
【課題を解決するための手段】
【0010】
本発明によれば、時系列の教師ログデータに対して、時系列の対象ログデータにおける特異期間を判定するようにコンピュータを機能させるプログラムであって、
訓練段階として、教師ログデータを入力して、所定期間単位の複数の教師期間特徴量を抽出し、推定段階として、対象ログデータを入力して、所定期間単位の複数の対象期間特徴量を抽出する期間特徴量抽出手段と、
訓練段階として、当該所定期間単位で、各教師期間特徴量を入力して訓練すると共に、各教師期間潜在表現を抽出し、推定段階として、各対象期間特徴量を入力して、各対象期間潜在表現を抽出する潜在表現抽出手段と、
訓練段階として、所定期間単位の教師期間潜在表現を記憶する潜在表現記憶手段と、
推定段階として、当該所定期間単位で、潜在表現記憶手段に記憶された教師期間潜在表現と、潜在表現抽出手段から出力された対象期間潜在表現との間のベクトル間距離が所定閾値以上離れている場合、当該所定期間単位の所定期間を特異期間と判定する特異期間判定手段と
してコンピュータを機能させることを特徴とする。
(【0011】以降は省略されています)

特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する

関連特許

KDDI株式会社
アンテナ指向装置
4日前
KDDI株式会社
アンテナ指向装置
4日前
KDDI株式会社
光増幅器及び光通信システム
11日前
KDDI株式会社
光増幅器及び光通信システム
1日前
KDDI株式会社
情報処理装置及び情報処理方法
16日前
KDDI株式会社
量子探索アルゴリズム及び方法
15日前
KDDI株式会社
情報処理装置及び情報処理方法
10日前
KDDI株式会社
音響測位装置、方法及びプログラム
15日前
KDDI株式会社
256ビットルート鍵を利用する装置
17日前
KDDI株式会社
無線アクセスネットワークの制御装置
3日前
KDDI株式会社
無線アクセスネットワークの制御装置
3日前
KDDI株式会社
演算装置、演算方法及び演算プログラム
1日前
KDDI株式会社
情報処理方法、プログラム及び情報処理装置
3日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
16日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
16日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
16日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
16日前
KDDI株式会社
メッセージ認証コードの長さを通知する装置
17日前
KDDI株式会社
偏向デバイス、基地局装置及びそれらでの方法
17日前
KDDI株式会社
情報処理装置、情報処理方法及び情報処理システム
2日前
KDDI株式会社
情報集約装置、情報集約方法及び情報集約プログラム
15日前
KDDI株式会社
秘密計算システム、ユーザ端末、演算サーバ及びプログラム
11日前
KDDI株式会社
移動通信ネットワークのネットワークノード、サーバ及びプログラム
16日前
KDDI株式会社
情報処理装置及び情報処理方法
10日前
KDDI株式会社
複数の搬送波を使用する通信の効率を向上させるための、端末装置、制御方法、及びプログラム
3日前
個人
非正規コート
1か月前
個人
物品給付年金
15日前
個人
政治のAI化
10日前
個人
RFタグ読取装置
28日前
個人
在宅介護システム
28日前
個人
人物再現システム
1か月前
個人
プラグインホームページ
1日前
個人
AI飲食最適化プラグイン
1か月前
キヤノン株式会社
通信装置
16日前
個人
電話管理システム及び管理方法
1か月前
有限会社ノア
データ読取装置
1か月前
続きを見る