TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024162084
公報種別公開特許公報(A)
公開日2024-11-21
出願番号2023077271
出願日2023-05-09
発明の名称危険サイトのリスト生成装置、リスト生成方法及びリスト生成プログラム
出願人KDDI株式会社
代理人個人,個人
主分類G06F 16/953 20190101AFI20241114BHJP(計算;計数)
要約【課題】網羅性を向上した危険サイトのリストを効率的に生成できるリスト生成装置、リスト生成方法及びリスト生成プログラムを提供すること。
【解決手段】リスト生成装置1は、ウェブ検索サービスにおいて、頻出する検索クエリの上位所定数を用いた複数の学習用の検索結果を収集する学習データ収集部11と、学習用の検索結果に頻出するドメインを所定のルールに従って抽出するドメイン抽出部12と、複数の条件からなる検索クエリを用いた危険サイト発見用の検索結果を収集する発見用データ収集部13と、危険サイト発見用の検索結果から、ドメイン抽出部12により抽出されたドメインとは異なるドメインを含むURLを抽出する危険サイト抽出部14と、危険サイト抽出部14により抽出されたURLを、危険サイトのリストとして管理するリスト管理部15と、を備える。
【選択図】図1
特許請求の範囲【請求項1】
ウェブ検索サービスにおいて、頻出する検索クエリの上位所定数を用いた複数の学習用の検索結果を収集する学習データ収集部と、
前記学習用の検索結果に頻出するドメインを所定のルールに従って抽出するドメイン抽出部と、
複数の条件からなる検索クエリを用いた危険サイト発見用の検索結果を収集する発見用データ収集部と、
前記危険サイト発見用の検索結果から、前記ドメイン抽出部により抽出されたドメインとは異なるドメインを含むURLを抽出する危険サイト抽出部と、
前記危険サイト抽出部により抽出されたURLを、危険サイトのリストとして管理するリスト管理部と、を備えるリスト生成装置。
続きを表示(約 1,200 文字)【請求項2】
前記ドメイン抽出部は、前記頻出するドメインとして、トップレベルドメインを抽出する請求項1に記載のリスト生成装置。
【請求項3】
前記ドメイン抽出部は、前記頻出するドメインとして、予め登録された属性型ドメインを抽出する請求項1に記載のリスト生成装置。
【請求項4】
前記発見用データ収集部は、前記複数の条件にサイトのカテゴリを含める請求項1から請求項3のいずれかに記載のリスト生成装置。
【請求項5】
前記発見用データ収集部は、前記複数の条件として、複数の検索キーワードを含める請求項1から請求項3のいずれかに記載のリスト生成装置。
【請求項6】
前記学習データ収集部は、前記学習用の検索結果として収集するサイト数に上限を設ける請求項1から請求項3のいずれかに記載のリスト生成装置。
【請求項7】
前記危険サイト抽出部は、文書中の単語の重要度を評価するための指標を、前記複数の学習用の検索結果及び前記危険サイト発見用の検索結果を文書とみなし、ドメインを単語とみなして適用し、当該指標のスコアが所定の閾値を超えたドメインを含むURLを抽出する請求項1から請求項3のいずれかに記載のリスト生成装置。
【請求項8】
前記リスト管理部は、前記リストに含まれるURLそれぞれについて、前記発見用データ収集部により検索されたときと同一の検索クエリを用いた検索結果に含まれるか否かを所定のタイミングで確認し、検索結果に含まれない場合に前記リストから削除する請求項1から請求項3のいずれかに記載のリスト生成装置。
【請求項9】
前記リスト管理部は、前記リストに含まれるURLそれぞれについて、当該URLに基づくウェブページで使用されている言語が変化したか否かを所定のタイミングで確認し、変化した場合に前記リストから削除する請求項1から請求項3のいずれかに記載のリスト生成装置。
【請求項10】
ウェブ検索サービスにおいて、頻出する検索クエリの上位所定数を用いた複数の学習用の検索結果を収集する学習データ収集ステップと、
前記学習用の検索結果に頻出するドメインを所定のルールに従って抽出するドメイン抽出ステップと、
複数の条件からなる検索クエリを用いた危険サイト発見用の検索結果を収集する発見用データ収集ステップと、
前記危険サイト発見用の検索結果から、前記ドメイン抽出ステップにおいて抽出されたドメインとは異なるドメインを含むURLを抽出する危険サイト抽出ステップと、
前記危険サイト抽出ステップにおいて抽出されたURLを、危険サイトのリストとして管理するリスト管理ステップと、をコンピュータが実行するリスト生成方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、危険サイトのURLを収集する技術に関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
従来、フィッシングサイト又はマルウェア配布サイト等、ウェブサイトを閲覧したユーザに不利益を及ぼす危険サイトが存在する。これらのウェブサイトは、一見して危険サイトであることを判別できない場合も多いため、自動的に判定することで被害を抑制するシステムが望まれている。
【0003】
そこで、例えば、安全でないサイトのリストと照合することにより、問い合わせに対して安全性を返答するサービス(例えば、非特許文献1)や、検索結果に表示されているURLの安全性を通知するサービス(例えば、非特許文献2)等が提供されている。
【0004】
さらに、非特許文献3では、Whoisの情報(登録者名、登録日、連絡先等)に基づいて機械学習を行い、ボットネットに関わるドメインを特定する手法が提案されている。
また、特許文献1では、特定のサイトにアクセスした際のホストの遷移状況に基づいて、サイトの改ざん検知を行う手法が提案されている。
【先行技術文献】
【特許文献】
【0005】
特許第6055726号公報
【非特許文献】
【0006】
Google LLC、Google Safe Browsing、インターネット、<https://developers.google.com/safe-browsing/v4/>、2023年2月27日
トレンドマイクロ株式会社、ウイルスバスタークラウド「Trendツールバー」機能について、インターネット、<https://helpcenter.trendmicro.com/ja-jp/article/tmka-18502>、2023年1月10日
久山 真宏,佐々木 良一、「ドメインのWHOIS構造を用いた悪性ドメインの判別手法」、マルチメディア,分散,協調とモバイル(DICOMO2016)シンポジウム、2016年7月
【発明の概要】
【発明が解決しようとする課題】
【0007】
安全でないサイトのリストを保持する場合、リストに掲載されるまでに時間が掛かる場合もある上に、リストの網羅性が低いために検知率が低いという課題があった。また、安全か危険かの判断は、ウェブページが改ざんされていない前提であるため、正規サイトが改ざんされている場合、安全である旨が通知されるおそれがあった。
【0008】
また、Whois情報を用いた悪性ドメインの検知手法では、リスト作成にあたり、ドメインリストの全てに対してWhois情報を収集する必要がある。また、Whois情報は取得に時間を要し、さらに近年では、Whois情報をプライバシ保護しているドメインも存在しており、危険サイトかどうかの判断が難しくなりつつある。
特許文献1の手法であっても、各URLに対し検証が必要なため、危険サイトのリストを作成するには時間及び労力的コストが掛かる。
【0009】
本発明は、網羅性を向上した危険サイトのリストを効率的に生成できるリスト生成装置、リスト生成方法及びリスト生成プログラムを提供することを目的とする。
【課題を解決するための手段】
【0010】
本発明に係るリスト生成装置は、ウェブ検索サービスにおいて、頻出する検索クエリの上位所定数を用いた複数の学習用の検索結果を収集する学習データ収集部と、前記学習用の検索結果に頻出するドメインを所定のルールに従って抽出するドメイン抽出部と、複数の条件からなる検索クエリを用いた危険サイト発見用の検索結果を収集する発見用データ収集部と、前記危険サイト発見用の検索結果から、前記ドメイン抽出部により抽出されたドメインとは異なるドメインを含むURLを抽出する危険サイト抽出部と、前記危険サイト抽出部により抽出されたURLを、危険サイトのリストとして管理するリスト管理部と、を備える。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

KDDI株式会社
サーバ装置、制御方法及びプログラム
1か月前
KDDI株式会社
点群復号装置、点群復号方法及びプログラム
1か月前
KDDI株式会社
画像復号装置、画像復号方法及びプログラム
1か月前
KDDI株式会社
画像復号装置、画像復号方法及びプログラム
1か月前
KDDI株式会社
画像復号装置、画像復号方法及びプログラム
1か月前
KDDI株式会社
画像復号装置、画像復号方法及びプログラム
1か月前
KDDI株式会社
画像復号装置、画像復号方法及びプログラム
1か月前
KDDI株式会社
画像復号装置、画像復号方法及びプログラム
1か月前
KDDI株式会社
画像復号装置、画像復号方法及びプログラム
1か月前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
26日前
KDDI株式会社
点群復号装置、点群復号方法及びプログラム
1か月前
KDDI株式会社
点群復号装置、点群復号方法及びプログラム
1か月前
KDDI株式会社
点群復号装置、点群復号方法及びプログラム
1か月前
KDDI株式会社
治療用アプリケーション、および情報処理装置
12日前
KDDI株式会社
メッシュ復号装置、メッシュ復号方法及びプログラム
1か月前
KDDI株式会社
メッシュ復号装置、メッシュ復号方法及びプログラム
1か月前
KDDI株式会社
メッシュ復号装置、メッシュ復号方法及びプログラム
1か月前
KDDI株式会社
メッシュ復号装置、メッシュ復号方法及びプログラム
1か月前
KDDI株式会社
メッシュ復号装置、メッシュ復号方法及びプログラム
1か月前
KDDI株式会社
メッシュ復号装置、メッシュ復号方法及びプログラム
1か月前
KDDI株式会社
メッシュ復号装置、メッシュ復号方法及びプログラム
1か月前
KDDI株式会社
情報処理システム、プログラムおよび保険条件判定方法
12日前
KDDI株式会社
安全性評価装置、安全性評価方法及び安全性評価プログラム
1か月前
KDDI株式会社
危険サイトのリスト生成装置、リスト生成方法及びリスト生成プログラム
13日前
KDDI株式会社
サンプルデータにラベルを付与する能動学習のプログラム、装置及び方法
6日前
KDDI株式会社
効率的な接続処理のための基地局装置、端末装置、制御方法、及びプログラム
12日前
KDDI株式会社
情報処理装置及び情報処理方法
28日前
KDDI株式会社
効率的な接続設定情報の管理のための基地局装置、端末装置、制御方法、及びプログラム
12日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
1か月前
KDDI株式会社
プライバシー保護型評判システム、評判スコア計算装置、評判スコア計算方法及びプログラム
6日前
KDDI株式会社
物体光逆量子化装置、物体光量子化装置、物体光逆量子化方法、物体光量子化方法及びプログラム
1か月前
KDDI株式会社
情報処理システム、プログラムおよび保険条件判定方法
12日前
KDDI株式会社
配車管理システム、配車予約管理方法及びコンピュータプログラム
6日前
KDDI株式会社
効率的な接続先変更処理のための端末装置、制御方法、及びプログラム
15日前
個人
認証システム
13日前
個人
マウス用テーブル
1か月前
続きを見る