TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025087527
公報種別公開特許公報(A)
公開日2025-06-10
出願番号2023202246
出願日2023-11-29
発明の名称判定装置、判定方法及び判定プログラム
出願人日本電信電話株式会社,NTTセキュリティホールディングス株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06F 21/00 20130101AFI20250603BHJP(計算;計数)
要約【課題】判定対象のWebサイトがフィッシングサイトか否かを適切に判定すること。
【解決手段】本実施形態に係る判定装置100は、取得部121と削除部122と判定部123とを有する。取得部121は、Webサイトに関する複数の情報を取得する。削除部122は、取得部121によって取得されたWebサイトに関する複数の情報の一部を、所定の条件を満たすように削除する。判定部123は、削除部122によって一部が削除されたデータを大規模言語モデルに入力し、大規模言語モデルの出力結果に基づき、Webサイトがフィッシングサイトか否かを判定する。
【選択図】図2
特許請求の範囲【請求項1】
Webサイトに関する複数の情報を取得する取得部と、
前記取得部によって取得されたWebサイトに関する複数の情報の一部を、所定の条件を満たすように削除する削除部と、
前記削除部によって一部が削除されたデータを大規模言語モデルに入力し、前記大規模言語モデルの出力結果に基づき、前記Webサイトがフィッシングサイトか否かを判定する判定部と、
を有することを特徴とする判定装置。
続きを表示(約 1,200 文字)【請求項2】
前記取得部は、入力されたWebサイトのURL(Uniform Resource Locator)から、前記URLが示すWebサイトにアクセスし、前記Webサイトに関する複数の情報を取得する
ことを特徴とする請求項1に記載の判定装置。
【請求項3】
前記取得部は、前記Webサイトに関する複数の情報として、前記WebサイトのURLと、前記WebサイトのHTML(Hyper Text Markup Language)のソースコードと、前記Webサイトを表示する画面のスクリーンショット画像とを取得する
ことを特徴とする請求項1に記載の判定装置。
【請求項4】
前記削除部は、前記取得部によって取得された前記HTMLのソースコードから、トークン数が所定数以下となるように、所定の条件を満たす要素を削除する
ことを特徴とする請求項3に記載の判定装置。
【請求項5】
前記削除部は、前記取得部によって取得された前記スクリーンショット画像よりテキストデータを抽出し、当該テキストデータから、トークン数が所定数以下となるように、文字サイズが小さいテキストから順にテキストを削除する
ことを特徴とする請求項3に記載の判定装置。
【請求項6】
前記取得部によって取得された前記WebサイトのURLと、前記削除部によって一部が削除されたデータとを用いて、前記大規模言語モデルの入力プロンプトを生成する生成部をさらに有し、
前記判定部は、前記生成部によって生成された入力プロンプトを前記大規模言語モデルに入力する
ことを特徴とする請求項3に記載の判定装置。
【請求項7】
判定装置によって実行される判定方法であって、
Webサイトに関する複数の情報を取得する取得工程と、
前記取得工程によって取得されたWebサイトに関する複数の情報の一部を、所定の条件を満たすように削除する削除工程と、
前記削除工程によって一部が削除されたデータを大規模言語モデルに入力し、前記大規模言語モデルの出力結果に基づき、前記Webサイトがフィッシングサイトか否かを判定する判定工程と、
を含んだことを特徴とする判定方法。
【請求項8】
Webサイトに関する複数の情報を取得する取得手順と、
前記取得手順によって取得されたWebサイトに関する複数の情報の一部を、所定の条件を満たすように削除する削除手順と、
前記削除手順によって一部が削除されたデータを大規模言語モデルに入力し、前記大規模言語モデルの出力結果に基づき、前記Webサイトがフィッシングサイトか否かを判定する判定手順と、
をコンピュータに実行させるための判定プログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、判定装置、判定方法及び判定プログラムに関する。
続きを表示(約 2,600 文字)【背景技術】
【0002】
近年、大規模言語モデル(LLM:Large Language Models)を用いて、質疑応答などの自然言語処理を行うシステムが提供されている。LLMは、大量のテキストデータを使ってトレーニングされた自然言語処理のモデルのことであり、文章を入力とし、文章を出力する。質疑応答を行うシステムにLLMを適用した場合、LLMに質問文(プロンプト)を入力すると、対話形式で生成された回答文がLLMから出力される。
【0003】
また、今日、インターネットショッピングの利用や、クレジットカード・電子マネーの使用によるキャッシュレス化の流行に伴い、インターネット上のウェブサイトに個人情報を入力して金銭の支払いをする機会が増加している。このような現況の中、実在の宅配業者や、金融機関、ショッピングサイトなどを装った偽のサイトを、ユーザに正規のサイトであると誤認させ、個人情報を入力させたり、金銭の支払いを要求したり、マルウェアをダウンロードさせたりする、フィッシングサイトが増加している。
【0004】
フィッシングサイトは、悪性なウェブサイトであり、以下の2つの要素を1つ以上もつという特徴がある。まず1つ目は、正規のサービスや企業のブランド名を悪用することである。次に2つ目は、偽の情報を提示してユーザを騙し心理的に誘導することである。なお、偽の情報とは、例えば、マルウェアの感染警告や懸賞当選通知がある。
【0005】
フィッシングサイトを検出する既存の方法として、例えば、正規のWebサイトのロゴ画像を学習し、フィッシングサイトに表示されるロゴ画像を特定する方法がある(例えば、非特許文献1参照)。また、その他にも、正規のWebサイトの画面全体の類似度をもとに、正規サイトのクローンによって生成されたフィッシングサイトを検出する方法もある(例えば、非特許文献2参照)。前述した2つの手法は、機械学習モデルを利用する方法であるため、正規のWebサイトのブランドロゴや画像のデータを収集して学習データを作成し、モデルを訓練する。
【先行技術文献】
【非特許文献】
【0006】
Yun Lin, Ruofan Liu, Dinil Mon Divakaran, Jun Yang Ng, Qing Zhou Chan, Yiwen Lu, Yuxuan Si, Fan Zhang, and Jin Song Dong. 2021.Phishpedia: A Hybrid Deep Learning Based Approach to Visually Identify Phishing Webpages. In 30th USENIX Security Symposium (USENIX Security 21), USENIX Association, 3793-3810.
Sahar Abdelnabi, Katharina Krombholz, and Mario Fritz. 2020. VisualPhishNet: Zero-Day Phishing Website Detection by Visual Similarity. In ACM Conference on Computer and Communications Security (CCS).
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかし、上記の従来技術では、判定対象のWebサイトがフィッシングサイトか否かを適切に判定することができない場合がある。例えば、従来技術では、正規のWebサイトのブランドロゴ画像を改変したり、独自にWebサイトのレイアウトを設定したりするようなフィッシングサイトを検出することができない場合がある。また、従来の手法では、例えば、フィッシングサイトに表示された文面から文脈を解釈して偽の情報を特定し、ユーザを騙す心理的なテクニックを識別することができない場合がある。
【課題を解決するための手段】
【0008】
上述した課題を解決し、目的を達成するために、本発明の判定装置は、Webサイトに関する複数の情報を取得する取得部と、取得部によって取得されたWebサイトに関する複数の情報の一部を、所定の条件を満たすように削除する削除部と、削除部によって一部が削除されたデータを大規模言語モデルに入力し、大規模言語モデルの出力結果に基づき、Webサイトがフィッシングサイトか否かを判定する判定部とを有することを特徴とする。
【発明の効果】
【0009】
本発明によれば、判定対象のWebサイトがフィッシングサイトか否かを適切に判定することができるという効果を奏する。
【図面の簡単な説明】
【0010】
図1は、システムの全体構成を示す図である。
図2は、実施形態に係る判定装置の構成例を示すブロック図である。
図3は、実施形態に係る判定装置に記憶されるデータの一例を示す図である。
図4は、実施形態に係る判定装置に記憶されるデータの一例を示す図である。
図5は、実施形態に係る削除部における処理によって一部が削除されたデータのトークン数の具体例を示す図である。
図6は、実施形態に係る削除部におけるHTMLソースコードの削除処理の疑似コードの具体例を示す図である。
図7は、実施形態に係る判定装置の処理の具体例を示す図である。
図8は、実施形態に係る大規模言語モデルに入力される入力プロンプトの具体例を示す図である。
図9は、実施形態に係る大規模言語モデルの応答結果の具体例を示す図である。
図10は、実施形態に係る判定装置の全体的な処理の流れの一例を示すフローチャートである。
図11は、判定プログラムを実行するコンピュータの一例を示す図である。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
対話装置
3日前
個人
非正規コート
2か月前
個人
政治のAI化
26日前
個人
情報処理装置
3日前
個人
物品給付年金
1か月前
個人
人物再現システム
1か月前
個人
在宅介護システム
1か月前
個人
RFタグ読取装置
1か月前
個人
プラグインホームページ
17日前
個人
AI飲食最適化プラグイン
1か月前
個人
情報入力装置
3日前
キヤノン株式会社
通信装置
1か月前
個人
物価スライド機能付生命保険
3日前
個人
電話管理システム及び管理方法
1か月前
個人
マイホーム非電子入札システム
3日前
有限会社ノア
データ読取装置
2か月前
個人
広告提供システムおよびその方法
2か月前
キヤノン株式会社
画像処理装置
24日前
株式会社ザメディア
出席管理システム
2か月前
個人
全アルゴリズム対応型プログラム
27日前
株式会社CROSLAN
支援装置
1か月前
個人
決済手数料0%のクレジットカード
6日前
個人
日誌作成支援システム
1か月前
サクサ株式会社
カードの制動構造
5日前
大同特殊鋼株式会社
輝線検出方法
26日前
シャープ株式会社
電子機器
26日前
株式会社タクテック
商品取出集品システム
2か月前
ミサワホーム株式会社
宅配ロッカー
23日前
ミサワホーム株式会社
情報処理装置
1か月前
ひびきの電子株式会社
認証システム
1か月前
パテントフレア株式会社
交差型バーコード
19日前
ミサワホーム株式会社
情報処理装置
2か月前
長屋印刷株式会社
画像形成システム
1か月前
個人
ポイント還元付き配送システム
2か月前
村田機械株式会社
割当補助システム
9日前
トヨタ自動車株式会社
情報処理装置
9日前
続きを見る