発明の詳細な説明【技術分野】 【0001】 本発明は、グラフニューラルネットワーク(GNN)に対するポイゾニング攻撃への対策手法に関する。 続きを表示(約 2,300 文字)【背景技術】 【0002】 従来、グラフデータに対する分類タスクを扱うことが可能なGNNが注目を集めており、ソーシャルネットワークにおけるコミュニティ分析や、創薬における分子的特徴の予測等に応用が可能である。しかし、グラフ学習の分野では、特定の分類タスクのためのラベル付きデータの作成における人的負担が大きいため、ラベル付きデータセットが不足していると言われており、過学習等が起こりやすい状況にあるという問題が存在する。 そこで、膨大なラベルなしデータからより良い表現(数値ベクトル)を出力するエンコード関数を学習できる対照学習技術をグラフデータに適用することで、この問題を解決する教師なしグラフ対照学習(Unsupervised Graph Contrastive Learning(UGCL))が期待されている。しかし、UGCLの学習を妨げるように敵対的エッジを追加するポイゾニング攻撃も示されており、UGCLの利活用のためには、その対策が必要である。 【0003】 UGCLへのポイゾニング攻撃に対する既存の対策として、敵対的学習と呼ばれる技術をUGCLに適用し、ポイゾニング攻撃への耐性を獲得する手法(例えば、非特許文献1参照)が存在する。 UGCLでは、一般的に様々なグラフ構造を考慮しながらエンコード関数を学習するために、グラフ拡張という操作を行い2つのViewと呼ばれる拡張グラフを作成し、それらをもとに学習を行うが、既存手法(非特許文献1)では、敵対的Viewと呼ばれる第3のグラフを作成する。この敵対的Viewと2つのうちの1つのViewとの間で損失を計算する項をUGCLの損失関数に追加して学習を行うことで、ポイゾニング攻撃への耐性を獲得しながら、より良いグラフ表現を出力するエンコーダの生成が可能となる。 【先行技術文献】 【非特許文献】 【0004】 S. Feng et al., "Adversarial graph contrastive learning with information regularization," Proceedings of the ACM Web Conference 2022, pp. 1362-1371. Y. Zhu et al., "Graph contrastive learning with adaptive augmentation," Proceedings of the Web Conference 2021, 2021. S. Zhang et al., "Unsupervised graph poisoning attack via contrastive loss back-propagation," WWW '22: Proceedings of the ACM Web Conference 2022, 2022. 【発明の概要】 【発明が解決しようとする課題】 【0005】 しかしながら、従来の対策手法では、敵対的エッジを含んだままの毒グラフを入力として学習を行うため、学習時に敵対的エッジの影響を完全に排除することができないという課題があった。このため、学習前に毒グラフから敵対的エッジを削除することで、ポイゾニング攻撃の影響を排除する方法が望まれている。 【0006】 本発明は、UGCLへの入力であるグラフに含まれている不要なエッジを適切に除去できる敵対的エッジ除去装置、敵対的エッジ除去方法及び敵対的エッジ除去プログラムを提供することを目的とする。 【課題を解決するための手段】 【0007】 本発明に係る敵対的エッジ除去装置は、エッジを示す隣接行列及びノードの特徴量からなるグラフを、第1のUGCLモデルにより学習し、ノードの埋め込み表現を獲得するためのエンコード関数を最適化するグラフ学習部と、前記グラフに対するデータ拡張演算により、複数の拡張グラフを生成し、前記エンコード関数を用いて、前記拡張グラフのノードそれぞれの埋め込み表現を獲得する表現獲得部と、前記複数の拡張グラフそれぞれにおける各ノードの埋め込み表現に基づいて、第2のUGCLモデルの損失関数を計算し、隣接行列に関する当該損失関数の勾配を算出する勾配計算部と、前記グラフにおいて接続されているノード間の特徴量の類似度が閾値より小さいエッジのうち、前記勾配の総和が最大となるエッジを選択し、対応する隣接行列の要素の値を反転させる隣接行列変換部と、前記グラフ学習部、前記表現獲得部、前記勾配計算部及び前記隣接行列変換部の処理を所定回数繰り返し、変換後のグラフを出力する出力部と、を備える。 【0008】 前記敵対的エッジ除去装置は、前記隣接行列変換部によりエッジが削除されたグラフにおける各ノードの埋め込み表現に基づいて、前記第2のUGCLモデルの損失関数を算出し、最小値となった場合に当該グラフの隣接行列を保持するグラフ評価部を備え、前記出力部は、前記グラフ学習部、前記表現獲得部、前記勾配計算部、前記隣接行列変換部及び前記グラフ評価部の処理を所定回数繰り返した後、前記グラフ評価部により保持されている隣接行列に対応したグラフを出力してもよい。 【0009】 前記第1のUGCLモデルは、前記第2のUGCLモデルと同一であってもよい。 【0010】 前記閾値は、エッジが存在する全ノード間における前記特徴量の類似度を平均した値であってもよい。 (【0011】以降は省略されています)
特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する