TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024155453
公報種別公開特許公報(A)
公開日2024-10-31
出願番号2023070186
出願日2023-04-21
発明の名称情報処理装置、情報処理方法、プログラム
出願人日本電気株式会社
代理人個人,個人,個人,個人
主分類G06N 20/00 20190101AFI20241024BHJP(計算;計数)
要約【課題】機械学習モデルの正しいリスクアセスメントを行うことができないこと。
【解決手段】本開示の情報処理装置100は、機械学習モデルに入力される第一属性値と第二属性値とに関する機械学習モデルの判断境界と、第一属性値の既知値と第二属性値の未知である候補値との対からなる標的データと、に基づいて、標的データが機械学習モデルの訓練データとして妥当であるかを判定する判定部と、妥当であると判定された標的データに含まれる第二属性値の候補値から第二属性値の値を推定する推定部と、を備える。
【選択図】図10


特許請求の範囲【請求項1】
機械学習モデルに入力される第一属性値と第二属性値とに関する当該機械学習モデルの判断境界と、前記第一属性値の既知値と前記第二属性値の未知である候補値との対からなる標的データと、に基づいて、当該標的データが前記機械学習モデルの訓練データとして妥当であるかを判定する判定部と、
妥当であると判定された前記標的データに含まれる前記第二属性値の候補値から当該第二属性値の値を推定する推定部と、
を備えた情報処理装置。
続きを表示(約 1,500 文字)【請求項2】
請求項1に記載の情報処理装置であって、
前記判定部は、前記機械学習モデルである決定木モデルの条件分岐の内容に基づく前記判断境界における前記第一属性値に対応する境界値と、前記第一属性値の既知値と、に基づいて、前記標的データが妥当であるかを判定する、
情報処理装置。
【請求項3】
請求項2に記載の情報処理装置であって、
前記判定部は、前記第一属性値の既知値が同一であり前記第二属性値の未知である候補値がそれぞれ異なる複数の前記標的データそれぞれにおいて、前記条件分岐に含まれる条件式の閾値と、前記標的データに含まれる前記第一属性値の既知値と、の比較に基づいて、前記標的データが妥当であるかを判定する、
情報処理装置。
【請求項4】
請求項3に記載の情報処理装置であって、
前記判定部は、前記標的データが前記決定木モデルの前記条件分岐にて通るパス上における当該条件分岐に含まれる条件式の閾値と、前記標的データに含まれる前記第一属性値の既知値と、が異なる場合に、当該標的データが妥当であると判定する、
情報処理装置。
【請求項5】
請求項3に記載の情報処理装置であって、
前記判定部は、前記標的データが前記決定木モデルの前記条件分岐にて通るパス上における当該条件分岐に含まれる条件式の閾値を基準とした所定範囲外に前記第一属性値の既知値がある場合に、当該標的データが妥当であると判定する、
情報処理装置。
【請求項6】
請求項3に記載の情報処理装置であって、
前記推定部は、妥当であると判定された前記標的データの前記第二属性値の候補値から、当該第二属性値の候補値と対となる前記第一属性値の既知値と、前記判断境界と、に基づいて、前記第二属性値の値を推定する、
情報処理装置。
【請求項7】
請求項6に記載の情報処理装置であって、
前記推定部は、妥当であると判定された前記標的データの前記第二属性値の候補値から、当該第二属性値と対となる前記第一属性値の既知値と、前記条件分岐に含まれる条件式の閾値と、の距離に基づいて、前記第二属性値の値を推定する、
情報処理装置。
【請求項8】
請求項7に記載の情報処理装置であって、
前記推定部は、妥当であると判定された前記標的データの前記第二属性値の候補値のうち、前記条件分岐に含まれる条件式の閾値からの距離が最も大きい前記第一属性値の既知値と対となる前記第二属性値の候補値を、前記第二属性値の値として推定する、
情報処理装置。
【請求項9】
機械学習モデルに入力される第一属性値と第二属性値とに関する当該機械学習モデルの判断境界と、前記第一属性値の既知値と前記第二属性値の未知である候補値との対からなる標的データと、に基づいて、当該標的データが前記機械学習モデルの訓練データとして妥当であるかを判定し、
妥当であると判定された前記標的データに含まれる前記第二属性値の候補値から当該第二属性値の値を推定する、
情報処理方法。
【請求項10】
機械学習モデルに入力される第一属性値と第二属性値とに関する当該機械学習モデルの判断境界と、前記第一属性値の既知値と前記第二属性値の未知である候補値との対からなる標的データと、に基づいて、当該標的データが前記機械学習モデルの訓練データとして妥当であるかを判定し、
妥当であると判定された前記標的データに含まれる前記第二属性値の候補値から当該第二属性値の値を推定する、
処理をコンピュータに実行させるためのプログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、情報処理装置、情報処理方法、プログラムに関する。
続きを表示(約 2,200 文字)【背景技術】
【0002】
機械学習などを用いて学習された学習モデルのプライバシーリスク評価などを目的として、学習後の学習モデルからの出力に基づいて、学習時に用いられたデータ(訓練データ)を推定する技術である属性推定攻撃が知られている。
【0003】
ここで、属性推定とは、あるデータの既知である属性(既知属性)の値を基に、未知である属性(標的属性)の値を推測する手法である。例えば、顧客の「年収及び年齢」と、住居が賃貸か持家かといった「住居状況」と、が記載されたデータセットを想定する。このとき、「年齢」、あるいは、「年齢」と「住居状況」の両方、が既知属性として判明しているデータ(標的データ)に対して、これら既知属性の値から、標的属性である「年収」を推測することが属性推定に当たる。そして、先行文献では、機械学習モデルを参照すると、訓練に用いられたデータセット(訓練データセット)内の標的データに対する属性推定の成功確率が向上することが報告されている。
【0004】
例えば、非特許文献1には、標的データの既知属性と真のラベルを入力として、学習モデル由来の情報を用いた所定の処理を実行することで、未知属性の尤もらしい値を出力する方法が記載されている。ここで、ラベルとは、学習タスクの答えとなる目的変数のことである。具体的には、推定対象の未知属性をある値で固定して実現候補とし、実現候補を入力としたときに学習モデルの出力する推定ラベルを計算する。その後、仮定したエラー関数を用いて真のラベルと推定ラベルの間のずれから尤もらしさを算出し、算出結果を重みとして標的属性の周辺確率を評価する。最終的に、評価値が最も大きい実現候補を推測結果として出力する。非特許文献1には、例えば、上記のような処理を行って、尤もらしい属性値を特定することが記載されている。
【0005】
また、非特許文献2には、重みの計算として、決定木モデルの判断境界内のデータ数の比に基づいて重みを算出し、算出したずれを重みとして周辺確率を評価して、評価値が最も大きい実現候補を推測結果として出力する、という処理を行って、尤もらしい属性値を特定することが記載されている。
【先行技術文献】
【非特許文献】
【0006】
Fredrikson et. al.,Privacy in Pharmacogenetics: An End-to-End Case Study of Personalized Warfarin Dosing,Proceedings of the 23rd USENIX Security Symposium, p. 17- 32,2014
Fredrikson et. al.,Model Inversion Attacks that Exploit Confidence Information and Basic Countermeasures,CCS '15: Proceedings of the 22nd ACM SIGSAC Conference on Computer and Communications Security, p. 1322- 1333,2015
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上述した先行技術文献に記載の技術では、標的モデルの構造を十分に考慮していないため、属性推定の結果として正解でない候補を出力してしまう可能性がある。そのため、先行技術に基づいて構成されたモデルのリスクアセスメント装置も、本来想定すべき攻撃より弱い攻撃しか想定できておらず、正しいリスクアセスメントが行えていない、という課題が生じていた。
【0008】
このため、本開示の目的は、上述した課題である、機械学習モデルの正しいリスクアセスメントを行うことができない、ことを解決することができる情報処理装置を提供することにある。
【課題を解決するための手段】
【0009】
本開示の一形態である情報処理装置は、
機械学習モデルに入力される第一属性値と第二属性値とに関する当該機械学習モデルの判断境界と、前記第一属性値の既知値と前記第二属性値の未知である候補値との対からなる標的データと、に基づいて、当該標的データが前記機械学習モデルの訓練データとして妥当であるかを判定する判定部と、
妥当であると判定された前記標的データに含まれる前記第二属性値の候補値から当該第二属性値の値を推定する推定部と、
を備えた、
という構成をとる。
【0010】
また、本開示の一形態である情報処理方法は、
機械学習モデルに入力される第一属性値と第二属性値とに関する当該機械学習モデルの判断境界と、前記第一属性値の既知値と前記第二属性値の未知である候補値との対からなる標的データと、に基づいて、当該標的データが前記機械学習モデルの訓練データとして妥当であるかを判定し、
妥当であると判定された前記標的データに含まれる前記第二属性値の候補値から当該第二属性値の値を推定する、
という構成をとる。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
情報提示方法
25日前
個人
自動精算システム
1か月前
個人
RFタグ読取装置
1か月前
個人
アカウントマップ
18日前
個人
プログラム
24日前
個人
プログラム
17日前
個人
売買システム
1か月前
個人
管理サーバ
1か月前
個人
市場受発注システム
1か月前
個人
発想支援方法及びシステム
28日前
個人
学習装置及び推論装置
17日前
個人
分類処理プログラム及び方法
28日前
日本精機株式会社
車両用表示装置
1か月前
個人
案件管理装置および端末装置
4日前
日本精機株式会社
車両用表示装置
1か月前
富士通株式会社
金融システム
25日前
井関農機株式会社
ロボット作業車両
1か月前
個人
VRによる人体各部位の立体化
1か月前
株式会社発明屋
電池指向の構造設計
11日前
トヨタ自動車株式会社
管理装置
12日前
キヤノン株式会社
情報処理装置
1か月前
株式会社プレニーズ
仲介システム
18日前
株式会社イズミ
総合代行システム
今日
富士通株式会社
プロセッサ
10日前
個人
ダブルオークションシステム
今日
個人
販売支援システム
1か月前
村田機械株式会社
人員配置システム
28日前
トヨタ自動車株式会社
記号識別方法
1か月前
富士通株式会社
予測
3日前
ブラザー工業株式会社
無線通信装置
1か月前
個人
情報処理装置およびプログラム
1か月前
トヨタ自動車株式会社
画像処理装置
1か月前
トヨタ自動車株式会社
作業評価装置
1か月前
トヨタ自動車株式会社
情報通知方法
1か月前
トヨタ自動車株式会社
作業管理装置
1か月前
トヨタ自動車株式会社
生成装置
25日前
続きを見る