TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024099379
公報種別公開特許公報(A)
公開日2024-07-25
出願番号2023003286
出願日2023-01-12
発明の名称データ管理装置、方法、及びプログラム
出願人日本電信電話株式会社,国立大学法人群馬大学
代理人個人,個人,個人
主分類G06F 21/62 20130101AFI20240718BHJP(計算;計数)
要約【課題】複数の匿名化データを連結したデータの有用性悪化を低減するデータ管理装置等を提供する。
【解決手段】データ管理装置は、仮名化部、非識別化部、置換部及び連結部を備える。仮名化部は、他のデータ管理装置との間の協調計算により、識別子の値を仮名に置き換える。非識別化部は、1つ以上の属性の値を非識別化する。置換部は、非識別化後の垂直分割データを構成する各レコードをランダムに置換した仮名付き非識別化データを作成する。連結部は、他のデータ管理装置で作成された仮名付き非識別化データと、自身が作成した仮名付き非識別化データとを共通する仮名により連結した連結データを作成する。また、非識別化部は、与えられたプライバシ保護強度(ε,δ)の下でシャッフルモデルの性質を満たす(ε00)をプライバシ保護強度とする局所差分プライバシにより、垂直分割データを構成するレコード毎に、1つ以上の属性の値を非識別化する。
【選択図】図3
特許請求の範囲【請求項1】
1つの識別子と1つ以上の属性とを持つレコードで構成される垂直分割データを連結した連結データを作成するデータ管理装置であって、
他のデータ管理装置との間の協調計算により、前記識別子の値を仮名に置き換えるように構成されている仮名化部と、
前記1つ以上の属性の値を非識別化するように構成されている非識別化部と、
前記非識別化後の垂直分割データを構成する各レコードをランダムに置換した仮名付き非識別化データを作成するように構成されている置換部と、
前記他のデータ管理装置で作成された仮名付き非識別化データと、自身が作成した仮名付き非識別化データとを共通する仮名により連結した連結データを作成するように構成されている連結部と、を有し、
前記非識別化部は、
与えられたプライバシ保護強度(ε,δ)の下でシャッフルモデルの性質を満たす(ε

,δ

)をプライバシ保護強度とする局所差分プライバシにより、前記垂直分割データを構成するレコード毎に、前記1つ以上の属性の値を非識別化するように構成されている、データ管理装置。
続きを表示(約 2,000 文字)【請求項2】
前記非識別化部は、
前記垂直分割データに含まれるi番目のレコードをx

、i番目のレコードx

に含まれる属性の値から前記仮名を除いたデータをx

'、前記垂直分割データに含まれるレコード数をm、(ε

,δ

)をプライバシ保護強度とする局所差分プライバシを満たすメカニズムをM
(i)
としたとき、M
(1)
(x

'),・・・,M
(m)
(x

')により前記1つ以上の属性の値を非識別化するように構成されており、
前記置換部は、
{1,・・・,m}をランダムに置換する置換関数をπ、i番目のレコードに含まれる仮名をc

'(i)としたとき、((c

'(π(1)),M
(π(1))
(x
π(1)
')),・・・,(c

'(π(m)),M
(π(m))
(x
π(m)
')))
τ
により前記仮名付き非識別化データを作成するように構成されている、請求項1に記載のデータ管理装置。
【請求項3】
前記シャッフルモデルの性質は、ε=ln(1+((e^ε

-1)/(e^ε

+1))((8√(e^ε

ln(4/δ))/√m)+(8e^ε

)/m))、δ=δ'+(e^ε+1)(1+e^(-ε

)/2)mδ

(ただし、δ'∈[0,1]はε

≦ln(m/(16ln(2/δ')))を満たす。)である、請求項2に記載のデータ管理装置。
【請求項4】
前記連結データ、又は、前記連結データの統計量から、データ合成手法によって前記連結データの統計的性質を残すランダムな疑似データを生成するように構成されているデータ合成部を更に有する請求項1乃至3の何れか一項に記載のデータ管理装置。
【請求項5】
前記データ合成部は、
前記局所差分プライバシを実現するアルゴリズムに対応する統計量再構築手法により前記連結データの統計量の事後分布を推定して前記統計量を算出し、前記統計量から前記疑似データを生成するように構成されている、請求項4に記載のデータ管理装置。
【請求項6】
1つの識別子と1つ以上の属性とを持つレコードで構成される垂直分割データを連結した連結データを作成するデータ管理装置が、
他のデータ管理装置との間の協調計算により、前記識別子の値を仮名に置き換える仮名化手順と、
前記1つ以上の属性の値を非識別化する非識別化手順と、
前記非識別化後の垂直分割データを構成する各レコードをランダムに置換した仮名付き非識別化データを作成する置換手順と、
前記他のデータ管理装置で作成された仮名付き非識別化データと、自身が作成した仮名付き非識別化データとを共通する仮名により連結した連結データを作成する連結手順と、を実行し、
前記非識別化手順は、
与えられたプライバシ保護強度(ε,δ)の下でシャッフルモデルの性質を満たす(ε

,δ

)をプライバシ保護強度とする局所差分プライバシにより、前記垂直分割データを構成するレコード毎に、前記1つ以上の属性の値を非識別化する、データ管理方法。
【請求項7】
1つの識別子と1つ以上の属性とを持つレコードで構成される垂直分割データを連結した連結データを作成するデータ管理装置に、
他のデータ管理装置との間の協調計算により、前記識別子の値を仮名に置き換える仮名化手順と、
前記1つ以上の属性の値を非識別化する非識別化手順と、
前記非識別化後の垂直分割データを構成する各レコードをランダムに置換した仮名付き非識別化データを作成する置換手順と、
前記他のデータ管理装置で作成された仮名付き非識別化データと、自身が作成した仮名付き非識別化データとを共通する仮名により連結した連結データを作成する連結手順と、を実行させ、
前記非識別化手順は、
与えられたプライバシ保護強度(ε,δ)の下でシャッフルモデルの性質を満たす(ε

,δ

)をプライバシ保護強度とする局所差分プライバシにより、前記垂直分割データを構成するレコード毎に、前記1つ以上の属性の値を非識別化する、プログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、データ管理装置、方法、及びプログラムに関する。
続きを表示(約 1,900 文字)【背景技術】
【0002】
データ収集デバイスの多様化やAI(Artificial Intelligence)の進化等に伴い、社会課題の解決やサービスの質向上等に資する手段としてパーソナルデータの利活用が注目を集めている。一方で、データ提供者となる個人のプライバシ意識も高まっており、パーソナルデータの利活用には、倫理、法規制、運用管理、技術等といった様々な観点を踏まえた適切な対応が強く求められる。特に、組織間で同一個人のデータを連結して組織横断的に利活用する場合は、新たな価値創造が期待できる反面、データ連結と匿名性のトレードオフ問題が生じる。すなわち、ある組織がパーソナルデータを匿名化して別の組織に提供する場合、一般に同一個人のデータ連結に用いることができる識別子が匿名性を損ねてしまう。この問題は、垂直分割データの協調匿名化問題として知られている。なお、識別子とは、データを一意に識別可能な情報のことである。
【0003】
垂直分割データの協調匿名化問題を解決する従来技術として、各組織が保有する識別子の仮名化とその他の属性データの非識別化に加え、セキュアマルチパーティ計算又はPk-匿名化を適用する垂直分割データ連結プロトコルが提案されている(非特許文献1)。
【先行技術文献】
【非特許文献】
【0004】
千田浩司, 紀伊真昇, 市川敦謙, 野澤一真, 長谷川慶太, 堂面拓也, 中川智尋, 青野博, 寺田雅之: パーソナルデータの等結合に適した匿名化技術の考案, SCIS2022, 1F3-2 (2022).
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、一般に属性数が多いほど強い非識別化(データのランダム化)が必要となるため、従来技術では、連結データの有用性が著しく悪化してしまうという問題がある。
【0006】
本開示は、上記の点に鑑みてなされたもので、複数の匿名化データを連結したデータの有用性悪化を低減する技術を提供する。
【課題を解決するための手段】
【0007】
本開示の一態様によるデータ管理装置は、1つの識別子と1つ以上の属性とを持つレコードで構成される垂直分割データを連結した連結データを作成するデータ管理装置であって、他のデータ管理装置との間の協調計算により、前記識別子の値を仮名に置き換えるように構成されている仮名化部と、前記1つ以上の属性の値を非識別化するように構成されている非識別化部と、前記非識別化後の垂直分割データを構成する各レコードをランダムに置換した仮名付き非識別化データを作成するように構成されている置換部と、前記他のデータ管理装置で作成された仮名付き非識別化データと、自身が作成した仮名付き非識別化データとを共通する仮名により連結した連結データを作成するように構成されている連結部と、を有し、前記非識別化部は、与えられたプライバシ保護強度(ε,δ)の下でシャッフルモデルの性質を満たす(ε

,δ

)をプライバシ保護強度とする局所差分プライバシにより、前記垂直分割データを構成するレコード毎に、前記1つ以上の属性の値を非識別化するように構成されている。
【発明の効果】
【0008】
複数の匿名化データを連結したデータの有用性悪化を低減する技術が提供される。
【図面の簡単な説明】
【0009】
本実施形態に係るデータ管理装置が含まれるシステムの全体構成の一例を示す図である。
本実施形態に係るデータ管理装置のハードウェア構成の一例を示す図である。
本実施形態に係るデータ管理装置の機能構成の一例を示す図である。
本実施形態に係るデータ管理装置が実行する処理の流れの一例を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、本発明の一実施形態について説明する。以下の実施形態では、垂直分割データをそれぞれ保持・管理する複数のデータ管理装置10で垂直分割データ連結プロトコルにより連結データを作成する際に、シャッフルモデルに基づく局所差分プライバシにより非識別化することで、連結データの有用性悪化を低減する手法について説明する。また、データ管理装置10で連結データ又はその統計量からデータ合成により疑似データを生成する手法についても説明する。なお、連結は「結合」や「名寄せ」等と呼ばれることもある。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
GPSロガー
12日前
個人
情報処理システム
1か月前
個人
デトろぐシステム
11日前
個人
防災情報システム
1か月前
日本精機株式会社
表示装置
25日前
個人
管理装置
4日前
個人
指先受の付いたマウス。
28日前
個人
都市経営シミュレーション
17日前
個人
介護者指名システム
1か月前
個人
管理装置
6日前
個人
特徴検討支援システム
4日前
個人
契約管理サーバ
3日前
有限会社マイコム
制御盤のAI見積
1か月前
キヤノン株式会社
情報処理装置
1か月前
國立臺灣大學
操作補助システム
18日前
中国電力株式会社
販売支援方法
2か月前
個人
支援システム及び支援方法
19日前
株式会社Haul
採用支援方法
1か月前
エムケー精工株式会社
洗車場システム
1か月前
株式会社テクロス
情報処理装置
10日前
株式会社野村総合研究所
検証装置
10日前
個人
災害情報表示システム
1か月前
トヨタ自動車株式会社
車両
4日前
株式会社美好屋商店
広告システム
17日前
トヨタ自動車株式会社
表認識方法
1か月前
株式会社奥村組
削孔位置検出方法
3日前
個人
すべて大吉となるおみくじ制作装置
24日前
株式会社にしがき
会員権システム
1か月前
株式会社Asuka
本人認証方法
1か月前
日本信号株式会社
料金精算システム
24日前
個人
マイナンバーポイントの直販システム
13日前
株式会社JVCケンウッド
処理装置
1か月前
株式会社mov
情報処理装置
1か月前
トヨタ自動車株式会社
情報処理装置
7日前
トヨタ自動車株式会社
画像処理装置
1か月前
トヨタ自動車株式会社
画像処理装置
1か月前
続きを見る