TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025083161
公報種別
公開特許公報(A)
公開日
2025-05-30
出願番号
2023196897
出願日
2023-11-20
発明の名称
匿名化システムおよび匿名化方法
出願人
株式会社日立製作所
代理人
青稜弁理士法人
主分類
G06F
21/62 20130101AFI20250523BHJP(計算;計数)
要約
【課題】
複数のデータを考慮した匿名加工を行う場合において、より適切な検証を実現する技術を提供すること。
【解決手段】
匿名化データ提供装置は、テキストデータ内の匿名化対象の要素の各々に対し、仮名化(名寄せ有)データと仮名化(名寄せ有)データ用乱数を生成する第1処理と、仮名化(名寄せ無)データと仮名化(名寄せ無)データ用乱数を生成する第2処理と、一般化データと一般化データ用乱数を生成する第3処理と、削除データと削除データ用乱数を生成する第4処理と、を行う。匿名化の際、データ内の匿名化対象の要素の各々に対し、第1処理、第2処理、第3処理、第4処理のうちで匿名化要求に必要な処理を行い、匿名化データと匿名化データ用乱数を生成する。匿名化データ利用者装置は、データ検証の際、匿名化データ提供装置が行っていない処理をし、削除データ用乱数を生成し、それぞれの削除データ用乱数に基づいて匿名化データの正当性を検証する。
【選択図】 図8B
特許請求の範囲
【請求項1】
匿名化データ提供装置と、前記匿名化データ提供装置と通信可能な匿名化データ利用者装置と、を備える匿名化システムであって、
前記匿名化データ提供装置は、
データ検証に用いる値を生成する際に、テキストデータ内の固有表現各々に対して、元データを複数テキストデータにわたって識別可能な値に置換した仮名化(名寄せ有)データと、元データと当該元データに用いる乱数に基づく仮名化(名寄せ有)データ用乱数を生成する第1処理と、元データを前記テキストデータ内でのみ識別可能な値に置換した仮名化(名寄せ無)データと、前記仮名化(名寄せ有)データと前記仮名化(名寄せ有)データ用乱数に基づく仮名化(名寄せ無)データ用乱数を生成する第2処理と、元データを一般化した値に置換した一般化データと、前記仮名化(名寄せ無)データと前記仮名化(名寄せ無)データ用乱数に基づく一般化データ用乱数を生成する第3処理と、前記一般化データを空白に置換した削除データと、前記一般化データと前記一般化データ用乱数に基づく削除データ用乱数を生成する第4処理と、テキストデータ内の非固有表現各々に対して、元データのハッシュ値を生成する第5処理と、を行い、
前記匿名化データ利用者装置からのデータの匿名化に関する匿名化要求に応じてデータを匿名化する際に、データ内の要素の各々に対して、前記第1処理、前記第2処理、前記第3処理、前記第4処理のうちで前記匿名化要求に必要な処理を行い、匿名化したデータである匿名化データと、前記処理に基づく乱数である匿名化データ用乱数を生成し、
前記匿名化データ利用者装置は、
通信を介して、前記匿名化データと前記匿名化データ用乱数を取得し、
データ検証の際に、匿名化テキストデータ内の固有表現の各々に対して、前記第1処理、前記第2処理、前記第3処理、前記第4処理のうちで前記匿名化データ提供装置が行っていない処理を行い、削除データ用乱数を生成し、匿名化データ内の非固有表現各々に対して、元データのハッシュ値を生成し、
前記匿名化データ提供装置が生成した削除データ用乱数およびハッシュ値と、生成した削除データ用乱数およびハッシュ値と、に基づいて、取得した前記匿名化データの正当性を検証する、
ことを特徴とする匿名化システム。
続きを表示(約 2,900 文字)
【請求項2】
請求項1に記載の匿名化システムであって、
前記匿名化データ提供装置は、
前記削除データ用乱数およびハッシュ値を生成する第1装置と、
前記匿名化データおよび前記匿名化データ用乱数を生成する第2装置と、を備え、
前記第1装置と前記第2装置は、
通信可能に接続されたそれぞれ異なるコンピュータであり、
前記匿名化データ利用者装置は、
前記第2装置から前記匿名化データと前記匿名化データ用乱数を取得する、
ことを特徴とする匿名化システム。
【請求項3】
請求項1に記載の匿名化システムであって、
前記データ利用者装置は、
前記匿名化要求において、固有表現の分類で、無加工、仮名化(名寄せ有)、仮名化(名寄せ無)削除、および、一般化の何れかを選択可能である、
ことを特徴とする匿名化システム。
【請求項4】
請求項1に記載の匿名化システムであって、
前記匿名化データ提供装置および前記匿名化データ利用者装置は、
前記第1処理において、固有表現の分類と、同一の分類における固有表現それぞれに文書間の名寄せに基づき付された第1インデックスと、に基づいて、仮名化(名寄せ有)データを生成する、
ことを特徴とする匿名化システム。
【請求項5】
請求項1に記載の匿名化システムであって、
前記匿名化データ提供装置および前記匿名化データ利用者装置は、
前記第2処理において、固有表現の分類と、同一の分類における固有表現それぞれに文書内の名寄せに基づき付された第2インデックスと、に基づいて、仮名化(名寄せ無)データを生成する、
ことを特徴とする匿名化システム。
【請求項6】
請求項1に記載の匿名化システムであって、
名寄せに関するデータを管理する名寄せデータ管理装置を更に備え、
前記匿名化データ提供装置は、
前記テキストデータ内で類似する固有表現の名寄せに関する第1名寄せに用いる画面のデータを出力し、
前記名寄せデータ管理装置は、
前記第1名寄せにおいて名寄せする固有表現および名寄せしない固有表現と、当該名寄せデータ管理装置で管理する固有表現と、の類似度を計算し、
前記匿名化データ提供装置は、
前記類似度に基づいて類似する固有表現の情報を示す画面であって、前記テキストデータ内の固有表現と、前記テキストデータ外の固有表現が区別して示され、類似する固有表現の名寄せに関する第2名寄せに用いる画面のデータを出力し、
前記名寄せデータ管理装置は、
前記第2名寄せにおいて、名寄せする固有表現に第1インデックスを設定し、名寄せしない固有表現に第2インデックスを設定し、
前記匿名化データ提供装置および前記匿名化データ利用者装置は、
前記第1処理において、固有表現の分類と、同一の分類における固有表現それぞれに付された前記第1インデックスと、に基づいて、仮名化(名寄せ有)データを生成し、
前記匿名化データ提供装置および前記匿名化データ利用者装置は、
前記第2処理において、固有表現の分類と、同一の分類における固有表現それぞれに付された前記第2インデックスと、に基づいて、仮名化(名寄せ無)データを生成する、
ことを特徴とする匿名化システム。
【請求項7】
匿名化データ提供装置と、前記匿名化データ提供装置と通信可能な匿名化データ利用者装置と、を用いて行う匿名化方法であって、
前記匿名化データ提供装置は、
データ検証に用いる値を生成する際に、テキストデータ内の固有表現の各々に対して、元データを複数テキストデータにわたって識別可能な値に置換した仮名化(名寄せ有)データと、元データと当該元データに用いる乱数に基づく仮名化(名寄せ有)データ用乱数を生成する第1処理と、元データを前記テキストデータ内でのみ識別可能な値に置換した仮名化(名寄せ無)データと、前記仮名化(名寄せ有)データと前記仮名化(名寄せ有)データ用乱数に基づく仮名化(名寄せ無)データ用乱数を生成する第2処理と、元データを一般化した値に置換した一般化データと、前記仮名化(名寄せ無)データと前記仮名化(名寄せ無)データ用乱数に基づく一般化データ用乱数を生成する第3処理と、前記一般化データを空白に置換した削除データと、前記一般化データと前記一般化データ用乱数に基づく削除データ用乱数を生成する第4処理と、を行い、
前記匿名化データ利用者装置からのデータの匿名化に関する匿名化要求に応じてデータを匿名化する際に、データ内の要素の各々に対して、前記第1処理、前記第2処理、前記第3処理、前記第4処理のうちで前記匿名化要求に必要な処理を行い、匿名化したデータである匿名化データと、前記処理に基づく乱数である匿名化データ用乱数を生成し、
前記匿名化データ利用者装置は、
通信を介して、前記匿名化データと前記匿名化データ用乱数を取得し、
データ検証の際に、匿名化データ内の要素の各々に対して、前記第1処理、前記第2処理、前記第3処理、前記第4処理のうちで前記匿名化データ提供装置が行っていない処理を行い、削除データ用乱数を生成し、
前記匿名化データ提供装置が生成した削除データ用乱数と、生成した削除データ用乱数と、に基づいて、取得した前記匿名化データの正当性を検証する、
ことを特徴とする匿名化方法。
【請求項8】
請求項7に記載の匿名化方法であって、
前記匿名化データ提供装置は、
前記削除データ用乱数を生成する第1装置と、
前記匿名化データおよび前記匿名化データ用乱数を生成する第2装置と、を備え、
前記第1装置と前記第2装置は、
通信可能に接続されたそれぞれ異なるコンピュータであり、
前記匿名化データ利用者装置は、
前記第2装置から前記匿名化データと前記匿名化データ用乱数を取得する、
ことを特徴とする匿名化方法。
【請求項9】
請求項7に記載の匿名化方法であって、
前記匿名化データ利用者装置は、
前記匿名化要求において、固有表現の分類単位で、無加工、仮名化(名寄せ有)、仮名化(名寄せ無)、削除、および、一般化の何れかを選択可能である、
ことを特徴とする匿名化方法。
【請求項10】
請求項7に記載の匿名化方法であって、
前記匿名化データ提供装置および前記匿名化データ利用者装置は、
前記第1処理において、固有表現の分類と、同一の分類における固有表現それぞれに文書間の名寄せに基づき付された第1インデックスと、に基づいて、仮名化(名寄せ有)データを生成する、
ことを特徴とする匿名化方法。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明は、匿名化システムおよび匿名化方法に関する。
続きを表示(約 2,000 文字)
【背景技術】
【0002】
個人情報の保護に関する法律により、特定の個人を識別することができる記述を削除または置換した匿名加工情報の利活用が進んでいる。2022年4月に全面施行された「個人情報の保護に関する法律等の一部を改正する法律(通称、令和2年改正個人情報法)」では、内部分析に限定する等を条件に一部対応義務を緩和する「仮名加工情報」が新設され、データの利活用がより進展すると考えられる。
【0003】
データの利活用において、データに対して不当な改変が行われていないこと(データの正当性)は、データの利活用結果の正当性を保証するために重要となる。匿名化処理の正当性検証技術を開示する文献として、特許文献1および非特許文献1がある。
【0004】
特許文献1は、表形式のデータに対し、属性ごとに「無加工」、「仮名化」、「一般化」、「削除」のいずれかの加工を署名生成者が選択し、匿名加工者が署名者が選択した加工処理を行った場合には、加工後であっても署名の検証が可能となっている技術を開示する。
【0005】
非特許文献1は、表形式のデータおよびテキストデータに対し、匿名加工者が「無加工」「仮名化」「一般化」「削除」のいずれかの加工を行っても署名の検証が可能となっている技術を開示する。
【先行技術文献】
【特許文献】
【0006】
特開2023-060684号公報
【非特許文献】
【0007】
冨樫由美子 他、「テキストデータに対する匿名加工プロセス保証方式の検討」、2023年暗号とセキュリティシンポジウム (SCIS2023)、2023/01
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、特許文献1、非特許文献1のいずれも単一のデータに対する匿名加工にのみ着目しており、複数のデータについては考慮されておらず、仮名化において不適切な結果となる可能性がある。具体的には、複数のテキストデータがあった場合、同一対象に対して異なる識別子が割り当てられたり、逆に異なる対象に対して同一の識別子が割り当てられたりする可能性がある。
【0009】
そこで、複数のデータを考慮した匿名加工を行う場合において、より適切な検証を実現する技術を提供することに課題がある。
【課題を解決するための手段】
【0010】
本願において開示される発明の一側面となる匿名化システムは、下記の通りである。すなわち、この匿名化システムは、匿名化データ提供装置と、匿名化データ提供装置と通信可能な匿名化データ利用者装置とを備える。匿名化データ提供装置は、データ検証に用いる値を生成する際に、テキストデータ内の固有表現各々に対して、元データを複数テキストデータにわたって識別可能な値に置換した仮名化(名寄せ有)データと、元データと当該元データに用いる乱数に基づく仮名化(名寄せ有)データ用乱数を生成する第1処理と、元データを前記テキストデータ内でのみ識別可能な値に置換した仮名化(名寄せ無)データと、前記仮名化(名寄せ有)データと前記仮名化(名寄せ有)データ用乱数に基づく仮名化(名寄せ無)データ用乱数を生成する第2処理と、元データを一般化した値に置換した一般化データと、前記仮名化(名寄せ無)データと前記仮名化(名寄せ無)データ用乱数に基づく一般化データ用乱数を生成する第3処理と、前記一般化データを空白に置換した削除データと、前記一般化データと前記一般化データ用乱数に基づく削除データ用乱数を生成する第4処理と、テキストデータ内の非固有表現各々に対して、元データのハッシュ値を生成する第5処理と、を行い、前記匿名化データ利用者装置からのデータの匿名化に関する匿名化要求に応じてデータを匿名化する際に、データ内の要素の各々に対して、前記第1処理、前記第2処理、前記第3処理、前記第4処理のうちで前記匿名化要求に必要な処理を行い、匿名化したデータである匿名化データと、前記処理に基づく乱数である匿名化データ用乱数を生成する。匿名化データ利用者装置は、通信を介して、前記匿名化データと前記匿名化データ用乱数を取得する。そして、データ検証の際に、匿名化テキストデータ内の固有表現の各々に対して、前記第1処理、前記第2処理、前記第3処理、前記第4処理のうちで前記匿名化データ提供装置が行っていない処理を行い、削除データ用乱数を生成し、匿名化データ内の非固有表現各々に対して、元データのハッシュ値を生成し、前記匿名化データ提供装置が生成した削除データ用乱数およびハッシュ値と、生成した削除データ用乱数およびハッシュ値と、に基づいて、取得した前記匿名化データの正当性を検証する。
【発明の効果】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
株式会社日立製作所
計測装置及びエレベーターシステム
今日
株式会社日立製作所
状態診断システム及び状態診断方法
今日
株式会社日立製作所
電力調整システム及び電力調整システムの制御方法
今日
株式会社日立製作所
電力系統の調整力管理システム及び電力系統の調整力管理方法
今日
個人
対話装置
14日前
個人
政治のAI化
1か月前
個人
物品給付年金
1か月前
個人
情報処理装置
14日前
個人
RFタグ読取装置
1か月前
個人
在宅介護システム
1か月前
個人
記入設定プラグイン
2日前
個人
情報処理装置
10日前
個人
プラグインホームページ
28日前
個人
情報入力装置
14日前
個人
AI飲食最適化プラグイン
2か月前
キヤノン株式会社
通信装置
1か月前
個人
物価スライド機能付生命保険
14日前
個人
マイホーム非電子入札システム
14日前
個人
全アルゴリズム対応型プログラム
1か月前
キヤノン株式会社
画像処理装置
1か月前
株式会社BONNOU
管理装置
7日前
個人
決済手数料0%のクレジットカード
17日前
シャープ株式会社
電子機器
1か月前
サクサ株式会社
カードの制動構造
16日前
株式会社CROSLAN
支援装置
1か月前
大同特殊鋼株式会社
輝線検出方法
1か月前
長屋印刷株式会社
画像形成システム
1か月前
株式会社ライト
情報処理装置
7日前
ミサワホーム株式会社
情報処理装置
1か月前
ひびきの電子株式会社
認証システム
1か月前
トヨタ自動車株式会社
欠け検査装置
1か月前
ミサワホーム株式会社
宅配ロッカー
1か月前
パテントフレア株式会社
交差型バーコード
1か月前
トヨタ自動車株式会社
情報処理装置
20日前
株式会社アジラ
データ転送システム
1か月前
村田機械株式会社
割当補助システム
20日前
続きを見る
他の特許を見る