TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025083161
公報種別公開特許公報(A)
公開日2025-05-30
出願番号2023196897
出願日2023-11-20
発明の名称匿名化システムおよび匿名化方法
出願人株式会社日立製作所
代理人青稜弁理士法人
主分類G06F 21/62 20130101AFI20250523BHJP(計算;計数)
要約【課題】
複数のデータを考慮した匿名加工を行う場合において、より適切な検証を実現する技術を提供すること。
【解決手段】
匿名化データ提供装置は、テキストデータ内の匿名化対象の要素の各々に対し、仮名化(名寄せ有)データと仮名化(名寄せ有)データ用乱数を生成する第1処理と、仮名化(名寄せ無)データと仮名化(名寄せ無)データ用乱数を生成する第2処理と、一般化データと一般化データ用乱数を生成する第3処理と、削除データと削除データ用乱数を生成する第4処理と、を行う。匿名化の際、データ内の匿名化対象の要素の各々に対し、第1処理、第2処理、第3処理、第4処理のうちで匿名化要求に必要な処理を行い、匿名化データと匿名化データ用乱数を生成する。匿名化データ利用者装置は、データ検証の際、匿名化データ提供装置が行っていない処理をし、削除データ用乱数を生成し、それぞれの削除データ用乱数に基づいて匿名化データの正当性を検証する。
【選択図】 図8B
特許請求の範囲【請求項1】
匿名化データ提供装置と、前記匿名化データ提供装置と通信可能な匿名化データ利用者装置と、を備える匿名化システムであって、
前記匿名化データ提供装置は、
データ検証に用いる値を生成する際に、テキストデータ内の固有表現各々に対して、元データを複数テキストデータにわたって識別可能な値に置換した仮名化(名寄せ有)データと、元データと当該元データに用いる乱数に基づく仮名化(名寄せ有)データ用乱数を生成する第1処理と、元データを前記テキストデータ内でのみ識別可能な値に置換した仮名化(名寄せ無)データと、前記仮名化(名寄せ有)データと前記仮名化(名寄せ有)データ用乱数に基づく仮名化(名寄せ無)データ用乱数を生成する第2処理と、元データを一般化した値に置換した一般化データと、前記仮名化(名寄せ無)データと前記仮名化(名寄せ無)データ用乱数に基づく一般化データ用乱数を生成する第3処理と、前記一般化データを空白に置換した削除データと、前記一般化データと前記一般化データ用乱数に基づく削除データ用乱数を生成する第4処理と、テキストデータ内の非固有表現各々に対して、元データのハッシュ値を生成する第5処理と、を行い、
前記匿名化データ利用者装置からのデータの匿名化に関する匿名化要求に応じてデータを匿名化する際に、データ内の要素の各々に対して、前記第1処理、前記第2処理、前記第3処理、前記第4処理のうちで前記匿名化要求に必要な処理を行い、匿名化したデータである匿名化データと、前記処理に基づく乱数である匿名化データ用乱数を生成し、
前記匿名化データ利用者装置は、
通信を介して、前記匿名化データと前記匿名化データ用乱数を取得し、
データ検証の際に、匿名化テキストデータ内の固有表現の各々に対して、前記第1処理、前記第2処理、前記第3処理、前記第4処理のうちで前記匿名化データ提供装置が行っていない処理を行い、削除データ用乱数を生成し、匿名化データ内の非固有表現各々に対して、元データのハッシュ値を生成し、
前記匿名化データ提供装置が生成した削除データ用乱数およびハッシュ値と、生成した削除データ用乱数およびハッシュ値と、に基づいて、取得した前記匿名化データの正当性を検証する、
ことを特徴とする匿名化システム。
続きを表示(約 2,900 文字)【請求項2】
請求項1に記載の匿名化システムであって、
前記匿名化データ提供装置は、
前記削除データ用乱数およびハッシュ値を生成する第1装置と、
前記匿名化データおよび前記匿名化データ用乱数を生成する第2装置と、を備え、
前記第1装置と前記第2装置は、
通信可能に接続されたそれぞれ異なるコンピュータであり、
前記匿名化データ利用者装置は、
前記第2装置から前記匿名化データと前記匿名化データ用乱数を取得する、
ことを特徴とする匿名化システム。
【請求項3】
請求項1に記載の匿名化システムであって、
前記データ利用者装置は、
前記匿名化要求において、固有表現の分類で、無加工、仮名化(名寄せ有)、仮名化(名寄せ無)削除、および、一般化の何れかを選択可能である、
ことを特徴とする匿名化システム。
【請求項4】
請求項1に記載の匿名化システムであって、
前記匿名化データ提供装置および前記匿名化データ利用者装置は、
前記第1処理において、固有表現の分類と、同一の分類における固有表現それぞれに文書間の名寄せに基づき付された第1インデックスと、に基づいて、仮名化(名寄せ有)データを生成する、
ことを特徴とする匿名化システム。
【請求項5】
請求項1に記載の匿名化システムであって、
前記匿名化データ提供装置および前記匿名化データ利用者装置は、
前記第2処理において、固有表現の分類と、同一の分類における固有表現それぞれに文書内の名寄せに基づき付された第2インデックスと、に基づいて、仮名化(名寄せ無)データを生成する、
ことを特徴とする匿名化システム。
【請求項6】
請求項1に記載の匿名化システムであって、
名寄せに関するデータを管理する名寄せデータ管理装置を更に備え、
前記匿名化データ提供装置は、
前記テキストデータ内で類似する固有表現の名寄せに関する第1名寄せに用いる画面のデータを出力し、
前記名寄せデータ管理装置は、
前記第1名寄せにおいて名寄せする固有表現および名寄せしない固有表現と、当該名寄せデータ管理装置で管理する固有表現と、の類似度を計算し、
前記匿名化データ提供装置は、
前記類似度に基づいて類似する固有表現の情報を示す画面であって、前記テキストデータ内の固有表現と、前記テキストデータ外の固有表現が区別して示され、類似する固有表現の名寄せに関する第2名寄せに用いる画面のデータを出力し、
前記名寄せデータ管理装置は、
前記第2名寄せにおいて、名寄せする固有表現に第1インデックスを設定し、名寄せしない固有表現に第2インデックスを設定し、
前記匿名化データ提供装置および前記匿名化データ利用者装置は、
前記第1処理において、固有表現の分類と、同一の分類における固有表現それぞれに付された前記第1インデックスと、に基づいて、仮名化(名寄せ有)データを生成し、
前記匿名化データ提供装置および前記匿名化データ利用者装置は、
前記第2処理において、固有表現の分類と、同一の分類における固有表現それぞれに付された前記第2インデックスと、に基づいて、仮名化(名寄せ無)データを生成する、
ことを特徴とする匿名化システム。
【請求項7】
匿名化データ提供装置と、前記匿名化データ提供装置と通信可能な匿名化データ利用者装置と、を用いて行う匿名化方法であって、
前記匿名化データ提供装置は、
データ検証に用いる値を生成する際に、テキストデータ内の固有表現の各々に対して、元データを複数テキストデータにわたって識別可能な値に置換した仮名化(名寄せ有)データと、元データと当該元データに用いる乱数に基づく仮名化(名寄せ有)データ用乱数を生成する第1処理と、元データを前記テキストデータ内でのみ識別可能な値に置換した仮名化(名寄せ無)データと、前記仮名化(名寄せ有)データと前記仮名化(名寄せ有)データ用乱数に基づく仮名化(名寄せ無)データ用乱数を生成する第2処理と、元データを一般化した値に置換した一般化データと、前記仮名化(名寄せ無)データと前記仮名化(名寄せ無)データ用乱数に基づく一般化データ用乱数を生成する第3処理と、前記一般化データを空白に置換した削除データと、前記一般化データと前記一般化データ用乱数に基づく削除データ用乱数を生成する第4処理と、を行い、
前記匿名化データ利用者装置からのデータの匿名化に関する匿名化要求に応じてデータを匿名化する際に、データ内の要素の各々に対して、前記第1処理、前記第2処理、前記第3処理、前記第4処理のうちで前記匿名化要求に必要な処理を行い、匿名化したデータである匿名化データと、前記処理に基づく乱数である匿名化データ用乱数を生成し、
前記匿名化データ利用者装置は、
通信を介して、前記匿名化データと前記匿名化データ用乱数を取得し、
データ検証の際に、匿名化データ内の要素の各々に対して、前記第1処理、前記第2処理、前記第3処理、前記第4処理のうちで前記匿名化データ提供装置が行っていない処理を行い、削除データ用乱数を生成し、
前記匿名化データ提供装置が生成した削除データ用乱数と、生成した削除データ用乱数と、に基づいて、取得した前記匿名化データの正当性を検証する、
ことを特徴とする匿名化方法。
【請求項8】
請求項7に記載の匿名化方法であって、
前記匿名化データ提供装置は、
前記削除データ用乱数を生成する第1装置と、
前記匿名化データおよび前記匿名化データ用乱数を生成する第2装置と、を備え、
前記第1装置と前記第2装置は、
通信可能に接続されたそれぞれ異なるコンピュータであり、
前記匿名化データ利用者装置は、
前記第2装置から前記匿名化データと前記匿名化データ用乱数を取得する、
ことを特徴とする匿名化方法。
【請求項9】
請求項7に記載の匿名化方法であって、
前記匿名化データ利用者装置は、
前記匿名化要求において、固有表現の分類単位で、無加工、仮名化(名寄せ有)、仮名化(名寄せ無)、削除、および、一般化の何れかを選択可能である、
ことを特徴とする匿名化方法。
【請求項10】
請求項7に記載の匿名化方法であって、
前記匿名化データ提供装置および前記匿名化データ利用者装置は、
前記第1処理において、固有表現の分類と、同一の分類における固有表現それぞれに文書間の名寄せに基づき付された第1インデックスと、に基づいて、仮名化(名寄せ有)データを生成する、
ことを特徴とする匿名化方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、匿名化システムおよび匿名化方法に関する。
続きを表示(約 2,000 文字)【背景技術】
【0002】
個人情報の保護に関する法律により、特定の個人を識別することができる記述を削除または置換した匿名加工情報の利活用が進んでいる。2022年4月に全面施行された「個人情報の保護に関する法律等の一部を改正する法律(通称、令和2年改正個人情報法)」では、内部分析に限定する等を条件に一部対応義務を緩和する「仮名加工情報」が新設され、データの利活用がより進展すると考えられる。
【0003】
データの利活用において、データに対して不当な改変が行われていないこと(データの正当性)は、データの利活用結果の正当性を保証するために重要となる。匿名化処理の正当性検証技術を開示する文献として、特許文献1および非特許文献1がある。
【0004】
特許文献1は、表形式のデータに対し、属性ごとに「無加工」、「仮名化」、「一般化」、「削除」のいずれかの加工を署名生成者が選択し、匿名加工者が署名者が選択した加工処理を行った場合には、加工後であっても署名の検証が可能となっている技術を開示する。
【0005】
非特許文献1は、表形式のデータおよびテキストデータに対し、匿名加工者が「無加工」「仮名化」「一般化」「削除」のいずれかの加工を行っても署名の検証が可能となっている技術を開示する。
【先行技術文献】
【特許文献】
【0006】
特開2023-060684号公報
【非特許文献】
【0007】
冨樫由美子 他、「テキストデータに対する匿名加工プロセス保証方式の検討」、2023年暗号とセキュリティシンポジウム (SCIS2023)、2023/01
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、特許文献1、非特許文献1のいずれも単一のデータに対する匿名加工にのみ着目しており、複数のデータについては考慮されておらず、仮名化において不適切な結果となる可能性がある。具体的には、複数のテキストデータがあった場合、同一対象に対して異なる識別子が割り当てられたり、逆に異なる対象に対して同一の識別子が割り当てられたりする可能性がある。
【0009】
そこで、複数のデータを考慮した匿名加工を行う場合において、より適切な検証を実現する技術を提供することに課題がある。
【課題を解決するための手段】
【0010】
本願において開示される発明の一側面となる匿名化システムは、下記の通りである。すなわち、この匿名化システムは、匿名化データ提供装置と、匿名化データ提供装置と通信可能な匿名化データ利用者装置とを備える。匿名化データ提供装置は、データ検証に用いる値を生成する際に、テキストデータ内の固有表現各々に対して、元データを複数テキストデータにわたって識別可能な値に置換した仮名化(名寄せ有)データと、元データと当該元データに用いる乱数に基づく仮名化(名寄せ有)データ用乱数を生成する第1処理と、元データを前記テキストデータ内でのみ識別可能な値に置換した仮名化(名寄せ無)データと、前記仮名化(名寄せ有)データと前記仮名化(名寄せ有)データ用乱数に基づく仮名化(名寄せ無)データ用乱数を生成する第2処理と、元データを一般化した値に置換した一般化データと、前記仮名化(名寄せ無)データと前記仮名化(名寄せ無)データ用乱数に基づく一般化データ用乱数を生成する第3処理と、前記一般化データを空白に置換した削除データと、前記一般化データと前記一般化データ用乱数に基づく削除データ用乱数を生成する第4処理と、テキストデータ内の非固有表現各々に対して、元データのハッシュ値を生成する第5処理と、を行い、前記匿名化データ利用者装置からのデータの匿名化に関する匿名化要求に応じてデータを匿名化する際に、データ内の要素の各々に対して、前記第1処理、前記第2処理、前記第3処理、前記第4処理のうちで前記匿名化要求に必要な処理を行い、匿名化したデータである匿名化データと、前記処理に基づく乱数である匿名化データ用乱数を生成する。匿名化データ利用者装置は、通信を介して、前記匿名化データと前記匿名化データ用乱数を取得する。そして、データ検証の際に、匿名化テキストデータ内の固有表現の各々に対して、前記第1処理、前記第2処理、前記第3処理、前記第4処理のうちで前記匿名化データ提供装置が行っていない処理を行い、削除データ用乱数を生成し、匿名化データ内の非固有表現各々に対して、元データのハッシュ値を生成し、前記匿名化データ提供装置が生成した削除データ用乱数およびハッシュ値と、生成した削除データ用乱数およびハッシュ値と、に基づいて、取得した前記匿名化データの正当性を検証する。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

株式会社日立製作所
融通取引提案システム
1日前
株式会社日立製作所
匿名化システムおよび匿名化方法
1日前
株式会社日立製作所
移動体管制装置、車両管制方法、及び車両
1日前
株式会社日立製作所
サービス申請連携システム、および、サービス申請連携方法
1日前
株式会社日立製作所
アレイ型地中レーダ装置のGPRデータから埋設された長尺物の位置を特定する演算処理装置
1日前
個人
政治のAI化
11日前
個人
物品給付年金
16日前
個人
非正規コート
1か月前
個人
人物再現システム
1か月前
個人
在宅介護システム
29日前
個人
RFタグ読取装置
29日前
個人
プラグインホームページ
2日前
個人
AI飲食最適化プラグイン
1か月前
キヤノン株式会社
通信装置
17日前
個人
電話管理システム及び管理方法
1か月前
有限会社ノア
データ読取装置
1か月前
個人
広告提供システムおよびその方法
1か月前
個人
全アルゴリズム対応型プログラム
12日前
キヤノン株式会社
画像処理装置
9日前
株式会社ザメディア
出席管理システム
1か月前
個人
日誌作成支援システム
1か月前
大同特殊鋼株式会社
輝線検出方法
11日前
シャープ株式会社
電子機器
11日前
株式会社CROSLAN
支援装置
29日前
ミサワホーム株式会社
宅配ロッカー
8日前
トヨタ自動車株式会社
欠け検査装置
11日前
ミサワホーム株式会社
情報処理装置
16日前
株式会社タクテック
商品取出集品システム
1か月前
トヨタ自動車株式会社
作業判定方法
1か月前
ミサワホーム株式会社
情報処理装置
1か月前
株式会社アジラ
データ転送システム
11日前
ひびきの電子株式会社
認証システム
1か月前
パテントフレア株式会社
交差型バーコード
4日前
トヨタ自動車株式会社
工程計画装置
1か月前
長屋印刷株式会社
画像形成システム
29日前
個人
ポイント還元付き配送システム
1か月前
続きを見る