TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024018058
公報種別公開特許公報(A)
公開日2024-02-08
出願番号2022121118
出願日2022-07-29
発明の名称機械学習システム
出願人日本放送協会
代理人弁理士法人磯野国際特許商標事務所
主分類G09C 1/00 20060101AFI20240201BHJP(教育;暗号方法;表示;広告;シール)
要約【課題】ユーザの匿名性を保証し、プライバシーを保護できる機械学習システムを提供する。
【解決手段】機械学習システム1は、学習データを管理する学習データ管理装置10と、推論データを管理する推論データ管理装置30と、マルチパーティ計算により学習及び推論を行う複数のクラウドサーバ20とを備え、学習データ管理装置10、推論データ管理装置30、及び、複数のクラウドサーバ20が同一のリング署名方式を用いる。
【選択図】図1
特許請求の範囲【請求項1】
学習データを管理する学習データ管理装置と、推論データを管理する推論データ管理装置と、マルチパーティ計算により学習及び推論を行う複数の学習推論装置と、を備える機械学習システムであって、
前記学習データ管理装置は、
リング署名方式の鍵生成アルゴリズムにより、前記学習データ管理装置の第1公開鍵及び第1秘密鍵を生成する鍵生成部と、
前記学習データを前記学習推論装置毎の第1シェアに秘密分散する秘密分散部と、
前記第1公開鍵と他の前記学習データ管理装置又は前記推論データ管理装置の公開鍵とが含まれる第1公開鍵リストを生成し、前記第1秘密鍵及び前記第1公開鍵リストを用いたリング署名方式の署名生成アルゴリズムにより前記第1シェアから署名を生成し、生成した当該署名を前記第1シェアに付加する匿名署名生成部と、を備え、
前記学習推論装置は、
前記第1公開鍵リストを用いたリング署名方式の署名検証アルゴリズムにより、前記第1シェアに付加された署名を検証する第1匿名署名検証部と、
他の前記学習推論装置との秘密計算により、署名検証済みの前記第1シェアから学習モデルを生成する第1秘密計算部と、
前記推論データ管理装置で生成された第2公開鍵リストを用いたリング署名の署名検証アルゴリズムにより、前記推論データ管理装置で秘密分散された第2シェアに付加された署名を検証する第2匿名署名検証部と、
前記学習モデルを用いた他の前記学習推論装置との秘密計算により、署名検証済みの前記第2シェアから前記学習推論装置毎の推論結果である第3シェアを求める第2秘密計算部と、
前記リング署名の鍵生成アルゴリズムにより、前記学習推論装置の第3公開鍵及び第3秘密鍵を生成する鍵生成部と、
前記第3公開鍵のみが含まれる第3公開鍵リストを生成し、前記第3秘密鍵及び前記第3公開鍵リストを用いたリング署名方式の署名生成アルゴリズムにより前記第3シェアから署名を生成し、生成した当該署名を前記第3シェアに付加する署名生成部と、を備え、
前記推論データ管理装置は、
リング署名方式の鍵生成アルゴリズムにより、前記推論データ管理装置の第2公開鍵及び第2秘密鍵を生成する鍵生成部と、
前記推論データを前記学習推論装置毎の前記第2シェアに秘密分散する秘密分散部と、
前記第2公開鍵と他の前記学習データ管理装置又は前記推論データ管理装置の公開鍵とが含まれる第2公開鍵リストを生成し、前記第2秘密鍵及び前記第2公開鍵リストを用いたリング署名方式の署名生成アルゴリズムにより前記第2シェアから署名を生成し、生成した当該署名を前記第2シェアに付加する匿名署名生成部と、
前記第3公開鍵リストを用いたリング署名方式の署名検証アルゴリズムにより、前記第3シェアに付加された署名を検証する署名検証部と、
前記学習推論装置毎に署名検証済みの第3シェアを合成することで、前記機械学習システムの推論結果を生成する推論結果合成部と、
を備えることを特徴とする機械学習システム。
続きを表示(約 270 文字)【請求項2】
前記学習データ管理装置、前記推論データ管理装置、及び、前記複数の学習推論装置は、同一の前記リング署名方式を用いることを特徴とする請求項1に記載の機械学習システム。
【請求項3】
前記マルチパーティ計算は、3パーティー方式であり、
前記学習推論装置は、3台であることを特徴とする請求項1に記載の機械学習システム。
【請求項4】
前記学習データ管理装置は、複数であり、
前記推論データ管理装置は、複数であることを特徴とする請求項1から請求項3の何れか一項に記載の機械学習システム。

発明の詳細な説明【技術分野】
【0001】
本発明は、マルチパーティ計算により学習及び推論を行う機械学習システムに関する。
続きを表示(約 2,300 文字)【背景技術】
【0002】
近年、機械学習があらゆる分野で利用されている。学習や推論を行う際にユーザのプライバシーが漏洩する問題が指摘されており、ユーザのプライバシーを保護したまま機械学習を行う手法が提案されている。例えば、非特許文献1では、3台のクラウドサーバを利用したマルチパーティ計算により、学習や推論を暗号化したまま行うことが可能なプライバシー保護機械学習システムが提案されている。
【0003】
非特許文献1に記載の技術(以下、「第1従来技術」)では、学習を行う際、データ保有者が保有する学習データを、秘密分散を用いて「シェア」と呼ばれる3つのデータに分割し、各シェアを3台のクラウドサーバにそれぞれ送信する。そして、3台のクラウドサーバは、受信したシェアを用いて、データを暗号化したまま計算を行う秘密計算を実施し、学習モデル(重みやバイアスなどのパラメータ)を生成する。推論を行う際、データ利用者が生成した推論データ(クエリ)を、秘密分散を用いて3つのシェアに分割し、各シェアを3台のクラウドサーバにそれぞれ送信する。そして、3台のクラウドサーバは、受信したシェアおよび学習モデルを用いて秘密計算(推論)を実施し、推論結果のシェアをデータ利用者に送信する。データ利用者は、受信したシェアを合成し推論結果を得る。このように、第1従来技術では、秘密分散をベースとするマルチパーティ計算を用いることにより、クラウド又はネットワーク上におけるプライバシー漏洩を防止することができる。
【0004】
ところで、第1従来技術では、データ保有者が学習データをクラウドサーバに送信する際、1つのシェアのみから学習データを復元することは情報理論的に困難である。このため、第1従来技術では、学習データからユーザのプライバシーが漏洩する危険性はない。しかし、第1従来技術では、ネットワーク上に流れるシェアを攻撃者が改ざんすることは可能であるため、3台のクラウドサーバによって生成された学習モデルが所望の性能を達成できなくなる恐れがある。
【0005】
この問題に対処するためには、RSA署名やDSA署名などのデジタル署名をプライバシー保護機械学習システムに適用する手法(以下、「第2従来技術」)が考えられる。すなわち、第2従来技術では、シェアにデータ保有者の署名を付加し、クラウドサーバが署名の検証を行うことにより、シェアが通信途中で改ざんされていないこと、及び、データ保有者によって送信されたシェアであることをクラウドサーバが確認できる。推論の場合も同様、第2従来技術では、シェアにデータ利用者の署名を付加し、クラウドサーバが署名の検証を行うことにより、シェアが通信途中で改ざんされていないこと、及び、データ利用者によって送信されたシェアであることをクラウドサーバが確認できる。さらに、第2従来技術では、各クラウドサーバが推論結果のシェアをデータ利用者に送信する際も、シェアにクラウドサーバの署名を付加し、データ利用者が署名の検証を行う。これにより、第2従来技術では、シェアが通信途中で改ざんされていないこと、及び、クラウドサーバによって送信されたシェアであることをデータ利用者が確認できる。
【先行技術文献】
【非特許文献】
【0006】
S. Wagh, S. Tople, F. Benhamouda, E. Kushilevitz, P. Mittal, and T. Rabin “Falcon: Honest-Majority Maliciously Secure Framework for Private Deep Learning”, PETS 2021, pp. 188-208, 2021.
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかし、前記した第2従来技術では、以下で説明するような問題がある。すなわち、第2従来技術では、学習データを提供するデータ保有者、及び、推論結果を利用するデータ利用者が誰であるか、署名の検証によって署名検証者(クラウドサーバ)に知られてしまう。以後、データ保有者及びデータ利用者をユーザと記載する場合がある。このため、第2従来技術では、ユーザが学習データを提供していることや推論サービスを利用していることすらも隠したい、というプライバシー保護の強い要請には対応が困難である。
【0008】
そこで、本発明は、ユーザの匿名性を保証し、プライバシーを保護できる機械学習システムを提供することを課題とする。
【課題を解決するための手段】
【0009】
前記課題を解決するため、本発明に係る機械学習システムは、学習データを管理する学習データ管理装置と、推論データを管理する推論データ管理装置と、マルチパーティ計算により学習及び推論を行う複数の学習推論装置と、を備える構成とした。
【0010】
学習データ管理装置は、リング署名方式の鍵生成アルゴリズムにより、学習データ管理装置の第1公開鍵及び第1秘密鍵を生成する鍵生成部と、学習データを学習推論装置毎の第1シェアに秘密分散する秘密分散部と、第1公開鍵と他の学習データ管理装置又は推論データ管理装置の公開鍵とが含まれる第1公開鍵リストを生成し、第1秘密鍵及び第1公開鍵リストを用いたリング署名方式の署名生成アルゴリズムにより第1シェアから署名を生成し、生成した署名を第1シェアに付加する匿名署名生成部と、を備える。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許