TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025175965
公報種別公開特許公報(A)
公開日2025-12-03
出願番号2025079675
出願日2025-05-12
発明の名称データ処理方法及び装置、並びに記憶媒体
出願人富士通株式会社
代理人弁理士法人ITOH
主分類G06F 21/62 20130101AFI20251126BHJP(計算;計数)
要約【課題】大規模言語モデル(LLM)を利用したデータ処理方法及び装置並びに記憶媒体を提供する。
【解決手段】方法は、LLMに複数のデータカテゴリを入力して、データプライバシーを保護するために隠蔽される必要のある1つ又は複数の複数のデータ値を含むデータカテゴリを決定するように指示するステップと、隠蔽される必要のある1つ又は複数のデータカテゴリのうちの各データカテゴリについて、LLMにデータカテゴリを隠蔽するための基準を入力し、LLMが基準に従ってデータカテゴリを隠蔽するための複数の候補方法を提供するように指示するステップと、LLMが基準に従って複数の候補方法のうちの1つを隠蔽方法として選択するステップと、を含む。基準は、少なくとも、データカテゴリの隠蔽後のデータ値と元のデータ値とが、一対一で対応すること及びデータの意味及びデータの分布において一致することを含む。
【選択図】図2
特許請求の範囲【請求項1】
コンピュータが実行する、大規模言語モデルを使用してデータを処理する方法であって、
前記大規模言語モデルに複数のデータカテゴリを入力し、前記大規模言語モデルが前記複数のデータカテゴリから、データプライバシーを保護するために隠蔽される必要のある1つ又は複数のデータカテゴリを決定するように指示するステップであって、各データカテゴリは、複数のデータ値を含む、ステップと、
隠蔽される必要のある1つ又は複数のデータカテゴリのうちの各データカテゴリについて、
前記大規模言語モデルに前記データカテゴリを隠蔽するための基準を入力し、
前記大規模言語モデルが前記基準に従って前記データカテゴリを隠蔽するための複数の候補方法を提供するように指示し、
前記大規模言語モデルが前記基準に従って前記複数の候補方法のうちの1つを隠蔽方法として選択するステップと、を含み、
前記基準は、少なくとも、
前記データカテゴリの隠蔽後のデータ値と元のデータ値とが一対一で対応すること、及び、
前記データカテゴリの隠蔽後のデータ値と元のデータ値とがデータの意味及びデータの分布において一致することを含む、方法。
続きを表示(約 2,200 文字)【請求項2】
前記隠蔽される必要のある1つ又は複数のデータカテゴリのうちの1つのデータカテゴリのデータ値をユーザから受信した場合、前記データカテゴリについての隠蔽方法に従って前記データカテゴリのデータ値を隠蔽するステップと、
前記大規模言語モデルに隠蔽後のデータ値を入力し、前記大規模言語モデルが前記隠蔽後のデータ値を処理するように指示するステップと、
前記大規模言語モデルによる処理結果を取得し、復元方法に従って、前記処理結果に含まれる隠蔽後のデータ値を元のデータ値に復元するステップと、をさらに含む、請求項1に記載の方法。
【請求項3】
前記隠蔽方法は、元のデータ値から隠蔽後のデータ値へのマッピングを確立し、
前記復元方法は、前記マッピングの逆マッピングに基づくものである、請求項2に記載の方法。
【請求項4】
前記複数のデータカテゴリは、特定分野に関連するデータカテゴリであり、
前記大規模言語モデルが前記特定分野の専門家として、前記複数のデータカテゴリから、隠蔽される必要のある1つ又は複数のデータカテゴリを決定するように指示するステップ、をさらに含む、請求項1に記載の方法。
【請求項5】
前記大規模言語モデルが前記隠蔽方法に従って隠蔽プログラムを生成するように指示するステップ、又は、
手動で前記隠蔽方法に従って隠蔽プログラムを作成するように指示するステップ、をさらに含む、請求項1に記載の方法。
【請求項6】
前記大規模言語モデルが規則に従って前記複数の候補方法を提供して前記隠蔽方法を選択するように指示するステップ、をさらに含み、
前記規則は、
前記データカテゴリの隠蔽後のデータ値と元のデータ値とがデータ型において一致することであって、前記データ型は、数字、アルファベット、記号、文字列、日付及び時間、又はこれらのうちの2つ以上の組み合わせを含む、こと、
前記データカテゴリの隠蔽後のデータ値が元のデータ値から固定値だけ逸脱していること、及び、
前記データカテゴリの元のデータ値が複数のグループに分けられ、各グループにおいて、隠蔽後のデータ値と元のデータ値とが一対一で対応することのうちの1つ又は複数を含む、請求項1に記載の方法。
【請求項7】
(a)サンプルデータ値について前記隠蔽プログラムを実行して、隠蔽後のサンプルデータ値を生成するステップと、
(b)前記隠蔽後のサンプルデータ値に基づいて元のサンプルデータ値を復元するステップと、
(c)復元されたサンプルデータ値と元のサンプルデータ値とが同一であるか否かを決定するステップと、
(d)復元されたサンプルデータ値と元のサンプルデータ値とが異なる場合、前記隠蔽プログラムが利用不可能であると決定し、前記隠蔽方法に従って隠蔽プログラムを再度生成するステップと、をさらに含み、
ステップ(a)乃至ステップ(d)を繰り返し実行する、請求項5に記載の方法。
【請求項8】
ステップ(c)において、復元されたサンプルデータ値と元のサンプルデータ値とが同一であると決定した場合、前記隠蔽プログラムが利用可能であると決定し、前記方法を終了し、
ステップ(a)乃至ステップ(d)を所定回数だけ繰り返し実行した場合、前記方法を終了する、請求項7に記載の方法。
【請求項9】
大規模言語モデルと通信する、データを処理する装置であって、
プログラムが記憶されたメモリと、
1つ又は複数のプロセッサと、を含み、
前記プロセッサは、前記プログラムを実行することで、
前記大規模言語モデルに複数のデータカテゴリを入力し、前記大規模言語モデルが前記複数のデータカテゴリから、データプライバシーを保護するために隠蔽される必要のある1つ又は複数のデータカテゴリを決定するように指示するステップであって、各データカテゴリは、複数のデータ値を含む、ステップと、
隠蔽される必要のある1つ又は複数のデータカテゴリのうちの各データカテゴリについて、
前記大規模言語モデルに前記データカテゴリを隠蔽するための基準を入力し、
前記大規模言語モデルが前記基準に従って前記データカテゴリを隠蔽するための複数の候補方法を提供するように指示し、
前記大規模言語モデルが前記基準に従って前記複数の候補方法のうちの1つを隠蔽方法として選択するステップと、を含む方法を実行するように構成され、
前記基準は、少なくとも、
前記データカテゴリの隠蔽後のデータ値と元のデータ値とが一対一で対応すること、及び、
前記データカテゴリの隠蔽後のデータ値と元のデータ値とがデータの意味及びデータの分布において一致することを含む、装置。
【請求項10】
プログラムが記憶された非一時的なコンピュータ読み取り可能な記憶媒体であって、前記プログラムがコンピュータにより実行される際に、前記コンピュータに請求項1乃至8の何れかに記載のデータを処理する方法を実行させる、記憶媒体。

発明の詳細な説明【技術分野】
【0001】
本開示は、一般的に、情報サービスの分野に関し、具体的には、大規模言語モデルを使用してデータを処理する方法及び装置、並びに関連プログラムが記憶された記憶媒体に関する。
続きを表示(約 2,700 文字)【背景技術】
【0002】
人工知能技術の発展に伴い、特にGPTやClaudeに代表される大規模言語モデル(LLM)の出現により、機器の理解能力は一般的な人間のレベルに達し、ある面では人間のレベルを超えている。LLMは、強力な能力により、データの解析や理解力の生成において大きな潜在力を持っている。LLMを用いてデータを解析し、例えばデータの法則や傾向を分析し、データを可視化するためのグラフを描画し、データを処理するためのプログラムコードを自動的に生成することなどが望ましい。
【0003】
現在、強力な能力を持つLLMは、主にクラウドサービスに基づくAPIによりユーザに提供されているが、ローカルで展開可能なオープンソースのモデルは、パフォーマンスが低く、ユーザのニーズを満たすことが難しい場合が多い。そのため、ユーザは、通常、LLMサービスを提供する商用企業にデータを処理させるために送信する必要がある。しかし、このようなデータ伝送は、データプライバシーの問題を引き起す。ビジネス環境では、データには、例えば顧客情報、製品情報、取引記録などの機密性の高いビジネス情報や個人情報が含まれる場合が多い。データを処理するために第三者企業に送信すると、データの漏洩や悪用のリスクが高まる可能性がある。このようなリスクにより、ユーザは重要なデータをLLMに送信して処理することを望まなくなり、ユーザによるLLMサービスの使用を制限し、人工知能技術の更なる応用を妨げる。
【0004】
上述したように、既存のLLMサービスは、データ解析能力とデータプライバシーの保護との間の矛盾に直面している。ユーザのデータプライバシーを保護する前提で、どのようにLLMの能力を十分に利用してデータ分析を行うかは、現在早急に解決すべき問題である。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、ユーザのデータプライバシーを保護しながら、LLMを利用して効率的で正確なデータ処理と分析を行うことによって、ユーザにより安全で信頼性の高い人工知能サービスを提供することができる、LLMを利用してデータを処理する方法を提案することを目的とする。
【課題を解決するための手段】
【0006】
本開示の1つの態様では、コンピュータが実行する、大規模言語モデルを使用してデータを処理する方法であって、前記大規模言語モデルに複数のデータカテゴリを入力し、前記大規模言語モデルが前記複数のデータカテゴリから、データプライバシーを保護するために隠蔽される必要のある1つ又は複数のデータカテゴリを決定するように指示するステップであって、各データカテゴリは、複数のデータ値を含む、ステップと、隠蔽される必要のある1つ又は複数のデータカテゴリのうちの各データカテゴリについて、前記大規模言語モデルに前記データカテゴリを隠蔽するための基準を入力し、前記大規模言語モデルが前記基準に従って前記データカテゴリを隠蔽するための複数の候補方法を提供するように指示し、前記大規模言語モデルが前記基準に従って前記複数の候補方法のうちの1つを隠蔽方法として選択するステップと、を含み、前記基準は、少なくとも、前記データカテゴリの隠蔽後のデータ値と元のデータ値とが一対一で対応すること、及び、前記データカテゴリの隠蔽後のデータ値と元のデータ値とがデータの意味及びデータの分布において一致することを含む、方法を提供する。
【0007】
本開示のもう1つの態様では、大規模言語モデルと通信する、データを処理する装置であって、プログラムが記憶されたメモリと、1つ又は複数のプロセッサと、を含み、前記プロセッサは、前記プログラムを実行することで、前記大規模言語モデルに複数のデータカテゴリを入力し、前記大規模言語モデルが前記複数のデータカテゴリから、データプライバシーを保護するために隠蔽される必要のある1つ又は複数のデータカテゴリを決定するように指示するステップであって、各データカテゴリは、複数のデータ値を含む、ステップと、隠蔽される必要のある1つ又は複数のデータカテゴリのうちの各データカテゴリについて、前記大規模言語モデルに前記データカテゴリを隠蔽するための基準を入力し、前記大規模言語モデルが前記基準に従って前記データカテゴリを隠蔽するための複数の候補方法を提供するように指示し、前記大規模言語モデルが前記基準に従って前記複数の候補方法のうちの1つを隠蔽方法として選択するステップと、を含む方法を実行するように構成され、前記基準は、少なくとも、前記データカテゴリの隠蔽後のデータ値と元のデータ値とが一対一で対応すること、及び、前記データカテゴリの隠蔽後のデータ値と元のデータ値とがデータの意味及びデータの分布において一致することを含む、装置を提供する。
【0008】
本開示のもう1つの態様では、プログラムが記憶された非一時的なコンピュータ読み取り可能な記憶媒体であって、前記プログラムがコンピュータにより実行される際に、前記コンピュータに上記のデータを処理する方法を実行させる、記憶媒体を提供する。
【図面の簡単な説明】
【0009】
本開示に係る隠蔽方法を決定するための装置を概略的に示すブロック図である。
本開示に係る隠蔽方法を決定するための処理のフローチャートである。
本開示に係るLLMを用いてデータを処理する装置を概略的に示すブロック図である。
本開示に係るLLMを用いてデータを処理する処理のフローチャートである。
本開示に係る隠蔽プログラムを自動的に検証するための処理のフローチャートである。
本開示を実現可能なコンピュータのハードウェアの例示的な構成を示すブロック図である。
【発明を実施するための形態】
【0010】
ユーザがデータのプライバシーを保護しながら、LLMを利用してデータ処理を行うことを可能にするために、本開示において、まず、ユーザが処理しようとする元のデータを隠蔽し、隠蔽後のデータをLLMに提供して処理を行い、その後、隠蔽方法の逆操作を行って、LLMから提供された処理結果から元のデータを復元することによって、元のデータに対する処理結果を取得することを提案する。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

富士通株式会社
半導体装置
1か月前
富士通株式会社
メッシュ微細化
1か月前
富士通株式会社
画像処理モデル
1か月前
富士通株式会社
半導体デバイス
1か月前
富士通株式会社
演算器及び演算方法
1か月前
富士通株式会社
ダウンサンプリング
7日前
富士通株式会社
ポイントクラウド分類
1か月前
富士通株式会社
OLT及びPONシステム
27日前
富士通株式会社
光受信装置及び光受信方法
7日前
富士通株式会社
電子機器筐体及び電子機器
1か月前
富士通株式会社
アレイアンテナモジュール
1か月前
富士通株式会社
光送信器及び光トランシーバ
1か月前
富士通株式会社
基板及びこれを備えた電子装置
1か月前
富士通株式会社
プログラム及びデータ処理装置
21日前
富士通株式会社
演算処理装置及び情報処理装置
1か月前
富士通株式会社
情報処理装置及び情報処理方法
13日前
富士通株式会社
テキスト案内される画像エディタ
1か月前
富士通株式会社
情報処理装置および情報処理方法
7日前
富士通株式会社
波長変換装置および波長変換方法
1か月前
富士通株式会社
ラックマウント装置及びラック装置
1か月前
富士通株式会社
メモリ管理装置及びメモリ管理方法
1か月前
富士通株式会社
書き込みアシスト回路及びSRAM
5日前
富士通株式会社
不正検知プログラム、方法、及び装置
13日前
富士通株式会社
受光デバイス及び受光デバイスの製造方法
26日前
富士通株式会社
通知プログラム、通知方法および通知装置
26日前
富士通株式会社
推定システム、情報処理装置及び推定方法
今日
富士通株式会社
データ処理方法及び装置、並びに記憶媒体
今日
富士通株式会社
コンパイルプログラムおよびコンパイル方法
21日前
富士通株式会社
生成プログラム、生成方法および情報処理装置
1か月前
富士通株式会社
検出プログラム、検出方法および情報処理装置
1か月前
富士通株式会社
半導体装置、半導体装置の製造方法及び電子装置
19日前
富士通株式会社
キャッシュ装置およびキャッシュ装置の制御方法
1か月前
富士通株式会社
プログラム、データ処理装置及びデータ処理方法
1か月前
富士通株式会社
出張情報受付方法および出張情報受付プログラム
1か月前
富士通株式会社
探索プログラム、探索方法、および情報処理装置
1か月前
富士通株式会社
生成プログラム、生成方法、および情報処理装置
5日前
続きを見る