TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025105407
公報種別
公開特許公報(A)
公開日
2025-07-10
出願番号
2024104746
出願日
2024-06-28
発明の名称
バイアスのための生成人工知能の検査
出願人
富士通株式会社
代理人
個人
,
個人
主分類
G06N
20/00 20190101AFI20250703BHJP(計算;計数)
要約
【課題】バイアスのための生成人工知能を検査するシステム及び方法を提供する。
【解決手段】方法は、トピック102及びトピックに関連する人工知能(AI)の役割104を取得するステップと、1次生成AIモデル110によって、トピック及びAIの役割に基づいて、質問プロンプト112を生成するステップと、1次生成AIモデルによって、質問プロンプトに対応するステートメントセット114として1つ以上のステートメントを生成するステップと、ステートメントに含まれるキータームをマスキングするステップと、2次生成AIモデル150によって、マスクされたステートメント145に対応するマスクされていないステートメント155を決定するステップと、マスクされていないステートメントをステートメントセットの対応するステートメントと比較することによって、2次生成AIモデルの性能を評価165するステップと、を含む。
【選択図】図1
特許請求の範囲
【請求項1】
トピック及び前記トピックに関連する人工知能(AI)の役割を取得するステップであって、前記トピックは研究分野に関連し、前記AIの役割は、前記トピック及び前記AIの役割が人間のユーザによって指定される前記研究分野における職業的役割を表す、ステップと、
第1生成AIモデルによって、前記トピック及び前記AIの役割に基づき質問プロンプトを生成するステップと、
前記第1生成AIモデルによって、前記質問プロンプトに対応するステートメントセットとして1つ以上のステートメントを生成するステップと、
マスクされたステートメントのセットを形成するために、前記ステートメントセットの前記ステートメントに含まれるキータームをマスクするステップであって、前記ステートメントセットの各ステートメントが各々のキータームを含み、特定のセットに含まれる各マスクされたステートメントが少なくとも1つのマスクされたキータームを含む、ステップと、
第2生成AIモデルによって、マスクされていないステートメントのセットを決定するステップであって、各々のマスクされていないステートメントは対応するマスクされたステートメントに基づく、ステップと、
前記マスクされていないステートメントのセットを前記ステートメントセットに含まれる各々のステートメントと比較することに基づいて、前記第2生成AIモデルの性能を評価するステップと、
を含む方法。
続きを表示(約 2,600 文字)
【請求項2】
前記第2生成AIモデルの性能の評価が、前記マスクされていないステートメントのセットを前記ステートメントセットに含まれる各々のステートメントと比較することに基づいて、前記第2生成AIモデルが不正確な結果を提供することを示すことに基づいて、前記第2生成AIモデルをトレーニングするために最初に使用された第1トレーニングデータセットとは異なる第2トレーニングデータセットを使用して、前記第2生成AIモデルを再トレーニング又は微調整するステップ、
を更に含む請求項1に記載の方法。
【請求項3】
前記ステートメントセットに含まれる前記ステートメントのうちの1つ以上のステートメントは、人間のユーザによって提供され、前記第1生成AIモデルによって生成され、前記人間のユーザによって提供される前記1つ以上のステートメントは、前記質問プロンプトに関する真のステートメント又は偽のステートメントである、請求項1に記載の方法。
【請求項4】
前記マスクされたステートメントのセットを形成するために、前記ステートメントセットの前記ステートメントに含まれるキータームをマスクするステップは、
前記ステートメントセットの自然言語処理に含まれる共通ワードを表す1つ以上のストップワードを識別するステップと、
前記ステートメントセットの各ステートメントから前記1つ以上のストップワードを除外するステップと、
前記1つ以上のストップワードを除外した後に各ステートメントに残っているワードに基づいて、各ステートメントに含まれる前記キータームを識別するステップと、
前記識別されたキータームの1つをマスクするステップと、
を含む、請求項1に記載の方法。
【請求項5】
前記第2生成AIモデルの性能を評価するステップは、前記第2生成AIモデルが、特定のステートメントに含まれる特定のマスクされたキータームを置き換えるために正しいマスクされたキータームを返す確率と、前記特定のステートメントに含まれるマスクされたキータームの総数とに基づいて評価スコアを計算するステップを含む、請求項1に記載の方法。
【請求項6】
前記第2生成AIモデルの性能を評価するステップは、評価スコアを計算するステップを含み、前記評価スコアは、特定のステートメントに含まれるマスクされたキータームの総数と、特定のマスクされたタームを置き換えるために使用される正しいマスクされていないキータームが前記第2生成AIモデルによって返される頻度の、前記特定のマスクされたタームを置き換えるために使用される誤ったマスクされていないキータームが、前記第2生成AIモデルによって返される頻度に対するランキングと、に基づく、請求項1に記載の方法。
【請求項7】
前記マスクされていないステートメントのセットを決定するステップは、前記第2生成AIモデル及び第3生成AIモデルによって実行され、
前記第2生成AIモデルの性能を評価するステップは、前記第3生成AIモデルの公平性と比較して、前記第2生成AIモデルの公平性を視覚的に表現するステップを含む、請求項1に記載の方法。
【請求項8】
命令を記憶するように構成された1つ以上の非一時的コンピュータ可読記憶媒体であって、前記命令は、実行されることに応答して、システムに動作を実行させ、前記動作は、
トピック及び前記トピックに関連する人工知能(AI)の役割を取得するステップであって、前記トピックは研究分野に関連し、前記AIの役割は、前記トピック及び前記AIの役割が人間のユーザによって指定される前記研究分野における職業的役割を表す、ステップと、
第1生成AIモデルによって、前記トピック及び前記AIの役割に基づき質問プロンプトを生成するステップと、
前記第1生成AIモデルによって、前記質問プロンプトに対応するステートメントセットとして1つ以上のステートメントを生成するステップと、
マスクされたステートメントのセットを形成するために、前記ステートメントセットの前記ステートメントに含まれるキータームをマスクするステップであって、前記ステートメントセットの各ステートメントが各々のキータームを含み、特定のセットに含まれる各マスクされたステートメントは少なくとも1つのマスクされたキータームを含む、ステップと、
第2生成AIモデルによって、マスクされていないステートメントのセットを決定するステップであって、各々のマスクされていないステートメントが対応するマスクされたステートメントに基づく、ステップと、
前記マスクされていないステートメントのセットを前記ステートメントセットに含まれる各々のステートメントと比較することに基づいて、前記第2生成AIモデルの性能を評価するステップと、
を含む、1つ以上の非一時的コンピュータ可読記憶媒体。
【請求項9】
前記動作は、
前記第2生成AIモデルの性能の評価が、前記マスクされていないステートメントのセットを前記ステートメントセットに含まれる各々のステートメントと比較することに基づいて、前記第2生成AIモデルが不正確な結果を提供することを示すことに基づいて、前記第2生成AIモデルをトレーニングするために最初に使用された第1トレーニングデータセットとは異なる第2トレーニングデータセットを使用して、前記第2生成AIモデルを再トレーニング又は微調整するステップ、
を更に含む、請求項8に記載の1つ以上の非一時的コンピュータ可読記憶媒体。
【請求項10】
前記ステートメントセットに含まれる前記ステートメントのうちの1つ以上のステートメントは、人間のユーザによって提供され、前記第1生成AIモデルによって生成され、前記人間のユーザによって提供される前記1つ以上のステートメントは、前記質問プロンプトに関する真のステートメント又は偽のステートメントである、請求項8に記載の1つ以上の非一時的コンピュータ可読記憶媒体。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本開示は、一般に、バイアスのための生成人工知能を検査するシステム及び方法に関する。
続きを表示(約 1,700 文字)
【背景技術】
【0002】
人工知能(Artificial intelligence (AI))は、様々な研究分野において、それらの研究分野における問題を解決するために使用される場合がある。AIは、そのような分析タスクを理解するように構成及びトレーニングされた後、従来人間によって行われてきた分析タスクを実行することができる。例えば、AIは、1つ以上のユーザの好み又は入力情報に基づいてコンテンツ推奨を行い、特定のルールセットに従って多面的で非二元的な決定を行い、芸術作品を合成又は作成し、又はその他の分析的又は創造的なタスクを行うために使用できる。AIモデルは、例えば、知識ベースを提供することによって、分析的又は創造的なタスクを実行するようにトレーニングされ得る。その知識ベースから、AIモデルは、その知識ベースの特徴を統計的に分析して、新しい入力に対する統計的に妥当な応答を導き出すことができる(すなわち機械学習モデル)。追加又は代替の例として、AIモデルは、新しい入力に対する特定の結論に到達するために、特定の論理的又は構造的プロセスに従って知識ベースを解析するようにAIモデルを構成することによってトレーニングされ得る(自然言語処理モデルなど)。
【0003】
本開示で請求される主題は、任意の欠点を解決する実施形態又は上述のような環境でのみ動作する実施形態に限定されない。むしろ、この背景技術は、本開示に記載の幾つかの実施形態が実施され得る一例である技術領域を説明するためにのみ提供される。
【発明の概要】
【0004】
一実施形態の一態様によると、方法は、トピック及びトピックに関連する人工知能(AI)の役割を取得するステップを含むことができ、トピックは研究分野に関連し、AIの役割は研究分野における職業的役割を表す。方法は、第1生成AIモデルによって、トピック及びAIの役割に基づいて、質問プロンプトを生成するステップを含むことができる。方法は、第1生成AIモデルによって、質問プロンプトに対応するステートメントセットとして1つ以上のステートメントを生成するステップと、各ステートメントが少なくとも1つの各々のキータームを含むステートメントに含まれるキータームをマスキングするステップとを含むことができる。方法は、第2生成AIモデルによって、マスクされたステートメントに対応するマスクされていないステートメントを決定するステップを含むことができる。方法は、マスクされていないステートメントをステートメントセットの対応するステートメントと比較することによって、第2生成AIモデルの性能を評価するステップを含むことができる。
【0005】
実施形態の目的及び利点は、請求項において特に指摘される要素、特徴、及び組み合わせにより少なくとも実現され達成される。理解されるべきことに、前述の一般的な説明及び以下の詳細な説明の両者は、例であり、請求される本発明の限定ではない。
【図面の簡単な説明】
【0006】
例示的な実施形態は、以下の添付の図面を通じて更なる特殊性及び詳細事項により記載され説明される。
【0007】
本開示の1つ以上の実施形態に従って、生成人工知能(AI)モデルの公平性又はバイアスを評価することができる例示的な動作環境の図である。
【0008】
本開示の1つ以上の実施形態に従って、生成AIモデルの公平性及びバイアスの評価に使用するための質問を生成する例示的なプロセスのフローチャートを示す。
【0009】
本開示の1つ以上の実施形態に従って、生成AIモデルの公平性及びバイアスの評価に使用するための真のステートメント及び偽のステートメントを生成する例示的なプロセスのフローチャートを示す。
【0010】
本開示の1つ以上の実施形態による、真のステートメント及び偽のステートメントの妥当性を評価する例示的なプロセスのフローチャートを示す。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
富士通株式会社
測定装置
1か月前
富士通株式会社
光伝送装置
1か月前
富士通株式会社
画像変換機器と方法
1か月前
富士通株式会社
量子デバイス上の誤り訂正
2か月前
富士通株式会社
光伝送装置および光伝送方法
1か月前
富士通株式会社
データセット特徴タイプ推論
22日前
富士通株式会社
信号相関量の確定装置と方法
22日前
富士通株式会社
マーキング方法及びプログラム
1日前
富士通株式会社
キャッシュメモリ搭載演算装置
2か月前
富士通株式会社
光受信装置及び光伝送システム
2か月前
富士通株式会社
制御プログラム、および制御方法
1か月前
富士通株式会社
光伝送装置および光伝送システム
23日前
富士通株式会社
伝送路監視装置及び伝送路監視方法
2か月前
富士通株式会社
双方向光リンクの異常モニタリング
25日前
富士通株式会社
バイアスのための生成人工知能の検査
15日前
富士通株式会社
情報処理プログラムおよび情報処理方法
22日前
富士通株式会社
人工知能ベースのサステナブル材料設計
2か月前
富士通株式会社
制御プログラム、制御方法及び決済装置
18日前
富士通株式会社
大規模言語モデルを使用したデータ調整
22日前
富士通株式会社
選択プログラム、選択装置、及び選択方法
25日前
富士通株式会社
管理装置、管理方法および管理プログラム
1か月前
富士通株式会社
通信管理装置および無線リソース予測方法
1か月前
富士通株式会社
量子デバイス及び量子デバイスの制御方法
1日前
富士通株式会社
圧縮プログラム、圧縮方法および圧縮装置
1か月前
富士通株式会社
広告画像を生成する方法、装置及び記憶媒体
29日前
富士通株式会社
赤外線センサ、及び赤外線センサの製造方法
1か月前
富士通株式会社
無線アクセスネットワークプロビジョニング
22日前
富士通株式会社
光送信機サブ信号光位相差の確定装置と方法
22日前
富士通株式会社
ホモグラフィの取得装置、方法及び電子機器
1か月前
富士通株式会社
推定プログラム、推定方法及び情報処理装置
2か月前
富士通株式会社
光伝送装置、光伝送方法、及び光伝送システム
2か月前
富士通株式会社
因果関係分析方法及び因果関係分析プログラム
1か月前
富士通株式会社
機械学習アプローチを用いたラマンポンプ設計
2か月前
富士通株式会社
プログラム、データ処理装置及びデータ処理方法
2か月前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
22日前
富士通株式会社
プログラム、データ処理方法およびデータ処理装置
2か月前
続きを見る
他の特許を見る