TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024155607
公報種別公開特許公報(A)
公開日2024-10-31
出願番号2023070464
出願日2023-04-21
発明の名称機械学習プログラム、方法、及び装置
出願人富士通株式会社
代理人弁理士法人太陽国際特許事務所
主分類G06N 5/045 20230101AFI20241024BHJP(計算;計数)
要約【課題】本質的に必要なルールで公平なルールモデルを生成する。
【解決手段】第1の属性の条件を含まない第1のルールについて、第1のルールの条件を満たすデータにおける、第2の属性を含む第1のルールの条件を満たすデータの第1の割合である公平性スコアと、第1の属性の条件を含む第2のルールについて、第1の属性を含む第2のルールの条件を満たすデータにおける、第1の属性及び第2の属性を含む第2のルールの条件を満たすデータの第2の割合である公平性スコアとに基づいて、第1及び第2のルールから除外対象を判定し、複数のルールのうち、除外対象のルール以外のルールを含む機械学習モデルを生成する。
【選択図】図8
特許請求の範囲【請求項1】
複数のデータの複数の属性を目的変数に対する説明変数とした、前記複数の属性のうち一又は複数の属性を含む複数のルールを生成し、
前記複数のルールのうち第1の属性の条件を含まない第1のルールについて、前記複数のデータのうち前記第1のルールの条件を満たすデータにおける、前記複数のデータのうち第2の属性の条件を含む前記第1のルールの条件を満たすデータの第1の割合に基づいて、前記第1のルールを除外対象とするか否かを判定する第1の判定を実行し、
前記複数のルールのうち前記第1の属性の条件を含む第2のルールについて、前記複数のデータのうち前記第1の属性の条件を含む前記第2のルールの条件を満たすデータにおける、前記複数のデータのうち前記第1の属性の条件及び前記第2の属性の条件を含む前記第2のルールの条件を満たすデータの第2の割合に基づいて、前記第2のルールを除外対象とするか否かを判定する第2の判定を実行し、
前記第1の判定と前記第2の判定との結果に基づいて、前記複数のルールのうち除外対象のルール以外のルールを含む機械学習モデルを生成する、
処理をコンピュータに実行させることを特徴とする機械学習プログラム。
続きを表示(約 1,600 文字)【請求項2】
前記複数のルールを生成する処理は、前記第2の属性の条件を含むルールを生成しないことを含む、
ことを特徴とする請求項1に記載の機械学習プログラム。
【請求項3】
前記第1の判定と前記第2の判定との結果を提示して、前記第2の属性に追加する属性の指定を受け付け、
前記複数のルールの生成、前記第1の判定、及び前記第2の判定を複数回繰り返して、前記機械学習モデルを生成する処理を実行する、
ことを特徴とする請求項2に記載の機械学習プログラム。
【請求項4】
前記第1の属性が複数存在する場合、
前記第1の判定は、複数の前記第1の属性の各々についての前記第1の割合の最小値に基づいて実行され、
前記第2の判定は、複数の前記第1の属性の各々についての前記第2の割合の最小値に基づいて実行さる、
ことを特徴とする請求項1又は請求項2に記載の機械学習プログラム。
【請求項5】
前記複数のルールを生成する処理は、機械学習モデルに含めるルールとして最適化された複数のルールを生成する、
ことを特徴とする請求項1~請求項3のいずれか1項に記載の機械学習プログラム。
【請求項6】
複数のデータの複数の属性を目的変数に対する説明変数とした、前記複数の属性のうち一又は複数の属性を含む複数のルールを生成し、
前記複数のルールのうち第1の属性の条件を含まない第1のルールについて、前記複数のデータのうち前記第1のルールの条件を満たすデータにおける、前記複数のデータのうち第2の属性の条件を含む前記第1のルールの条件を満たすデータの第1の割合に基づいて、前記第1のルールを除外対象とするか否かを判定する第1の判定を実行し、
前記複数のルールのうち前記第1の属性の条件を含む第2のルールについて、前記複数のデータのうち前記第1の属性の条件を含む前記第2のルールの条件を満たすデータにおける、前記複数のデータのうち前記第1の属性の条件及び前記第2の属性の条件を含む前記第2のルールの条件を満たすデータの第2の割合に基づいて、前記第2のルールを除外対象とするか否かを判定する第2の判定を実行し、
前記第1の判定と前記第2の判定との結果に基づいて、前記複数のルールのうち除外対象のルール以外のルールを含む機械学習モデルを生成する、
処理をコンピュータが実行することを特徴とする機械学習方法。
【請求項7】
複数のデータの複数の属性を目的変数に対する説明変数とした、前記複数の属性のうち一又は複数の属性を含む複数のルールを生成し、
前記複数のルールのうち第1の属性の条件を含まない第1のルールについて、前記複数のデータのうち前記第1のルールの条件を満たすデータにおける、前記複数のデータのうち第2の属性の条件を含む前記第1のルールの条件を満たすデータの第1の割合に基づいて、前記第1のルールを除外対象とするか否かを判定する第1の判定を実行し、
前記複数のルールのうち前記第1の属性の条件を含む第2のルールについて、前記複数のデータのうち前記第1の属性の条件を含む前記第2のルールの条件を満たすデータにおける、前記複数のデータのうち前記第1の属性の条件及び前記第2の属性の条件を含む前記第2のルールの条件を満たすデータの第2の割合に基づいて、前記第2のルールを除外対象とするか否かを判定する第2の判定を実行し、
前記第1の判定と前記第2の判定との結果に基づいて、前記複数のルールのうち除外対象のルール以外のルールを含む機械学習モデルを生成する、
処理を実行する制御部、
を含むことを特徴とする機械学習装置。

発明の詳細な説明【技術分野】
【0001】
開示の技術は、機械学習プログラム、機械学習方法、及び機械学習装置に関する。
続きを表示(約 2,800 文字)【背景技術】
【0002】
機械学習モデルを用いたシステムの普及に伴い、倫理的な公平性を考慮したシステムの設計が重要視されるようになってきている。例えば、機械学習モデルを用いたシステムで人材採用の採否を判定する場合、応募者の性別が判定に影響しないように設計する場合等がある。このような公平性に配慮したシステムを構築するためには、機械学習モデルが不当な差別を引き起こさないように、機械学習モデルから不公平なバイアスを排除する必要がある。
【0003】
また、機械学習モデルを用いたシステムの透過性も求められており、処理ロジックの説明性があり、かつ処理結果が公平になるような機械学習モデルを構築することが行われている。説明性のある機械学習モデルとして、ルールモデルがある。ルールモデルは、条件Pに該当するサンプルの目的変数値はQと推定されることを表す「PならばQ」の形式を持つ複数のルールで構成された、説明可能な機械学習モデルである。例えば、実世界のデータセットで訓練されたブラックボックスモデルをルールモデルによる2クラス分類に焦点を当てて評価し、ブラックボックスモデルの説明のために代理のホワイトボックスモデルを提示する方法が提案されている。
【0004】
また、公平なルールのマイニング技術として、特定の条件及び文脈が成立する場合に、不公平なルールを、性別、人種等の保護属性及び保護属性以外の特定の属性を含む条件と目的変数との相関情報に基づいて検出する技術が提案されている。例えば、ローンの可否を判定する機械学習モデルを構成するルールについて、ある特定の居住地に限定した場合に、特定の人種のユーザが不利な判定となるような不公平なルールが検出し、検出したルールを除外する技術が提案されている。
【0005】
また、機械学習モデルを用いたタスクの目的に合わせた公平な説明性を実現するための技術も提案されている。例えば、目的に応じて事前に専門家により定義した因果構造モデルによる知識情報を基に公平性を実現する方法が提案されている。この方法では、例えば、体力を要する人材採用の採否を判定するためのルールを生成する場合、保護属性である性別Aによって採否Yを判定することは差別であるとする一方で、性別Aと関連する体力Mによって採否を判定することは差別ではないとする。この方法は、このような属性間の関係(上記の例では、A⇒M⇒Y)を現した知識体系を事前に定義しておく。
【先行技術文献】
【非特許文献】
【0006】
Ulrich A▲i▼vodji, Hiromi Arai, Olivier Fortineau, S▲e▼bastien Gambs, Satoshi Hara, Alain Tapp, "Fairwashing: the risk of rationalization," ICML 2019, arXiv:1901.09749v3 [cs.LG] 15 May 2019.
Dino Pedreschi, Salvatore Ruggieri, Franco Turini, "Discrimination-aware Data Mining," Proc. 14th ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining, pp.560-568, 24 August 2008.
Yoichi Chikahara, Shinsaku Sakaue, Akinori Fujino, Hisashi Kashima, "Learning Individually Fair Classifier with Path-Specific Causal-Effect Constraint," in Proc. the 24th International Conference on Artificial Intelligence and Statistics, PMLR 130:145-153, 2021.
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかし、ブラックボックスモデルの説明のために代理のホワイトボックスモデルを提示する方法では、公平性の偽装が起こり得るという問題がある。また、従来の相関情報を用いたルールマイニングの技術に基づいて不公平な説明になり得るルールを全て排除した場合、本質的に必要なルールも排除してしまい、結果としてルールモデルの判定精度が劣化する場合があるという問題がある。例えば、体力という属性が保護属性である性別によって偏りがあるという理由で、体力という属性を含むルールを排除した場合、体力を要する人材採用の採否を判定するルールモデルの判定精度が劣化する。また、目的に応じて偏りのあるルールを選択する場合、事前に専門家等による知識体系を構築する必要があるため、ルールモデル生成のために多大な作業コストを要する。
【0008】
一つの側面として、開示の技術は、本質的に必要なルールで公平なルールモデルを生成することを目的とする。
【課題を解決するための手段】
【0009】
一つの態様として、開示の技術は、複数のデータの複数の属性を目的変数に対する説明変数とした、複数の属性のうち一又は複数の属性を含む複数のルールを生成する。また、開示の技術は、複数のルールのうち第1の属性の条件を含まない第1のルールについての第1の割合に基づいて、第1のルールを除外対象とするか否かを判定する第1の判定を実行する。第1の割合は、複数のデータのうち第1のルールの条件を満たすデータにおける、複数のデータのうち第2の属性の条件を含む第1のルールの条件を満たすデータの割合である。また、開示の技術は、複数のルールのうち第1の属性の条件を含む第2のルールについての第2の割合に基づいて、第2のルールを除外対象とするか否かを判定する第2の判定を実行する。第2の割合は、複数のデータのうち第1の属性の条件を含む第2のルールの条件を満たすデータにおける、複数のデータのうち第1の属性の条件及び第2の属性の条件を含む第2のルールの条件を満たすデータの割合である。そして、開示の技術は、第1の判定と第2の判定との結果に基づいて、複数のルールのうち除外対象のルール以外のルールを含む機械学習モデルを生成する。
【発明の効果】
【0010】
一つの側面として、本質的に必要なルールで公平なルールモデルを生成することができる、という効果を有する。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

富士通株式会社
プロセッサパッケージ
23日前
富士通株式会社
光伝送装置及び光伝送方法
2日前
富士通株式会社
プロセッサ及び情報処理装置
16日前
富士通株式会社
変換プログラムおよび変換方法
1か月前
富士通株式会社
故障監視装置および故障監視方法
9日前
富士通株式会社
歩容認識装置、方法及び電子機器
1か月前
富士通株式会社
光伝送装置および光伝送システム
9日前
富士通株式会社
エラー訂正装置及びエラー訂正方法
3日前
富士通株式会社
光送受信機制御方法および光送受信機
8日前
富士通株式会社
ラマン増幅装置およびラマン増幅方法
2日前
富士通株式会社
OD決定方法およびOD決定プログラム
8日前
富士通株式会社
情報処理方法および情報処理プログラム
2日前
富士通株式会社
マルチチャネルパワープロファイル推定
29日前
富士通株式会社
収入特定方法および収入特定プログラム
15日前
富士通株式会社
評価プログラム、評価装置及び評価システム
23日前
富士通株式会社
自己教師あり学習プログラム、方法、及び装置
9日前
富士通株式会社
自己教師あり学習プログラム、方法、及び装置
9日前
富士通株式会社
位置情報処理装置およびサービス提供システム
16日前
富士通株式会社
情報処理システム、情報処理方法及びプログラム
17日前
富士通株式会社
タスク割り当て方法、タスク割り当てプログラム
16日前
富士通株式会社
プログラム、データ処理装置及びデータ処理方法
10日前
富士通株式会社
データ処理装置、プログラム及びデータ処理方法
10日前
富士通株式会社
コンパイラプログラム、判定方法および情報処理装置
16日前
富士通株式会社
機械学習プログラム、機械学習方法および情報処理装置
3日前
富士通株式会社
情報処理装置、情報処理方法および情報処理プログラム
1か月前
富士通株式会社
パケット処理装置、パケット処理方法およびプログラム
2日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
9日前
富士通株式会社
機械学習方法、機械学習プログラムおよび情報処理装置
2日前
富士通株式会社
通信システム、及び光モジュールのパラメータ最適化方法
16日前
富士通株式会社
情報処理装置、情報処理方法、および情報処理プログラム
23日前
富士通株式会社
機械学習プログラム、機械学習装置及び機械学習システム
23日前
富士通株式会社
ログ管理装置、ログ管理方法、およびログ管理プログラム
9日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
1か月前
富士通株式会社
強化学習プログラム、強化学習方法、および情報処理装置
16日前
富士通株式会社
グラフ分析アルゴリズムによるグラフの説明可能性の向上
9日前
富士通株式会社
情報検証プログラム、情報処理装置および情報処理システム
9日前
続きを見る