TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025039427
公報種別
公開特許公報(A)
公開日
2025-03-21
出願番号
2023146516
出願日
2023-09-08
発明の名称
情報処理プログラム、方法、及び装置
出願人
富士通株式会社
代理人
弁理士法人太陽国際特許事務所
主分類
G06N
5/045 20230101AFI20250313BHJP(計算;計数)
要約
【課題】機械学習モデルの推定に対して、説得性及び信頼性の高い推定根拠を多観点から説明する。
【解決手段】情報処理装置は、複数の特徴量を含む複数の学習サンプルから、機械学習モデルの推定に対する寄与度が第1閾値以上の1以上の特徴量の組み合わせのパターンであり、複数の学習サンプルにおける出現頻度に応じた指標が第2閾値以上の複数の高頻度パターンの各々に対応する部分データを、推定対象データから抽出し、抽出した部分データを、対応する部分モデルに入力した場合の、高頻度パターン毎の部分モデルの推定結果の尤度を算出し、尤度に基づいて選択した部分データを、推定対象データに対する機械学習モデルの推定根拠として出力する。
【選択図】図14
特許請求の範囲
【請求項1】
複数の特徴量を含む複数の学習サンプルから、機械学習モデルの推定に対する寄与度が第1閾値以上の1以上の特徴量の組み合わせのパターンであり、前記複数の学習サンプルにおける出現頻度に応じた指標が第2閾値以上の複数のパターンを特定し、特定した前記複数のパターンの各々に対応する部分データを、前記機械学習モデルを用いた推定処理の対象となる、複数の特徴量を含む推定対象データから抽出し、
前記推定対象データから抽出した前記部分データを、前記パターン毎に訓練された部分モデルのうちの対応する前記部分モデルに入力した場合の前記パターン毎の部分モデルの推定結果の尤度を算出し、
前記パターン毎の部分モデルの各々について算出した前記尤度に基づいて選択した前記部分データを、前記推定対象データに対する前記機械学習モデルの推定根拠として出力する、
ことを含む処理をコンピュータに実行させるための情報処理プログラム。
続きを表示(約 1,500 文字)
【請求項2】
前記複数の学習サンプルの各々から、前記複数のパターンの各々に対応する部分データを抽出した部分学習サンプルを用いて、前記パターン毎の部分モデルを訓練することをさらに含む処理を前記コンピュータに実行させるための請求項1に記載の情報処理プログラム。
【請求項3】
前記部分モデルを訓練することは、前記複数の学習サンプルの各々から、前記部分モデルの訓練に用いた前記部分データを除いた複数の新たな学習サンプルを用いて訓練された新たな機械学習モデルの推定結果の精度が第3閾値未満となるまで、前記複数の新たな学習サンプルから新たなパターンに対応する部分データを抽出して、前記新たなパターンに対応する部分モデルを訓練することを含む請求項2に記載の情報処理プログラム。
【請求項4】
前記尤度に基づいて前記部分データを選択することは、前記尤度が第4閾値以上である前記部分モデルに入力した前記部分データを選択することを含む請求項1~請求項3のいずれか1項に記載の情報処理プログラム。
【請求項5】
前記推定根拠を出力することは、前記尤度に基づいて選択した複数の前記部分データを集約して出力することを含む請求項1~請求項3のいずれか1項に記載の情報処理プログラム。
【請求項6】
前記学習サンプル及び前記推定対象データは、複数のノード及びノード間を接続するエッジで前記複数の特徴量を表したグラフデータであり、前記部分データは、前記学習サンプル又は前記推定対象データを示すグラフデータの部分グラフであり、前記機械学習モデル及び前記部分モデルは、グラフデータを扱うことが可能な機械学習モデルである請求項1~請求項3のいずれか1項に記載の情報処理プログラム。
【請求項7】
複数の特徴量を含む複数の学習サンプルから、機械学習モデルの推定に対する寄与度が第1閾値以上の1以上の特徴量の組み合わせのパターンであり、前記複数の学習サンプルにおける出現頻度に応じた指標が第2閾値以上の複数のパターンを特定し、特定した前記複数のパターンの各々に対応する部分データを、前記機械学習モデルを用いた推定処理の対象となる、複数の特徴量を含む推定対象データから抽出し、
前記推定対象データから抽出した前記部分データを、前記パターン毎に訓練された部分モデルのうちの対応する前記部分モデルに入力した場合の前記パターン毎の部分モデルの推定結果の尤度を算出し、
前記パターン毎の部分モデルの各々について算出した前記尤度に基づいて選択した前記部分データを、前記推定対象データに対する前記機械学習モデルの推定根拠として出力する、
ことを含む処理をコンピュータが実行する情報処理方法。
【請求項8】
複数の特徴量を含む複数の学習サンプルから、機械学習モデルの推定に対する寄与度が第1閾値以上の1以上の特徴量の組み合わせのパターンであり、前記複数の学習サンプルにおける出現頻度に応じた指標が第2閾値以上の複数のパターンを特定し、特定した前記複数のパターンの各々に対応する部分データを、前記機械学習モデルを用いた推定処理の対象となる、複数の特徴量を含む推定対象データから抽出する抽出部と、
前記推定対象データから抽出した前記部分データを、前記パターン毎に訓練された部分モデルのうちの対応する前記部分モデルに入力した場合の前記パターン毎の部分モデルの推定結果の尤度を算出する推定部と、
前記パターン毎の部分モデルの各々について算出した前記尤度に基づいて選択した前記部分データを、前記推定対象データに対する前記機械学習モデルの推定根拠として出力する説明部と、
を含む情報処理装置。
発明の詳細な説明
【技術分野】
【0001】
開示の技術は、情報処理プログラム、情報処理方法、及び情報処理装置に関する。
続きを表示(約 2,300 文字)
【背景技術】
【0002】
近年、医療、金融等の様々な分野で、AI(Artificial Intelligence)による推定を用いた各種システムの導入が盛んである。AIによる推定は、分類と呼ばれる場合もある。このようにAIによる推定を用いた技術が広まる中で、深層学習(Deep Learning)等のブラックボックス型のAIは、推定がどの様になされているのか推定根拠を理解することが難しいといった側面を有する。
【0003】
特定の領域では、単に推定結果にとどまらず、その推定がどの様になされているのかが重要となる場合がある。例えば、医療分野では、罹患した病気を推定し、その病名だけを提示するのではなく、その病気と判断された根拠を提示することが重要となる。より具体的な例としては、レントゲン写真のどこに着目してその推定を行ったかを明らかにすることで、医師や患者を納得させることができるといったことがある。このように、下された推定を納得させるには、その過程を含む推定根拠の共有が重要となる。
【0004】
従来、このようなAIが行った推定に対する推定根拠を明らかにする様々な手法が研究されている。例えば、機械学習モデルによる推定の根拠が理解し易い情報を出力する情報処理装置が提案されている。この情報処理装置は、機械学習モデルの推定結果に対する、ノード間の関係を示すグラフ構造に含まれる複数のノード間の関係のそれぞれに関する寄与度を取得する。また、情報処理装置は、グラフ構造のうち一又は複数のノードが属する第1のクラスを示す第1の構造と、第1のクラスに属し、関連する寄与度が閾値以上である第1のノードを示す第2の構造と、を接続したグラフを表示する。
【0005】
また、例えば、ラベル付きエッジタイプクラスの潜在的な説明として、サブグラフをランク付けするシステムが提案されている。このシステムは、それぞれがラベル付きエッジタイプを介してプロパティ値ノードに接続されたエンティティノードとして表されるラベル付きデジタル項目を表す第1のグラフを取得する。第1のグラフは、ラベル付けされたデジタル項目内の構造化された関係を表す第2のグラフと結合されて、結合グラフが得られる。また、このシステムは、ラベルのないデジタル項目を受信し、結合されたグラフ内のそれぞれのサブグラフと照合する。また、このシステムは、機械学習モデルを使用して、結合グラフを埋め込んでグラフベクトルを生成し、生成されたグラフベクトルに基づいて、一致するサブグラフとそれぞれのラベル付きエッジタイプとの間の表現力スコアを生成する。そして、このシステムは、一致したサブグラフを、表現力スコアに基づいてランク付けし、それぞれのラベル付きエッジタイプクラスの潜在的な説明としてランク付けしたサブグラフのセットを取得する。
【先行技術文献】
【特許文献】
【0006】
特開2022-111841号公報
米国特許第11442963号明細書
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、寄与度が閾値以上の特徴を推定根拠として提示する技術では、推定が可能となる一部分を捉えて説明することに留まり、説得性に乏しい場合がある。例えば、この技術では、猫の絵を猫であると推定した根拠の説明として、絵の中の特徴から、目及び耳だけが提示される場合がある。また、この技術では、手書き文字の画像からの数字の推定において、数字の5が推定された根拠の説明として、数字の5の特徴的な一部だけが提示される場合がある。すなわち、この技術では、特定の特徴で推定が可能な場合、他の特徴も説明の補足となり得る場合であっても、それらの他の特徴が推定根拠の説明として提示されない。
【0008】
また、ラベル付きエッジタイプクラスの潜在的な説明としてランク付けしたサブグラフのセットを取得する技術は、グラフ情報に補足情報を付与し、説明を高度化したのちランキングするものである。すなわち、この技術は、1つの観点で説明した元の情報を補足するためにグラフを結合するものであり、並列な新たな推定根拠を追加するのではない。
【0009】
一つの側面として、開示の技術は、機械学習モデルの推定に対して、説得性及び信頼性の高い推定根拠を多観点から説明することを目的とする。
【課題を解決するための手段】
【0010】
一つの態様として、開示の技術は、複数のパターンを特定し、特定した前記複数のパターンの各々に対応する部分データを、機械学習モデルを用いた推定処理の対象となる、複数の特徴量を含む推定対象データから抽出する。パターンは、複数の特徴量を含む複数の学習サンプルから、前記機械学習モデルの推定に対する寄与度が第1閾値以上の1以上の特徴量の組み合わせのパターンであり、前記複数の学習サンプルにおける出現頻度に応じた指標が第2閾値以上のパターンである。また、開示の技術は、前記推定対象データから抽出した前記部分データを、前記パターン毎に訓練された部分モデルのうちの対応する前記部分モデルに入力した場合の前記パターン毎の部分モデルの推定結果の尤度を算出する。そして、開示の技術は、前記パターン毎の部分モデルの各々について算出した前記尤度に基づいて選択した前記部分データを、前記推定対象データに対する前記機械学習モデルの推定根拠として出力する。
【発明の効果】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
富士通株式会社
冷却モジュール
2日前
富士通株式会社
情報処理装置、手続きプログラムおよび手続き方法
1日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
1日前
トヨタ自動車株式会社
作業評価装置
1日前
個人
公益寄付インタラクティブシステム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
ソフトバンクグループ株式会社
システム
1日前
続きを見る
他の特許を見る