TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024067152
公報種別公開特許公報(A)
公開日2024-05-17
出願番号2022176995
出願日2022-11-04
発明の名称予測プログラム、情報処理装置および予測方法
出願人富士通株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06N 5/04 20230101AFI20240510BHJP(計算;計数)
要約【課題】新規のデータについて、特定の項目についてTrueかFalseかを予測する際の予測コストを下げる。
【解決手段】情報処理装置1は、予測対象のグラフデータが、ナレッジグラフの埋め込みの訓練に用いられた訓練データに含まれないノード間の関係を示すノードリンクを含むデータであるか否かを判定し、前記予測対象のグラフデータが前記訓練データに含まれないノードリンクを含むデータであると判定した場合、前記予測対象のグラフデータに含まれるノードのラベルについての埋め込み予測の結果に基づいて、前記訓練データの中から、予測対象のグラフデータに類似するグラフデータを特定し、特定した前記類似するグラフデータに基づいて、前記予測対象のグラフデータに対する予測結果を決定する。かかる情報処理装置1の処理は、例えば、新規医薬品に対する副作用の予測に適用できる。
【選択図】図5
特許請求の範囲【請求項1】
ナレッジグラフの埋め込みを用いた予測プログラムであって、
予測対象のグラフデータが、ナレッジグラフの埋め込みの訓練に用いられた訓練データに含まれないノード間の関係を示すノードリンクを含むデータであるか否かを判定し、
前記予測対象のグラフデータが前記訓練データに含まれないノードリンクを含むデータであると判定した場合、前記予測対象のグラフデータに含まれるノードのラベルについての埋め込み予測の結果に基づいて、前記訓練データの中から、予測対象のグラフデータに類似するグラフデータを特定し、
特定した前記類似するグラフデータに基づいて、前記予測対象のグラフデータに対する予測結果を決定する
処理をコンピュータに実行させる予測プログラム。
続きを表示(約 1,400 文字)【請求項2】
前記特定する処理は、前記予測対象のグラフデータに含まれるノードのラベルに、既に訓練されたノードのラベルの埋め込みベクトルを用いて、前記訓練データに含まれる複数のグラフデータとのリンク予測を行うことで、前記ノードのラベルと各グラフデータとの類似性を計算し、前記複数のグラフデータの中から最も類似するグラフデータを前記予測対象のグラフデータに類似するグラフデータとして特定する
ことを特徴とする請求項1に記載の予測プログラム。
【請求項3】
前記ノードのラベルと前記グラフデータとの類似性は、前記ノードのラベルと前記グラフデータとの距離であり、
前記予測対象のグラフデータに含まれるノードのラベルは、前記訓練データに含まれる既に訓練されたノードのラベルと同一のラベルであり、
前記特定する処理は、前記予測対象のグラフデータに含まれるノードのラベルが複数存在する場合には、複数のノードそれぞれのラベルに対する前記複数のグラフデータそれぞれとの距離を用いて、前記複数のグラフデータの中から距離が最も小さいグラフデータを特定する
ことを特徴とする請求項2に記載の予測プログラム。
【請求項4】
前記特定する処理は、前記複数のグラフデータそれぞれについて、複数のノードそれぞれのラベルとの距離の合計値を用いて、前記複数のグラフデータの中から距離の合計値が最も小さいグラフデータを特定する
ことを特徴とする請求項3に記載の予測プログラム。
【請求項5】
前記決定する処理は、前記類似するグラフデータに含まれる特定のノードのラベルに応じた値を、前記予測対象のグラフデータに対する予測結果として決定する
ことを特徴とする請求項1に記載の予測プログラム。
【請求項6】
予測対象のグラフデータが、ナレッジグラフの埋め込みの訓練に用いられた訓練データに含まれないノード間の関係を示すノードリンクを含むデータであるか否かを判定する判定部と、
前記予測対象のグラフデータが前記訓練データに含まれないノードリンクを含むデータであると判定した場合、前記予測対象のグラフデータに含まれるノードのラベルについての埋め込み予測の結果に基づいて、前記訓練データの中から、予測対象のグラフデータに類似するグラフデータを特定する特定部と、
特定した前記類似するグラフデータに基づいて、前記予測対象のグラフデータに対する予測結果を決定する決定部と、
を有することを特徴とする情報処理装置。
【請求項7】
ナレッジグラフの埋め込みを用いた予測方法であって、
予測対象のグラフデータが、ナレッジグラフの埋め込みの訓練に用いられた訓練データに含まれないノード間の関係を示すノードリンクを含むデータであるか否かを判定し、
前記予測対象のグラフデータが前記訓練データに含まれないノードリンクを含むデータであると判定した場合、前記予測対象のグラフデータに含まれるノードのラベルについての埋め込み予測の結果に基づいて、前記訓練データの中から、予測対象のグラフデータに類似するグラフデータを特定し、
特定した前記類似するグラフデータに基づいて、前記予測対象のグラフデータに対する予測結果を決定する
処理をコンピュータが実行する予測方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、予測プログラムなどに関する。
続きを表示(約 2,200 文字)【背景技術】
【0002】
ナレッジグラフのリンク予測をするために、3つ(トリプル)のデータからなる関係情報をナレッジグラフに埋め込む技術(「TransE」という)が開示されている(例えば、非特許文献1を参照)。関係情報として、RDF(Resource Description Framework)が挙げられる。RDFは、ウェブ上の情報のメタデータを記述するためのデータ構造を示し、エンティティ、プロパティ、エンティティの3つのデータを1組としている。ここで、エンティティ、プロパティ、エンティティは、主語(subject)、述語(predicate)、目的語(object)の3つの要素を関係情報として表現される。主語(subject)、述語(predicate)、目的語(object)は、「主語の述語は目的語である」という関係性を持つ関係情報である。
【0003】
TransEは、2つのエンティティh,tがE(エンティティの集合)に属し、且つプロパティrがR(プロパティの集合)に属するようなトリプルのデータ(h,r,t)の集合Sをもとに、エンティティおよびプロパティのベクトルの埋め込みを学習する。すなわち、TransEは、(h,r,t)の3つのデータを組(トリプル)としたナレッジグラフの集合をベクトル空間上に埋め込み、機械学習の技術により、ベクトルを変換して、データ構造を得る技術である。ここでいうデータ構造は、トリプルのデータ(h,r,t)のそれぞれのベクトル表現V

、V

、V

について、V

+V

ができるだけV

と等しくなるようなデータ構造のことをいう。
【0004】
これにより、TransEにより学習されたデータ構造を用いると、V

+V

≒V

のような計算ができるようになるので、V

+V

に対応するtを予測することができる。また、TransEにより学習されたデータ構造を用いると、V

-V

に対応するh、V

-V

に対応するrを予測することができる。
【0005】
また、埋め込みベクトルを使って、特定の項目(エンティティのラベル)についてTrueかFalseかを予測する手法には、例えば、K近傍法が挙げられる。K近傍法(k-nearest neighbor algorithm)は、特徴空間における最も近い多次元ベクトルに基づいた分類の手法である。例えば、K近傍法のアルゴリズムは、<1>Kを予め定め、<2>予測対象の新規のベクトルに最も近いベクトルをK個選択し、<3>K個のベクトルに対応する特定の項目についてのTrueまたはFalseを多数決する。これにより、予測対象の新規のベクトルを使って、特定の項目(エンティティのラベル)についてTrueかFalseかが予測できる。
【先行技術文献】
【特許文献】
【0006】
特開2019-049980号公報
【非特許文献】
【0007】
Antonine Bordes et al ”Translating Embeddings for Modeling Multi-relational Data”
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、ナレッジグラフの埋め込みを用いる場合、新規のデータについて、特定の項目の真偽を予測するためには、新規のデータを含めた全体のデータを再度学習し直して、新規のデータのベクトルを求めなければならない。すなわち、新規のデータについて、特定の項目の真偽を予測する際、全体のデータを学習し直すコストがかかるという問題がある。
【0009】
本発明は、1つの側面では、ナレッジグラフの埋め込みを用いて新規のデータについて特定の項目の真偽を予測する際に、予測コストを下げることを目的とする。
【課題を解決するための手段】
【0010】
1つの態様では、予測プログラムが、ナレッジグラフの埋め込みを用いた予測プログラムであって、予測対象のグラフデータが、ナレッジグラフの埋め込みの訓練に用いられた訓練データに含まれないノード間の関係を示すノードリンクを含むデータであるか否かを判定し、前記予測対象のグラフデータが前記訓練データに含まれないノードリンクを含むデータであると判定した場合、前記予測対象のグラフデータに含まれるノードのラベルについての埋め込み予測の結果に基づいて、前記訓練データの中から、予測対象のグラフデータに類似するグラフデータを特定し、特定した前記類似するグラフデータに基づいて、前記予測対象のグラフデータに対する予測結果を決定する、処理をコンピュータに実行させる。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
画像処理方法
8日前
富士通株式会社
アバター制御
27日前
富士通株式会社
基板連結構造
23日前
富士通株式会社
光信号パワー利得
19日前
富士通株式会社
増幅装置及び増幅方法
9日前
富士通株式会社
演算装置および演算方法
13日前
富士通株式会社
電子装置及び改竄検知方法
6日前
富士通株式会社
物体検出システム及び方法
14日前
富士通株式会社
演算回路及び演算処理方法
9日前
富士通株式会社
情報処理装置および情報処理方法
1か月前
富士通株式会社
光伝送システムでの異常の位置特定
26日前
富士通株式会社
半導体装置及び半導体装置の製造方法
23日前
富士通株式会社
病変検出方法および病変検出プログラム
9日前
富士通株式会社
情報処理プログラムおよび情報処理装置
今日
富士通株式会社
情報処理方法および情報処理プログラム
8日前
富士通株式会社
移相量調整装置、及び、移相量調整方法
16日前
富士通株式会社
スイッチング電源、増幅装置及び通信装置
8日前
富士通株式会社
プログラム、算出方法および情報処理装置
1日前
富士通株式会社
物品数量を検出する装置と方法及び電子機器
13日前
富士通株式会社
物品数量を検出する装置と方法及び電子機器
13日前
富士通株式会社
働きかけ表示方法、働きかけ表示プログラム
9日前
富士通株式会社
自動化されたカスタム特徴エンジニアリング
23日前
富士通株式会社
車両経路選択問題及びその変形例の経路生成
6日前
富士通株式会社
3次元人体動的着装モデル推定装置及び方法
27日前
富士通株式会社
クエリ実行方法およびクエリ実行プログラム
16日前
富士通株式会社
データ処理装置、プログラム及びデータ処理方法
9日前
富士通株式会社
データ処理装置、プログラム及びデータ処理方法
12日前
富士通株式会社
光ノード装置、光通信システム、及び波長変換回路
9日前
富士通株式会社
カスタム特徴量エンジニアリングのための単位予測
22日前
富士通株式会社
通信装置、無線通信システム及び送信ランク切替方法
21日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
12日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
13日前
富士通株式会社
位置測位プログラム、情報処理装置及び位置測位方法
13日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
22日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
22日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
今日
続きを見る