TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024067152
公報種別
公開特許公報(A)
公開日
2024-05-17
出願番号
2022176995
出願日
2022-11-04
発明の名称
予測プログラム、情報処理装置および予測方法
出願人
富士通株式会社
代理人
弁理士法人酒井国際特許事務所
主分類
G06N
5/04 20230101AFI20240510BHJP(計算;計数)
要約
【課題】新規のデータについて、特定の項目についてTrueかFalseかを予測する際の予測コストを下げる。
【解決手段】情報処理装置1は、予測対象のグラフデータが、ナレッジグラフの埋め込みの訓練に用いられた訓練データに含まれないノード間の関係を示すノードリンクを含むデータであるか否かを判定し、前記予測対象のグラフデータが前記訓練データに含まれないノードリンクを含むデータであると判定した場合、前記予測対象のグラフデータに含まれるノードのラベルについての埋め込み予測の結果に基づいて、前記訓練データの中から、予測対象のグラフデータに類似するグラフデータを特定し、特定した前記類似するグラフデータに基づいて、前記予測対象のグラフデータに対する予測結果を決定する。かかる情報処理装置1の処理は、例えば、新規医薬品に対する副作用の予測に適用できる。
【選択図】図5
特許請求の範囲
【請求項1】
ナレッジグラフの埋め込みを用いた予測プログラムであって、
予測対象のグラフデータが、ナレッジグラフの埋め込みの訓練に用いられた訓練データに含まれないノード間の関係を示すノードリンクを含むデータであるか否かを判定し、
前記予測対象のグラフデータが前記訓練データに含まれないノードリンクを含むデータであると判定した場合、前記予測対象のグラフデータに含まれるノードのラベルについての埋め込み予測の結果に基づいて、前記訓練データの中から、予測対象のグラフデータに類似するグラフデータを特定し、
特定した前記類似するグラフデータに基づいて、前記予測対象のグラフデータに対する予測結果を決定する
処理をコンピュータに実行させる予測プログラム。
続きを表示(約 1,400 文字)
【請求項2】
前記特定する処理は、前記予測対象のグラフデータに含まれるノードのラベルに、既に訓練されたノードのラベルの埋め込みベクトルを用いて、前記訓練データに含まれる複数のグラフデータとのリンク予測を行うことで、前記ノードのラベルと各グラフデータとの類似性を計算し、前記複数のグラフデータの中から最も類似するグラフデータを前記予測対象のグラフデータに類似するグラフデータとして特定する
ことを特徴とする請求項1に記載の予測プログラム。
【請求項3】
前記ノードのラベルと前記グラフデータとの類似性は、前記ノードのラベルと前記グラフデータとの距離であり、
前記予測対象のグラフデータに含まれるノードのラベルは、前記訓練データに含まれる既に訓練されたノードのラベルと同一のラベルであり、
前記特定する処理は、前記予測対象のグラフデータに含まれるノードのラベルが複数存在する場合には、複数のノードそれぞれのラベルに対する前記複数のグラフデータそれぞれとの距離を用いて、前記複数のグラフデータの中から距離が最も小さいグラフデータを特定する
ことを特徴とする請求項2に記載の予測プログラム。
【請求項4】
前記特定する処理は、前記複数のグラフデータそれぞれについて、複数のノードそれぞれのラベルとの距離の合計値を用いて、前記複数のグラフデータの中から距離の合計値が最も小さいグラフデータを特定する
ことを特徴とする請求項3に記載の予測プログラム。
【請求項5】
前記決定する処理は、前記類似するグラフデータに含まれる特定のノードのラベルに応じた値を、前記予測対象のグラフデータに対する予測結果として決定する
ことを特徴とする請求項1に記載の予測プログラム。
【請求項6】
予測対象のグラフデータが、ナレッジグラフの埋め込みの訓練に用いられた訓練データに含まれないノード間の関係を示すノードリンクを含むデータであるか否かを判定する判定部と、
前記予測対象のグラフデータが前記訓練データに含まれないノードリンクを含むデータであると判定した場合、前記予測対象のグラフデータに含まれるノードのラベルについての埋め込み予測の結果に基づいて、前記訓練データの中から、予測対象のグラフデータに類似するグラフデータを特定する特定部と、
特定した前記類似するグラフデータに基づいて、前記予測対象のグラフデータに対する予測結果を決定する決定部と、
を有することを特徴とする情報処理装置。
【請求項7】
ナレッジグラフの埋め込みを用いた予測方法であって、
予測対象のグラフデータが、ナレッジグラフの埋め込みの訓練に用いられた訓練データに含まれないノード間の関係を示すノードリンクを含むデータであるか否かを判定し、
前記予測対象のグラフデータが前記訓練データに含まれないノードリンクを含むデータであると判定した場合、前記予測対象のグラフデータに含まれるノードのラベルについての埋め込み予測の結果に基づいて、前記訓練データの中から、予測対象のグラフデータに類似するグラフデータを特定し、
特定した前記類似するグラフデータに基づいて、前記予測対象のグラフデータに対する予測結果を決定する
処理をコンピュータが実行する予測方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、予測プログラムなどに関する。
続きを表示(約 2,200 文字)
【背景技術】
【0002】
ナレッジグラフのリンク予測をするために、3つ(トリプル)のデータからなる関係情報をナレッジグラフに埋め込む技術(「TransE」という)が開示されている(例えば、非特許文献1を参照)。関係情報として、RDF(Resource Description Framework)が挙げられる。RDFは、ウェブ上の情報のメタデータを記述するためのデータ構造を示し、エンティティ、プロパティ、エンティティの3つのデータを1組としている。ここで、エンティティ、プロパティ、エンティティは、主語(subject)、述語(predicate)、目的語(object)の3つの要素を関係情報として表現される。主語(subject)、述語(predicate)、目的語(object)は、「主語の述語は目的語である」という関係性を持つ関係情報である。
【0003】
TransEは、2つのエンティティh,tがE(エンティティの集合)に属し、且つプロパティrがR(プロパティの集合)に属するようなトリプルのデータ(h,r,t)の集合Sをもとに、エンティティおよびプロパティのベクトルの埋め込みを学習する。すなわち、TransEは、(h,r,t)の3つのデータを組(トリプル)としたナレッジグラフの集合をベクトル空間上に埋め込み、機械学習の技術により、ベクトルを変換して、データ構造を得る技術である。ここでいうデータ構造は、トリプルのデータ(h,r,t)のそれぞれのベクトル表現V
h
、V
r
、V
t
について、V
h
+V
r
ができるだけV
t
と等しくなるようなデータ構造のことをいう。
【0004】
これにより、TransEにより学習されたデータ構造を用いると、V
h
+V
r
≒V
t
のような計算ができるようになるので、V
h
+V
r
に対応するtを予測することができる。また、TransEにより学習されたデータ構造を用いると、V
t
-V
r
に対応するh、V
t
-V
h
に対応するrを予測することができる。
【0005】
また、埋め込みベクトルを使って、特定の項目(エンティティのラベル)についてTrueかFalseかを予測する手法には、例えば、K近傍法が挙げられる。K近傍法(k-nearest neighbor algorithm)は、特徴空間における最も近い多次元ベクトルに基づいた分類の手法である。例えば、K近傍法のアルゴリズムは、<1>Kを予め定め、<2>予測対象の新規のベクトルに最も近いベクトルをK個選択し、<3>K個のベクトルに対応する特定の項目についてのTrueまたはFalseを多数決する。これにより、予測対象の新規のベクトルを使って、特定の項目(エンティティのラベル)についてTrueかFalseかが予測できる。
【先行技術文献】
【特許文献】
【0006】
特開2019-049980号公報
【非特許文献】
【0007】
Antonine Bordes et al ”Translating Embeddings for Modeling Multi-relational Data”
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、ナレッジグラフの埋め込みを用いる場合、新規のデータについて、特定の項目の真偽を予測するためには、新規のデータを含めた全体のデータを再度学習し直して、新規のデータのベクトルを求めなければならない。すなわち、新規のデータについて、特定の項目の真偽を予測する際、全体のデータを学習し直すコストがかかるという問題がある。
【0009】
本発明は、1つの側面では、ナレッジグラフの埋め込みを用いて新規のデータについて特定の項目の真偽を予測する際に、予測コストを下げることを目的とする。
【課題を解決するための手段】
【0010】
1つの態様では、予測プログラムが、ナレッジグラフの埋め込みを用いた予測プログラムであって、予測対象のグラフデータが、ナレッジグラフの埋め込みの訓練に用いられた訓練データに含まれないノード間の関係を示すノードリンクを含むデータであるか否かを判定し、前記予測対象のグラフデータが前記訓練データに含まれないノードリンクを含むデータであると判定した場合、前記予測対象のグラフデータに含まれるノードのラベルについての埋め込み予測の結果に基づいて、前記訓練データの中から、予測対象のグラフデータに類似するグラフデータを特定し、特定した前記類似するグラフデータに基づいて、前記予測対象のグラフデータに対する予測結果を決定する、処理をコンピュータに実行させる。
【発明の効果】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
富士通株式会社
光増幅器および光増幅方法
1日前
富士通株式会社
信号処理装置及び信号処理方法
9日前
富士通株式会社
歩容認識装置、方法及び電子機器
1日前
富士通株式会社
機械学習プログラム、方法、及び装置
9日前
富士通株式会社
機械学習プログラム、方法、及び装置
9日前
富士通株式会社
制御装置,制御方法および分散処理システム
2日前
富士通株式会社
試験装置,試験方法および情報処理プログラム
1日前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
2日前
富士通株式会社
試験制御プログラム,試験システムおよび試験方法
9日前
富士通株式会社
情報処理装置、情報処理方法および情報処理プログラム
1日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
1日前
富士通株式会社
配線ばらつき算出方法および配線ばらつき算出プログラム
3日前
富士通株式会社
量子化学計算プログラム、量子化学計算方法、および情報処理装置
1日前
富士通株式会社
分岐履歴記録システム、分岐履歴記録方法、及び分岐制御プログラム
1日前
富士通株式会社
位置情報決定プログラム、位置情報決定装置及び位置情報決定システム
9日前
富士通株式会社
シミュレーションに用いるデータのデータ生成方法、データ生成プログラム
1日前
個人
マウス用テーブル
1か月前
個人
管理装置
1か月前
アズビル株式会社
防爆装置
25日前
個人
人的価値発掘システム
15日前
個人
管理装置
1か月前
個人
業界地図作成システム
12日前
個人
特徴検討支援システム
1か月前
個人
契約管理サーバ
1か月前
株式会社宗建
SNSサーバー
23日前
キヤノン電子株式会社
情報処理装置
15日前
株式会社セガフェイブ
遊戯機
29日前
キヤノン株式会社
印刷制御装置
3日前
ミサワホーム株式会社
管理装置
15日前
ミサワホーム株式会社
システム
15日前
個人
配送システムおよび同包箱
15日前
個人
選択操作音声出力システム
1か月前
株式会社ジール
文章の分析装置
1か月前
アスエネ株式会社
森林管理の方法
25日前
トヨタ自動車株式会社
車両
1か月前
株式会社奥村組
削孔位置検出方法
1か月前
続きを見る
他の特許を見る