TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024135440
公報種別公開特許公報(A)
公開日2024-10-04
出願番号2023046120
出願日2023-03-23
発明の名称機械学習プログラム、機械学習方法、及び機械学習装置
出願人富士通株式会社
代理人個人
主分類G06N 3/09 20230101AFI20240927BHJP(計算;計数)
要約【課題】単語間の因果関係の特徴を因果関係抽出モデルに入力し、機械学習を実行する。
【解決手段】学習装置10は、訓練データ135のテキストに含まれる単語それぞれに対応して、単語埋め込みに基づいて単語とベクトルとが対応付けられた第1の対応情報と、原因を示す第1単語と第1単語が示す原因に基づいた結果を示す第2単語との単語ペアの関係性に基づいて単語とベクトルとが対応付けられた第2の対応情報と、に基づいて生成された第3の対応情報を取得する。学習装置10は、取得した第3の対応情報を用いて、自然言語処理を行うニューラルネットワークの訓練を実行する。
【選択図】図1
特許請求の範囲【請求項1】
第1のテキストに含まれる単語それぞれに対応して、単語埋め込みに基づいて単語とベクトルとが対応付けられた第1の対応情報と、原因を示す第1単語と前記原因に基づいた結果を示す第2単語との単語ペアの関係性に基づいて単語とベクトルとが対応付けられた第2の対応情報と、に基づいて生成された第3の対応情報を取得し、
取得した前記第3の対応情報を用いて、自然言語処理を行うニューラルネットワークの訓練を実行する
処理をコンピュータに実行させることを特徴とする機械学習プログラム。
続きを表示(約 1,200 文字)【請求項2】
前記第3の対応情報は、各単語に対して、前記第1の対応情報において対応付けられたベクトルと前記第2の対応情報において対応付けられたベクトルとを組み合わせた情報を対応付けた対応情報である
ことを特徴とする請求項1に記載の機械学習プログラム。
【請求項3】
第2のテキストに含まれる因果関係を示すキーワードを含む文を、前記キーワードに基づいて第1の部分と第2の部分に分割し、
前記第1単語は、前記第1の部分から抽出された単語であり、
前記第2単語は、前記第2の部分から抽出された単語であり、
前記第2の対応情報は、前記単語ペアと、前記単語ペアに含まれる単語間の因果関係の強さと、に基づいて単語とベクトルとが対応付けられた対応情報である
ことを特徴とする請求項1又は2に記載の機械学習プログラム。
【請求項4】
前記因果関係の強さは、前記単語ペアが前記第2のテキストにおいて前記キーワードと共に出現する頻度に基づいて算出される
ことを特徴とする請求項3に記載の機械学習プログラム。
【請求項5】
前記単語ペアと前記単語ペアのそれぞれに対応する前記因果関係の強さとに基づいてナレッジグラフを生成し、
前記第2の対応情報は、前記ナレッジグラフを用いたグラフ埋め込みによって生成される対応情報である
ことを特徴とする請求項4に記載の機械学習プログラム。
【請求項6】
前記第2の対応情報は、前記単語ペアと前記単語ペアのそれぞれに対応する前記因果関係の強さとに基づいて生成された隣接行列に基づいて生成された対応情報である
ことを特徴とする請求項4に記載の機械学習プログラム。
【請求項7】
第1のテキストに含まれる単語それぞれに対応して、単語埋め込みに基づいて単語とベクトルとが対応付けられた第1の対応情報と、原因を示す第1単語と前記原因に基づいた結果を示す第2単語との単語ペアの関係性に基づいて単語とベクトルとが対応付けられた第2の対応情報と、に基づいて生成された第3の対応情報を取得し、
取得した前記ベクトルを用いて、自然言語処理を行うニューラルネットワークの訓練を実行する
処理をコンピュータで実行することを特徴とする機械学習方法。
【請求項8】
第1のテキストに含まれる単語それぞれに対応して、単語埋め込みに基づいて単語とベクトルとが対応付けられた第1の対応情報と、原因を示す第1単語と前記原因に基づいた結果を示す第2単語との単語ペアの関係性に基づいて単語とベクトルとが対応付けられた第2の対応情報と、に基づいて生成された第3の対応情報を取得し、
取得した前記ベクトルを用いて、自然言語処理を行うニューラルネットワークの訓練を実行する
制御部を有することを特徴とする機械学習装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、機械学習に関するものである。
続きを表示(約 1,800 文字)【背景技術】
【0002】
自然言語処理の分野において、テキストから因果関係の有無を予測する技術(因果関係抽出:Causal Relation Extraction)がある。因果関係抽出の手法の一例として、テキストに含まれる2つの単語(以下、「単語ペア」と記載する場合がある)の単語間の因果関係の有無を予測する技術が提案されている。因果関係を有する単語ペアとは、例えば一方の単語が示す事物が他方の単語が示す事物の原因となり、他方の単語が示す事物が一方の単語が示す事物に基づいた結果となる関係にある単語のペアである。因果関係を有する単語ペアは、例えば、「喫煙が原因で肺がんになる」というテキストの「喫煙」と「肺がん」である。因果関係抽出は、例えば創薬や材料開発の分野において、膨大なデータの中から重要な因果関係を発見するのに用いられる。
【0003】
因果関係抽出の従来技術として、機械学習により因果関係抽出の機械学習モデル(以下、「因果関係抽出モデル」と記載する場合がある)を生成する技術が提案されている。例えば、因果関係抽出モデルは、ラベルを付したテキストを訓練データとして用いる教師あり学習により生成される。一例として、ラベルは、テキストに含まれる単語間の因果関係の有無に基づいて付される。訓練データのテキストは、テキストに含まれる単語ごとに分散表現に変換されたのち因果関係抽出モデルに入力され、因果関係抽出モデルの出力とラベルとの誤差が小さくなるように訓練が実行される。
【0004】
分散表現とは、単語をベクトルで表現した際のベクトルを示す。分散表現は単語埋め込みにより得られる。単語埋め込みとは、単語の持つ意味を文脈や文章中の単語の前後関係から学習し、単語をベクトルで表現する技術である。単語埋め込みはone-hotエンコーディングを通じて得られるベクトルと比較して低次元のベクトルで単語を表現することができ、テキストをニューラルネットワークに入力する際に用いられる技術の一つである。
【先行技術文献】
【特許文献】
【0005】
特開2015-200961号公報
特開2018-060364号公報
米国特許出願公開第2021/0117509号明細書
米国特許出願公開第2019/0197104号明細書
【発明の概要】
【発明が解決しようとする課題】
【0006】
単語埋め込みは単語の様々な特徴を取り込んで単語をベクトル空間上に位置付け、単語間の類似性や関係性を分散表現(以下、「ベクトル」や「ベクトル表現」と記載する場合がある)で表す技術である。しかしながら、単語埋め込みは単語間の因果関係の特徴を分散表現に表していない。
【0007】
従来技術では、因果関係抽出モデルに入力される分散表現に因果関係が表されていないため、因果関係抽出モデルはテキストの文脈や単語の前後関係に依存して訓練される。そのため従来技術では、予測対象のテキストの単語の並びによっては、因果関係が抽出されない場合があった。
【0008】
一つの側面では、本発明は、単語間の因果関係の特徴を因果関係抽出モデルに入力し、機械学習を実行することが可能な機械学習プログラム、機械学習方法、機械学習装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
一つの態様では、第1のテキストに含まれる単語それぞれに対応して、単語埋め込みに基づいて単語とベクトルとが対応付けられた第1の対応情報と、原因を示す第1単語と第1単語が示す原因に基づいた結果を示す第2単語との単語ペアの関係性に基づいて単語とベクトルとが対応付けられた第2の対応情報と、に基づいて生成された第3の対応情報を取得し、取得した第3の対応情報を用いて、自然言語処理を行うニューラルネットワークの訓練を実行する、処理をコンピュータに実行させる機械学習プログラムが提供される。
【0010】
一つの態様では、上記機械学習プログラムに基づく処理と同様の処理をコンピュータが実行する機械学習方法が提供される。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

富士通株式会社
ラック装置
1か月前
富士通株式会社
情報処理プログラム
4日前
富士通株式会社
プロセッサパッケージ
1か月前
富士通株式会社
光増幅器および光増幅方法
1か月前
富士通株式会社
光伝送装置及び光伝送方法
9日前
富士通株式会社
プロセッサ及び情報処理装置
23日前
富士通株式会社
変換プログラムおよび変換方法
1か月前
富士通株式会社
信号処理装置及び信号処理方法
1か月前
富士通株式会社
光伝送装置および光伝送システム
16日前
富士通株式会社
歩容認識装置、方法及び電子機器
1か月前
富士通株式会社
故障監視装置および故障監視方法
16日前
富士通株式会社
光センサ及び光センサの製造方法
1か月前
富士通株式会社
エラー訂正装置及びエラー訂正方法
10日前
富士通株式会社
機械学習プログラム、方法、及び装置
4日前
富士通株式会社
光送受信機制御方法および光送受信機
15日前
富士通株式会社
ラマン増幅装置およびラマン増幅方法
9日前
富士通株式会社
機械学習プログラム、方法、及び装置
1か月前
富士通株式会社
機械学習プログラム、方法、及び装置
1か月前
富士通株式会社
マルチチャネルパワープロファイル推定
1か月前
富士通株式会社
収入特定方法および収入特定プログラム
22日前
富士通株式会社
OD決定方法およびOD決定プログラム
15日前
富士通株式会社
情報処理方法および情報処理プログラム
9日前
富士通株式会社
データ生成プログラム、方法、及び装置
4日前
富士通株式会社
制御プログラム、制御装置、及び制御方法
2日前
富士通株式会社
キャッシュコントローラ及び演算処理装置
3日前
富士通株式会社
制御装置,制御方法および分散処理システム
1か月前
富士通株式会社
評価プログラム、評価装置及び評価システム
1か月前
富士通株式会社
試験装置,試験方法および情報処理プログラム
1か月前
富士通株式会社
自己教師あり学習プログラム、方法、及び装置
16日前
富士通株式会社
自己教師あり学習プログラム、方法、及び装置
16日前
富士通株式会社
位置情報処理装置およびサービス提供システム
23日前
富士通株式会社
情報処理システム、情報処理方法及びプログラム
24日前
富士通株式会社
データ処理装置、プログラム及びデータ処理方法
17日前
富士通株式会社
プログラム、データ処理装置及びデータ処理方法
17日前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
1か月前
富士通株式会社
タスク割り当て方法、タスク割り当てプログラム
23日前
続きを見る