TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024101929
公報種別公開特許公報(A)
公開日2024-07-30
出願番号2023006160
出願日2023-01-18
発明の名称機械学習プログラム、情報処理装置および機械学習方法
出願人富士通株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06N 3/045 20230101AFI20240723BHJP(計算;計数)
要約【課題】学習データにはない文章入力に対しても、認識精度を向上させる。
【解決手段】情報処理装置1は、ニューラルネットワークで構成されたモジュールを複数組み合わせて複数の層に構築される機械学習モデルの学習において、質問文を含む学習データを受信し、学習データの質問文に含まれる複数の単語に対して、単語間の係り受けを解析する。情報処理装置1は、解析の結果に基づいて、各層の各モジュールに対して入力する質問文の情報を、単語間の係り受けを示す一部の句に限定して入力し、各モジュールに対して適用する重みを決定する。情報処理装置1は、各層の各モジュールに対して適用する重みに基づいて、機械学習モデルで用いられるモジュールの組み合わせの選択を制御する。かかる情報処理装置1の処理は、例えば、自然言語をクエリとする画像検索アプリケーションに適用することができる。
【選択図】図1
特許請求の範囲【請求項1】
ニューラルネットワークで構成されたモジュールを複数組み合わせて複数の層に構築される機械学習モデルの学習において、
質問文を含む学習データを受信し、
前記学習データの前記質問文に含まれる複数の単語に対して、単語間の係り受けを解析し、
解析の結果に基づいて、各層の各モジュールに対して入力する前記質問文の情報を、単語間の係り受けを示す一部の句に限定して入力し、各モジュールに対して適用する重みを決定し、
各層の各モジュールに対して適用する重みに基づいて、前記機械学習モデルで用いられるモジュールの組み合わせの選択を制御する
処理をコンピュータに実行させることを特徴とする機械学習プログラム。
続きを表示(約 1,400 文字)【請求項2】
前記学習データは、画像および前記画像に関する前記質問文を含むことを特徴とする請求項1に記載の機械学習プログラム。
【請求項3】
前記解析する処理は、係り受け解析を用いて、前記質問文に含まれる各単語の係り先と係り受けタグ情報とを特定し、
前記重みを決定する処理は、
各単語のエンベッディングに、各単語に対する係り受けタグのエンベッディングを加算して各単語に係り受けタグを加味した係り受け単語エンベッディングを生成し、
前記解析の結果により分割された各句を構成する単語を各層に対応付けた行列を生成し、
前記行列を用いて、処理順の層に対応付けられた句を構成する単語の係り受け単語エンベッディングを取得し、
取得した係り受け単語エンベッディング列を前記処理順の層の各モジュールに入力して各モジュールに対して適用する重みを決定する
ことを特徴とする請求項1に記載の機械学習プログラム。
【請求項4】
前記重みを決定する処理は、トランスフォーマーブロックで構成された複数のモジュールそれぞれに対して、前記句を構成する単語の係り受け単語エンベッディング列および前記画像の物体特徴量を入力して出力を計算し、第1の多層パーセプトロン処理で出力した重み分布に基づき前記複数のモジュールの出力を重み付き平均して、重み付き平均した出力を次層への入力として、予め定められた個数の層分の処理を行い、
最終層の出力を第2の多層パーセプトロン処理で回答を出力し、
誤差逆伝播法で前記ニューラルネットワークを学習し、各モジュールに適用する重みを決定する
ことを特徴とする請求項2に記載の機械学習プログラム。
【請求項5】
ニューラルネットワークで構成されたモジュールを複数組み合わせて複数の層に構築される機械学習モデルの学習において、
質問文を含む学習データを受信する受信部と、
前記受信部によって受信される前記学習データの前記質問文に含まれる複数の単語に対して、単語間の係り受けを解析する解析部と、
解析の結果に基づいて、各層の各モジュールに対して入力する前記質問文の情報を、単語間の係り受けを示す一部の句に限定して入力し、各モジュールに対して適用する重みを決定する決定部と、
各層の各モジュールに対して適用する重みに基づいて、前記機械学習モデルで用いられるモジュールの組み合わせの選択を制御する制御部と、
を有することを特徴とする情報処理装置。
【請求項6】
ニューラルネットワークで構成されたモジュールを複数組み合わせて複数の層に構築される機械学習モデルの学習において、
質問文を含む学習データを受信し、
前記学習データの前記質問文に含まれる複数の単語に対して、単語間の係り受けを解析し、
解析の結果に基づいて、各層の各モジュールに対して入力する前記質問文の情報を、単語間の係り受けを示す一部の句に限定して入力し、各モジュールに対して適用する重みを決定し、
各層の各モジュールに対して適用する重みに基づいて、前記機械学習モデルで用いられるモジュールの組み合わせの選択を制御する
処理をコンピュータが実行することを特徴とする機械学習方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、機械学習プログラムなどに関する。
続きを表示(約 2,200 文字)【背景技術】
【0002】
ニューラルモジュールの組み合わせ(プログラム)を制御して機械学習する手法が開示されている。
【0003】
例えば、第1の技術では、機械学習の学習データであるCLEVRデータセットの質問文を構成する句や節を組み合わせ、CLEVRデータセットでは直接的には登場しない質問の仕方によって精度を評価するCLOSUREデータセットが提案されている(例えば、非特許文献1参照)。ここでいうCLEVRデータセットとは、3Dレンダリング画像のコンテンツに対する質問文のデータセットのことをいう。CLOSUREデータセットとは、学習データであるCLEVRデータセットでは直接的には登場しない質問の仕方によって精度を評価するためのデータセットのことをいう。CLOSUREデータセットについては、CLEVRデータセットで学習した後のニューラルモジュールネットワークモデルのテストで、精度が悪くなることが開示されている。このため、第1の技術では、文章特徴量で画像特徴量を変調する手法(FiLM)を、ニューラルモジュールに適用することにより、CLOSUREデータセットでの精度を向上させる。
【0004】
なお、図9は、CLEVRおよびCLOSUREデータセットおよびモジュールの組み合わせを示す参考図である。図9左図は、CLEVRおよびCLOSUREデータセットを示す参考図である。図9右図は、ニューラルモジュールの組み合わせ(プログラム)を示す参考図である。図9右図に示すP1は、CLEVRデータセットの質問文Q1を構成する句や節をニューラルモジュールとしたモジュールの組み合わせ(プログラム)である。モジュールの下の括弧は、引数である。P2は、CLEVRデータセットの質問文Q2を構成する句や節をニューラルモジュールとしたモジュールの組み合わせ(プログラム)である。P1およびP2は、それぞれ質問文Q1およびQ2に対するモジュールの組み合わせ(プログラム)の正解である。P3は、CLOSUREデータセットの質問文Q3を構成する句や節をニューラルモジュールとしたモジュールの組み合わせであって、CLEVRデータセットの質問文に登場しない質問の仕方を持つモジュールの組み合わせ(プログラム)である。
【0005】
また、第2の技術では、CLEVRプログラムの各処理を学習するニューラルモジュールを用意する。学習処理は、入力する質問文の要求に対する回答に必要となる、モジュール処理の組み合わせを制御するための重みも学習により自動生成する(例えば、非特許文献2参照)。なお、図10は、CLEVRプログラムの学習を示す参考図である。図10で示す「find」,「transform」,・・・,「answer」および「compare」がモジュール処理の組み合わせであり、このモジュール処理の組み合わせを制御するための重みW
(t)
も学習により自動生成される。
【0006】
第1の技術および第2の技術では、学習時に、入力する質問文に対する回答に必要な各ニューラルモジュールと、モジュールの組み合わせ(プログラム)を予め用意して、学習する。すなわち、第1の技術および第2の技術は、学習時に、質問文に対する正解のプログラムのとおりにニューラルモジュールを構成して学習する。
【先行技術文献】
【非特許文献】
【0007】
“CLOSURE Assessing Systematic Generalization of CLEVR Models”,arXiv:1912.05783
“Explainable Neural Computation via Stack Neural Module Networks”,In:ECCV 2018
【発明の概要】
【発明が解決しようとする課題】
【0008】
第1の技術および第2の技術では、学習時に、質問文に対する正解のモジュールの組み合わせ(プログラム)を用意する必要がある。しかしながら、様々な入力としてのタスク(質問文)を解くために必要なモジュールの組み合わせ(プログラム)の正解を、あらかじ用意するのは困難であるという問題がある。
【0009】
本発明は、1つの側面では、学習データにはない文章入力に対しても、認識精度を向上させることを目的とする。
【課題を解決するための手段】
【0010】
1つの態様では、機械学習プログラムが、ニューラルネットワークで構成されたモジュールを複数組み合わせて複数の層に構築される機械学習モデルの学習において、質問文を含む学習データを受信し、前記学習データの前記質問文に含まれる複数の単語に対して、単語間の係り受けを解析し、解析の結果に基づいて、各層の各モジュールに対して入力する前記質問文の情報を、単語間の係り受けを示す一部の句に限定して入力し、各モジュールに対して適用する重みを決定し、各層の各モジュールに対して適用する重みに基づいて、前記機械学習モデルで用いられるモジュールの組み合わせの選択を制御する、処理をコンピュータに実行させる。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

富士通株式会社
ビデオにおける被遮蔽領域の検出方法、装置及び記憶媒体
1日前
富士通株式会社
歩行状態測定装置、歩行状態測定方法及び歩行状態測定プログラム
6日前
個人
マウス用テーブル
15日前
アズビル株式会社
防爆装置
9日前
個人
契約管理サーバ
20日前
株式会社宗建
SNSサーバー
7日前
株式会社セガフェイブ
遊戯機
13日前
株式会社ジール
文章の分析装置
14日前
個人
選択操作音声出力システム
15日前
アスエネ株式会社
森林管理の方法
9日前
個人
動作のデザイン評価の方法及び装置
6日前
オムロン株式会社
認証中継サーバ
6日前
大同特殊鋼株式会社
棒材計数装置
6日前
株式会社奥村組
削孔位置検出方法
20日前
個人
口座悪用を防止する口座管理システム
1日前
日本電気株式会社
システム及び方法
20日前
株式会社八咲
イベント管理システム
6日前
個人
分類処理プログラム、システム及び方法
17日前
セコム株式会社
監視装置
15日前
個人
分類処理プログラム、システム及び方法
17日前
セコム株式会社
監視装置
15日前
スタートバーン株式会社
管理装置
20日前
ローム株式会社
コントローラ回路
13日前
株式会社コペル
自立就労支援方法
14日前
チャットプラス株式会社
チャットシステム
1日前
大王製紙株式会社
情報読取システム
13日前
京セラ株式会社
システム、端末、及びプログラム
8日前
株式会社JVCケンウッド
配送管理サーバ
20日前
富士通株式会社
目標確定方法と装置
13日前
株式会社ワイ・イー・シー
バックアップ装置
13日前
株式会社野村総合研究所
データウェアハウス
15日前
日本電気株式会社
端末及び第2の端末
14日前
エヌ・エス・システム株式会社
決済システム
6日前
株式会社バイトルヒクマ
交通費算出システム
20日前
トヨタ自動車株式会社
制御装置
15日前
株式会社アドヴィックス
電子制御装置
13日前
続きを見る