TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024055624
公報種別公開特許公報(A)
公開日2024-04-18
出願番号2022162705
出願日2022-10-07
発明の名称機械学習プログラム、情報処理装置および機械学習方法
出願人富士通株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06N 3/082 20230101AFI20240411BHJP(計算;計数)
要約【課題】学習データにはない文章入力に対しても、認識精度を向上させる。
【解決手段】情報処理装置1は、ニューラルネットワークで構成されたモジュールを複数組み合わせて構築される機械学習モデルの学習において、画像および画像に関する質問文を組とする学習データの質問文に含まれる複数の単語に対して、単語間の係り受けを解析し、解析の結果に基づいて、複数のモジュールそれぞれに対して適用する重みを決定し、
前記複数のモジュールそれぞれに対して適用する重みに基づいて、前記複数のモジュールから、前記機械学習モデルで用いられるモジュールの組み合わせの選択を制御する。かかる情報処理装置1の処理は、例えば、自然言語をクエリとする画像検索アプリケーションに適用することができる。
【選択図】図1
特許請求の範囲【請求項1】
ニューラルネットワークで構成されたモジュールを複数組み合わせて構築される機械学習モデルの学習において、
画像および画像に関する質問文を組とする学習データの質問文に含まれる複数の単語に対して、単語間の係り受けを解析し、
解析の結果に基づいて、複数のモジュールそれぞれに対して適用する重みを決定し、
前記複数のモジュールそれぞれに対して適用する重みに基づいて、前記複数のモジュールから、前記機械学習モデルで用いられるモジュールの組み合わせの選択を制御する
処理をコンピュータに実行させることを特徴とする機械学習プログラム。
続きを表示(約 1,200 文字)【請求項2】
前記解析する処理は、
係り受け解析を用いて、前記質問文に含まれる各単語の係り先と係り受けタグ情報とを特定し、
前記決定する処理は、
各単語のエンベッディングに、各単語に対する係り受けタグのエンベッディングを加算し、前記質問文に含まれる各単語の係り先の位置を表す行列を用いて、各係り先の単語のエンベッディングの位置に対して、係り元の単語群の情報に線形変換した値を足し合わせ、足し合わせた配列を、係り先の単語のエンベッディング列に足し合わせて、係り受け情報を加味した係り受け単語のエンベッディング列を生成し、
前記係り受け単語のエンベッディング列を用いて、前記複数のモジュールそれぞれに対して適用する重みを決定する
ことを特徴とする請求項1に記載の機械学習プログラム。
【請求項3】
前記重みを決定する処理は、トランスフォーマーブロックで構成された複数のモジュールそれぞれに対して、前記係り受け単語のエンベッディング列および前記画像の物体特徴量を入力して出力を計算し、MLP処理で前記複数のモジュールの出力を重み付き平均して、重み付き平均した出力を次層への入力として、予め定められた個数の層分の処理を行い、
最終層の出力を前記MLP処理し、回答を出力し、
誤差逆伝播法で前記ニューラルネットワークを学習し、各モジュールに適用する重みを決定する
ことを特徴とする請求項2に記載の機械学習プログラム。
【請求項4】
ニューラルネットワークで構成されたモジュールを複数組み合わせて構築される機械学習モデルの学習において、
画像および画像に関する質問文を組とする学習データの質問文に含まれる複数の単語に対して、単語間の係り受けを解析する解析部と、
解析の結果に基づいて、複数のモジュールそれぞれに対して適用する重みを決定する決定部と、
前記複数のモジュールそれぞれに対して適用する重みに基づいて、前記複数のモジュールから、前記機械学習モデルで用いられるモジュールの組み合わせの選択を制御する制御部と、
を有することを特徴とする情報処理装置。
【請求項5】
ニューラルネットワークで構成されたモジュールを複数組み合わせて構築される機械学習モデルの学習において、
画像および画像に関する質問文を組とする学習データの質問文に含まれる複数の単語に対して、単語間の係り受けを解析し、
解析の結果に基づいて、複数のモジュールそれぞれに対して適用する重みを決定し、
前記複数のモジュールそれぞれに対して適用する重みに基づいて、前記複数のモジュールから、前記機械学習モデルで用いられるモジュールの組み合わせの選択を制御する
処理をコンピュータが実行することを特徴とする機械学習方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、機械学習プログラムなどに関する。
続きを表示(約 2,200 文字)【背景技術】
【0002】
ニューラルモジュールの組み合わせ(プログラム)を制御して機械学習する手法が開示されている。
【0003】
例えば、第1の技術では、機械学習の学習データであるCLEVRデータセットの質問文を構成する句や節を組み合わせ、CLEVRデータセットでは直接的には登場しない質問の仕方によって精度を評価するCLOSUREデータセットが提案されている(例えば、非特許文献1参照)。ここでいうCLEVRデータセットとは、3Dレンダリング画像のコンテンツに対する質問文のデータセットのことをいう。CLOSUREデータセットとは、学習データであるCLEVRデータセットでは直接的には登場しない質問の仕方によって精度を評価するためのデータセットのことをいう。CLOSUREデータセットについては、CLEVRデータセットで学習した後のニューラルモジュールネットワークモデルのテストで、精度が悪くなることが開示されている。このため、第1の技術では、文章特徴量で画像特徴量を変調する手法(FiLM)を、ニューラルモジュールに適用することにより、CLOSUREデータセットでの精度を向上させる。
【0004】
なお、図7は、CLEVRおよびCLOSUREデータセットおよびニューラルモジュールの組み合わせを示す参考図である。図7左図は、CLEVRおよびCLOSUREデータセットを示す参考図である。図7右図は、ニューラルモジュールの組み合わせ(プログラム)を示す参考図である。図7右図に示すP1は、CLEVRデータセットの質問文Q1を構成する句や節をニューラルモジュールとしたモジュールの組み合わせ(プログラム)である。モジュールの下の括弧は、引数である。P2は、CLEVRデータセットの質問文Q2を構成する句や節をニューラルモジュールとしたモジュールの組み合わせ(プログラム)である。P1およびP2は、それぞれ質問文Q1およびQ2に対するモジュールの組み合わせ(プログラム)の正解である。P3は、CLOSUREデータセットの質問文Q3を構成する句や節をニューラルモジュールとしたモジュールの組み合わせであって、CLEVRデータセットの質問文に登場しない質問の仕方を持つモジュールの組み合わせ(プログラム)である。
【0005】
また、第2の技術では、CLEVRプログラムの各処理を学習するニューラルモジュールを用意する。学習処理は、入力する質問文の要求に対する回答に必要となる、モジュール処理の組み合わせを制御するための重みも学習により自動生成する(例えば、非特許文献2参照)。なお、図8は、CLEVRプログラムの学習を示す参考図である。図8で示す「find」,「transform」,・・・,「answer」および「compare」がモジュール処理の組み合わせであり、このモジュール処理の組み合わせを制御するための重みW
(t)
も学習により自動生成される。
【0006】
第1の技術および第2の技術では、学習時に、入力する質問文に対する回答に必要な各ニューラルモジュールと、モジュールの組み合わせ(プログラム)を予め用意して、学習する。すなわち、第1の技術および第2の技術は、学習時に、質問文に対する正解のプログラムのとおりにニューラルモジュールを構成して学習する。
【先行技術文献】
【非特許文献】
【0007】
“CLOSURE Assessing Systematic Generalization of CLEVR Models”,arXiv:1912.05783
“Explainable Neural Computation via Stack Neural Module Networks”,In:ECCV 2018
【発明の概要】
【発明が解決しようとする課題】
【0008】
第1の技術および第2の技術では、学習時に、質問文に対する正解のモジュールの組み合わせ(プログラム)を用意する必要がある。しかしながら、様々な入力としてのタスク(質問文)を解くために必要なモジュールの組み合わせ(プログラム)の正解を、あらかじ用意するのは困難であるという問題がある。
【0009】
本発明は、1つの側面では、学習データにはない文章入力に対しても、認識精度を向上させることを目的とする。
【課題を解決するための手段】
【0010】
1つの態様では、機械学習プログラムが、ニューラルネットワークで構成されたモジュールを複数組み合わせて構築される機械学習モデルの学習において、画像および画像に関する質問文を組とする学習データの質問文に含まれる複数の単語に対して、単語間の係り受けを解析し、解析の結果に基づいて、複数のモジュールそれぞれに対して適用する重みを決定し、前記複数のモジュールそれぞれに対して適用する重みに基づいて、前記複数のモジュールから、前記機械学習モデルで用いられるモジュールの組み合わせの選択を制御する、処理をコンピュータに実行させる。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
乗降調査装置
16日前
個人
管理装置
今日
個人
自動販売機
23日前
個人
リユース統合システム
1か月前
個人
コメント配信システム
1か月前
日本精機株式会社
投影装置
16日前
日本精機株式会社
投影システム
17日前
個人
広告提供方法
1か月前
個人
釣PAID降水確率ポイント
1か月前
個人
チラシ掲載位置表示システム
1か月前
小林クリエイト株式会社
RFタグ
23日前
個人
情報処理装置及びプログラム
1か月前
株式会社SUBARU
車両
24日前
個人
モノづくり知識情報システム
1か月前
株式会社協同印刷
防災・災害マウス
29日前
17LIVE株式会社
サーバ
16日前
株式会社ゼロボード
価格決定システム
15日前
太陽誘電株式会社
触覚生成装置
27日前
トヨタ自動車株式会社
検査装置
今日
株式会社アジラ
姿勢推定システム
14日前
株式会社カネカ
異常推定システム
1か月前
株式会社NGA
画像投稿システム
今日
株式会社イトーキ
分析装置
27日前
中国電力株式会社
ゲームシステム
1か月前
株式会社フォーバル
仕訳システム
1か月前
小林クリエイト株式会社
あて先表示システム
23日前
日本信号株式会社
自転車貸出システム
17日前
日本電気株式会社
勤務管理装置
22日前
個人
ブロックチェーンと既存網との接続方法
1か月前
個人
言語翻訳システム及びプログラム
7日前
株式会社小野測器
移動量計測システム
7日前
原田産業株式会社
衣服の注文方法
1か月前
株式会社日立製作所
演算装置
1か月前
トヨタ自動車株式会社
燃料購入システム
14日前
合同会社エリサ
発送システム
1か月前
NISSHA株式会社
指装着型コントローラー
22日前
続きを見る