TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024147528
公報種別公開特許公報(A)
公開日2024-10-16
出願番号2024060102
出願日2024-04-03
発明の名称モデル訓練方法、モデル訓練装置および記憶媒体
出願人株式会社リコー
代理人個人,個人
主分類G06F 40/56 20200101AFI20241008BHJP(計算;計数)
要約【課題】本発明はモデル訓練方法、装置および記憶媒体を提供する。
【解決手段】本発明の実施例はモデルの訓練過程において、疑問詞に対応する第1提示テキストとテキストサンプルを回答選択モデルの入力とし、回答選択モデルに特定タイプの回答候補を出力させ、また、疑問詞に対応する第2提示テキスト、テキストサンプル及び回答サンプルを質問生成モデルの入力とし、同じ疑問詞およびその解釈を含む提示テキストによって回答選択モデルと質問生成モデルを関連付けて、選択された回答候補と関連する質問を質問生成モデルに生成させることにより、モデルが生成する質問回答対の性能が改善される。
【選択図】図1
特許請求の範囲【請求項1】
コンピュータが実行するモデル訓練方法であって、
目標言語中の疑問詞及びその解釈に基づいて、前記疑問詞に対応する、前記疑問詞を含む質問に対して回答候補の選択を提示する第1提示テキストと前記疑問詞を含む質問の生成を提示する第2提示テキストを生成し、
テキストサンプル、疑問詞を含む質問サンプル、及び前記質問サンプルに対応する回答サンプルを含む複数の原始訓練サンプルを取得し、
原始訓練サンプル毎に、前記原始訓練サンプルのテキストサンプル、回答サンプル、質問サンプル中の疑問詞に対応する第1提示テキストを用いて、第1訓練サンプルを生成し、複数の前記第1訓練サンプルを含む第1訓練セットを得、また、前記原始訓練サンプルのテキストサンプル、質問サンプル、回答サンプル、質問サンプル中の疑問詞に対応する第2提示テキストを用いて、第2訓練サンプルを生成し、複数の前記第2訓練サンプルを含む第2訓練セットを得、及び
前記第1訓練セットを用いて、回答選択モデルを訓練し、前記第2訓練セットを用いて、質問生成モデルを訓練する、ことを含む、
ことを特徴とするモデル訓練方法。
続きを表示(約 2,200 文字)【請求項2】
前記第1訓練セットが少なくとも一つの第3訓練サンプルをさらに含み、
第1テキストサンプルに対して、当該第1テキストサンプルに対応する全ての質問サンプルに含まれない第1疑問詞を特定し、前記第1疑問詞に対応する第1提示テキスト、空白回答及び前記第1テキストサンプルを用いて前記第3訓練サンプルを形成する
ことを特徴とする請求項1に記載のモデル訓練方法。
【請求項3】
前記第1訓練セットを用いて回答選択モデルを訓練し、前記第2訓練セットを用いて質問生成モデルを訓練することは、
前記第1訓練セットにおける訓練サンプル毎の第1提示テキストとテキストサンプルを回答選択モデルに入力し、前記回答選択モデルにより出力される対応する回答サンプルを目標として、前記回答選択モデルを訓練し、訓練された前記回答選択モデルを生成し、及び
前記第2訓練セットにおける訓練サンプル毎の第2提示テキスト、テキストサンプル及び回答サンプルを質問生成モデルに入力し、前記質問生成モデルにより出力される対応する問題サンプルを目標として、前記質問生成モデルを訓練し、訓練された前記質問生成モデルを生成する、ことを含む、
ことを特徴とする請求項1に記載のモデル訓練方法。
【請求項4】
目標テキストに対して、前記目標言語中の疑問詞から第2疑問詞を選択し、
前記第2疑問詞に対応する第1提示テキストと前記目標テキストを、前記回答選択モデルに入力して、前記回答選択モデルが出力する目標回答を得、及び
前記第2疑問詞に対応する第2提示テキスト、前記目標テキスト及び前記目標回答を、前記質問生成モデルに入力して、前記質問生成モデルが出力する目標質問を得る、ことをさらに含む、
ことを特徴とする請求項1に記載のモデル訓練方法。
【請求項5】
前記疑問詞に対応する第1提示テキストと第2提示テキストはそれぞれ前記疑問詞と前記疑問詞の解釈を含む、
ことを特徴とする請求項1に記載のモデル訓練方法。
【請求項6】
前記回答選択モデルは自然言語理解モデルであり、前記質問生成モデルは自然言語生成モデルである、
ことを特徴とする請求項1に記載のモデル訓練方法。
【請求項7】
目標言語中の疑問詞及びその解釈に基づいて、前記疑問詞に対応する、前記疑問詞を含む質問に対して回答候補の選択を提示する第1提示テキストと前記疑問詞を含む質問の生成を提示する第2提示テキストを生成する第1生成モジュールと、
テキストサンプル、疑問詞を含む質問サンプル、前記質問サンプルに対応する回答サンプルを含む複数の原始訓練サンプルを取得する第1取得モジュールと、
原始訓練サンプル毎に、前記原始訓練サンプルのテキストサンプル、回答サンプル、質問サンプル中の疑問詞に対応する第1提示テキストを用いて、第1訓練サンプルを生成し、複数の前記第1訓練サンプルを含む第1訓練セットを得、また、前記原始訓練サンプルのテキストサンプル、質問サンプル、回答サンプル、質問サンプル中の疑問詞に対応する第2提示テキストを用いて、第2訓練サンプルを生成し、複数の前記第2訓練サンプルを含む第2訓練セットを得る第2生成モジュールと、
前記第1訓練セットを用いて、回答選択モデルを訓練し、前記第2訓練セットを用いて、質問生成モデルを訓練する訓練モジュールと、を含む、
ことを特徴とするモデル訓練装置。
【請求項8】
前記第1訓練セットが少なくとも一つの第3訓練サンプルをさらに含み、
第1テキストサンプルに対して、当該第1テキストサンプルに対応する全ての質問サンプルに含まれない第1疑問詞を特定し;前記第1疑問詞に対応する第1提示テキスト、空白回答及び前記第1テキストサンプルを用いて前記第3訓練サンプルを形成する第3生成モジュールを含む、
ことを特徴とする請求項7に記載のモデル訓練装置。
【請求項9】
前記訓練モジュールは、
前記第1訓練セットにおける訓練サンプル毎の第1提示テキストとテキストサンプルを回答選択モデルに入力し、前記回答選択モデルにより出力される対応する回答サンプルを目標として、前記回答選択モデルを訓練し、訓練された前記回答選択モデルを生成し、及び
前記第2訓練セットにおける訓練サンプル毎の第2提示テキスト、テキストサンプル及び回答サンプルを質問生成モデルに入力し、前記質問生成モデルにより出力される対応する問題サンプルを目標として、前記質問生成モデルを訓練し、訓練された前記質問生成モデルを生成する、
ことを特徴とする請求項7または8に記載のモデル訓練装置。
【請求項10】
目標テキストに対して、前記目標言語中の疑問詞から第2疑問詞を選択し、前記第2疑問詞に対応する第1提示テキストと前記目標テキストを、前記回答選択モデルに入力して、前記回答選択モデルが出力する目標回答を得、前記第2疑問詞に対応する第2提示テキスト、前記目標テキスト及び前記目標回答を、前記質問生成モデルに入力して、前記質問生成モデルが出力する目標質問を得るモデル応用モジュールを更に含む、
ことを特徴とする請求項7に記載のモデル訓練装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は機械学習と自然言語処理(NLP,Natural Language Processing)技術に関し、具体的には、モデル訓練方法、モデル訓練装置および記憶媒体に関する。
続きを表示(約 2,300 文字)【背景技術】
【0002】
質問生成技術は自然言語処理分野における重要な技術の一つである。質問生成の目的は、ユーザが指定した1つのテキストに対して、そのテキストに関連するいくつかの質問を生成し、テキストにおいてこれらの質問の回答を教示すことである。質問生成技術は、質問と回答の組合せ、すなわち質問回答対(本文では、単にQ&A対と呼ぶこともある)を自動的に生成するために、Q&Aシステムや検索エンジンで広く用いられている。Q&Aシステムと検索エンジンには、多数の質問回答対が必要である。Q&Aシステムにおいて、自動質問回答方法の一つとして、類似度アルゴリズムを用いて、ユーザの質問を予めデータベース内で作成された質問回答対にマッチングさせて回答を得る方法がある。一方、検索エンジンは、ユーザの質問に対して検索されたテキストの中から正解を見つける機械読解モデルを用いている。しかし、機械読解モデルは大量のQ&A対で訓練する必要がある。これらのQ&A対の生成には多くの時間と労力が必要であり、場合によってはタグ付け者にある程度の専門性が要求される。しかし、質問生成技術は、自動的にQ&A対を生成することにより、Q&Aシステムや検索エンジンの構築コストを大幅に削減される。
【0003】
現在、主流の質問生成システムは、通常一つの回答選択モデルと一つの質問生成モデルを含む。そのうち、回答選択モデルはテキストから回答候補を選択し、質問生成モデルはテキストと回答選択モデルより選択された回答候補に基づいて関連する質問を生成する。従来の質問生成方法の一つは、一つの回答選択モデル(sequence-to-sequenceモデル)を訓練することで複数のキーフレーズ(回答候補)を生成する。この回答選択モデルは、大規模なQ&Aデータ集(SQuAD)から人手で選択された回答から、回答候補により高い確率を割り当てることを学習した。また、この方法は、選択された回答候補に基づいて質問を生成する質問生成モデルを提供する。この方法は、回答選択モデルが訓練において、テキスト内のすべてのタイプの回答候補を同時に選択することを学習するため、モデルが質問価値の特徴を捉え難い欠点がある。なお、質問生成モデルは、回答を選択した後に、質問生成を支援するために回答選択モデルから追加情報(回答のタイプなど)が得られないため、選択された回答に関連しない質問を生成してしまう可能性がある。
【0004】
そのため、選択された回答と生成された質問の関連性を向上させる質問生成技術が求められている。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明の少なくとも一つの実施例はモデル訓練方法、装置および記憶媒体を提供し、回答選択モデルより選択される回答と質問生成モデルより生成される質問の関連性を向上させることを目的とする。
【0006】
語意マッチングタスクの精度を向上させる。
【課題を解決するための手段】
【0007】
本発明は、上記技術問題を解決するために、以下の技術を提供する。
【0008】
まず、本発明の実施例は、目標言語中の疑問詞及びその解釈に基づいて、前記疑問詞に対応する、前記疑問詞を含む質問に対して回答候補の選択を提示する第1提示テキストと前記疑問詞を含む質問の生成を提示する第2提示テキストを生成し;テキストサンプル、疑問詞を含む質問サンプル、前記質問サンプルに対応する回答サンプルを含む複数の原始(オリジナル)訓練サンプルを取得し;原始訓練サンプル毎に、前記原始訓練サンプルのテキストサンプル、回答サンプル、質問サンプル中の疑問詞に対応する第1提示テキストを用いて、第1訓練サンプルを生成し、複数の前記第1訓練サンプルを含む第1訓練セットを得、また、前記原始訓練サンプルのテキストサンプル、質問サンプル、回答サンプル、質問サンプル中の疑問詞に対応する第2提示テキストを用いて、第2訓練サンプルを生成し、複数の前記第2訓練サンプルを含む第2訓練セットを得る第2生成モジュールと;前記第1訓練セットを用いて、回答選択モデルを訓練し、前記第2訓練セットを用いて、質問生成モデルを訓練する、ことを含む、ことを特徴とするモデル訓練方法を提供する。
【0009】
オプションとして、前記第1訓練セットが少なくとも一つの第3訓練サンプルをさらに含み、前記第3訓練サンプルは、第1テキストサンプル毎に対応する全ての質問サンプルのいずれにも第1疑問詞が含まれないことを判定し;前記第1疑問詞に対応する第1提示テキスト、空白回答及び前記第1テキストサンプルを用いて形成される。
【0010】
また、オプションとして、前記第1訓練セットを用いて回答選択モデルを訓練し、前記第2訓練セットを用いて質問生成モデルを訓練することは、前記第1訓練セットにおける訓練サンプル毎の第1提示テキストとテキストサンプルを回答選択モデルに入力し、前記回答選択モデルにより出力される対応する回答サンプルを目標として、前記回答選択モデルを訓練し、訓練された前記回答選択モデルを生成し;前記第2訓練セットにおける訓練サンプル毎の第2提示テキスト、テキストサンプル及び回答サンプルを質問生成モデルに入力し、前記質問生成モデルにより出力される対応する問題サンプルを目標として、前記質問生成モデルを訓練し、訓練された前記質問生成モデルを生成する、ことを含む。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

株式会社リコー
液体吐出装置
12日前
株式会社リコー
画像形成システム
7日前
株式会社リコー
栽培方法、および栽培システム
11日前
株式会社リコー
シート搬送装置及び画像形成装置
4日前
株式会社リコー
投受光装置、測距システム及び測距方法
4日前
株式会社リコー
画像処理装置、原稿種認識方法、プログラム
5日前
株式会社リコー
多層構造体、積層体及び多層構造体の製造方法
11日前
株式会社リコー
モデル訓練方法、モデル訓練装置および記憶媒体
6日前
株式会社リコー
生産管理システム、プログラムおよび生産管理方法
7日前
株式会社リコー
液体収容容器、インクカートリッジ、液体吐出装置
12日前
株式会社リコー
液体吐出ヘッド、液体吐出ユニット及び液体を吐出する装置
11日前
株式会社リコー
液体吐出ヘッド、液体吐出ユニット及び液体を吐出する装置
11日前
株式会社リコー
移動体システム、情報処理方法、情報処理装置、及びプログラム
12日前
株式会社リコー
移動体システム、移動体、情報処理システム、設定方法、プログラム
6日前
株式会社リコー
画像処理装置、画像形成装置、画像処理方法及び画像処理プログラム
6日前
株式会社リコー
結晶形成方法、結晶形成装置、画像形成方法、及び立体造形物の製造方法
6日前
株式会社リコー
マスターバッチ、再生プラスチック、及び、再生プラスチックの製造方法
5日前
株式会社リコー
画像処理装置、読取装置、画像形成装置、データ管理システム、生体イメージング装置および方法
7日前
株式会社リコー
情報処理装置、印刷システム、印刷方法及びプログラム
4日前
株式会社リコー
重合体、共重合体、インク、インク収容容器、画像形成方法、画像形成装置、及び太陽電池バックシート
11日前
株式会社リコー
撮像装置、画像通信システム、画像処理方法、プログラム
11日前
株式会社リコー
容器及び収容体、並びに容器の製造方法及び容器の製造装置
4日前
株式会社リコー
情報処理システム、情報処理装置、プログラム及び情報処理方法
11日前
株式会社リコー
会議支援システム、会議支援装置、会議支援方法及びプログラム
11日前
個人
GPSロガー
27日前
個人
デトろぐシステム
26日前
個人
情報処理システム
1か月前
個人
マウス用テーブル
13日前
日本精機株式会社
表示装置
1か月前
個人
管理装置
19日前
個人
指先受の付いたマウス。
1か月前
個人
介護者指名システム
1か月前
個人
都市経営シミュレーション
1か月前
個人
契約管理サーバ
18日前
個人
管理装置
21日前
アズビル株式会社
防爆装置
7日前
続きを見る