TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024166908
公報種別公開特許公報(A)
公開日2024-11-29
出願番号2023083333
出願日2023-05-19
発明の名称モデル生成方法、モデル生成システム
出願人トヨタ自動車株式会社
代理人弁理士法人高田・高橋国際特許事務所
主分類G06T 7/00 20170101AFI20241122BHJP(計算;計数)
要約【課題】映像の中から入力センテンスの内容とマッチするマッチング区間を抽出する映像抽出モデルであって、汎化性能が高い映像抽出モデルの生成を可能とする技術を提供する。
【解決手段】本開示に係るモデル生成方法は、ベースセンテンスとサブセンテンスを映像抽出モデルに入力して訓練映像の中からベースマッチング区間とサブマッチング区間を抽出することを含む。モデル生成方法は、さらに、正解区間、ベースマッチング区間、及びサブマッチング区間それぞれに応じた訓練映像の特徴量に基づいて、ベースセンテンスを再構成する学習タスクを処理することにより損失を算出することと、正解区間に関する第1損失がベースマッチング区間に関する第2損失よりも小さくなり、且つ、第2損失がサブマッチング区間に関するサブ損失よりも小さくなるように映像抽出モデルの機械学習を実施することと、を含む。
【選択図】図3
特許請求の範囲【請求項1】
映像の中から入力センテンスの内容とマッチするマッチング区間を抽出する映像抽出モデルを生成するモデル生成方法であって、
前記モデル生成方法は、コンピュータによって実行され、
前記モデル生成方法は、複数のセンテンスを前記映像抽出モデルに入力して訓練映像の中から前記複数のセンテンスそれぞれに対する複数のマッチング区間を抽出することを含み、
前記複数のセンテンスは、ベースセンテンスと、前記ベースセンテンスより短い少なくとも1つのサブセンテンスを含み、
前記少なくとも1つのサブセンテンスは、
前記ベースセンテンスに含まれる単語を含み、前記ベースセンテンスと無関係のノイズ単語を含まない正例サブセンテンスと、
前記ノイズ単語を少なくとも含む負例サブセンテンスと、
のうち少なくとも1つを含み、
前記複数のマッチング区間は、前記ベースセンテンスに対するベースマッチング区間と、前記少なくとも1つのサブセンテンスに対する少なくとも1つのサブマッチング区間と、を含み、
前記モデル生成方法は、さらに、
正解区間に応じた前記訓練映像の特徴量に基づいて、前記ベースセンテンスを再構成する学習タスクを処理することにより第1損失を算出することと、
前記ベースマッチング区間に応じた前記訓練映像の特徴量に基づいて、前記学習タスクを処理することにより第2損失を算出することと、
前記少なくとも1つのサブマッチング区間に応じた前記訓練映像の特徴量に基づいて、前記学習タスクを処理することにより少なくとも1つのサブ損失を算出することと、
前記第1損失が前記第2損失よりも小さくなり、且つ、前記第2損失が前記少なくとも1つのサブ損失よりも小さくなるように前記映像抽出モデルの機械学習を実施することと、
を含む
モデル生成方法。
続きを表示(約 1,800 文字)【請求項2】
請求項1に記載のモデル生成方法であって、
前記少なくとも1つのサブセンテンスは、前記正例サブセンテンスと前記負例サブセンテンスの両方を含み、
前記少なくとも1つのサブマッチング区間は、前記正例サブセンテンスに対する正例サブマッチング区間と、前記負例サブセンテンスに対する負例サブマッチング区間と、を含み、
前記少なくとも1つのサブ損失は、前記正例サブマッチング区間に応じた前記訓練映像の特徴量に基づいて前記学習タスクを処理することにより算出される正例サブ損失と、前記負例サブマッチング区間に応じた前記訓練映像の特徴量に基づいて前記学習タスクを処理することにより算出される負例サブ損失と、を含み、
前記機械学習は、さらに前記正例サブ損失が前記負例サブ損失よりも小さくなるように実施される
モデル生成方法。
【請求項3】
請求項2に記載のモデル生成方法であって、
前記負例サブセンテンスは、
前記ベースセンテンスに含まれる単語と前記ノイズ単語の両方を含む第1負例サブセンテンスと、
前記ベースセンテンスに含まれる単語を含まず、前記ノイズ単語を含む第2負例サブセンテンスと、
を含み、
前記負例サブマッチング区間は、前記第1負例サブセンテンスに対する第1負例サブマッチング区間と、前記第2負例サブセンテンスに対する第2負例サブマッチング区間と、を含み、
前記負例サブ損失は、前記第1負例サブマッチング区間に応じた前記訓練映像の特徴量に基づいて前記学習タスクを処理することにより算出される第1負例サブ損失と、前記第2負例サブマッチング区間に応じた前記訓練映像の特徴量に基づいて前記学習タスクを処理することにより算出される第2負例サブ損失と、を含み、
前記機械学習は、さらに前記第1負例サブ損失が前記第2負例サブ損失よりも小さくなるように実施される
モデル生成方法。
【請求項4】
請求項1乃至請求項3のいずれか1項に記載のモデル生成方法であって、
前記学習タスクは、前記ベースセンテンスの中から一部の単語をマスクすることにより生成され、マスクされた単語を推論するタスクである
モデル生成方法。
【請求項5】
映像の中から入力センテンスの内容とマッチするマッチング区間を抽出する映像抽出モデルを生成するモデル生成システムであって、
1又は複数のプロセッサを備え、
前記1又は複数のプロセッサは、複数のセンテンスを前記映像抽出モデルに入力して訓練映像の中から前記複数のセンテンスそれぞれに対する複数のマッチング区間を抽出する処理を実行するように構成され、
前記複数のセンテンスは、ベースセンテンスと、前記ベースセンテンスより短い少なくとも1つのサブセンテンスを含み、
前記少なくとも1つのサブセンテンスは、
前記ベースセンテンスに含まれる単語を含み、前記ベースセンテンスと無関係のノイズ単語を含まない正例サブセンテンスと、
前記ノイズ単語を少なくとも含む負例サブセンテンスと、
のうち少なくとも1つを含み、
前記複数のマッチング区間は、前記ベースセンテンスに対するベースマッチング区間と、前記少なくとも1つのサブセンテンスに対する少なくとも1つのサブマッチング区間と、を含み、
前記1又は複数のプロセッサは、さらに、
正解区間に応じた前記訓練映像の特徴量に基づいて、前記ベースセンテンスを再構成する学習タスクを処理することにより第1損失を算出する処理と、
前記ベースマッチング区間に応じた前記訓練映像の特徴量に基づいて、前記学習タスクを処理することにより第2損失を算出する処理と、
前記少なくとも1つのサブマッチング区間に応じた前記訓練映像の特徴量に基づいて、前記学習タスクを処理することにより少なくとも1つのサブ損失を算出する処理と、
前記第1損失が前記第2損失よりも小さくなり、且つ、前記第2損失が前記少なくとも1つのサブ損失よりも小さくなるように前記映像抽出モデルの機械学習を実施する処理と、
を実行するように構成されている
モデル生成システム。

発明の詳細な説明【技術分野】
【0001】
本開示は、機械学習モデルの生成に関する。
続きを表示(約 1,400 文字)【背景技術】
【0002】
近年、様々なタスクに対して、各タスクを適切に処理することを可能とするための機械学習モデルの生成に関する技術が提案されている。
【0003】
例えば、特許文献1には、複数の異なるモダリティのデータを入力として入力とは異なるモダリティのデータを出力するタスクを処理するための機械学習モデルの生成に関する技術が開示されている。
【0004】
その他、本技術分野の技術レベルを示す文献として以下の特許文献2及び特許文献3がある。
【先行技術文献】
【特許文献】
【0005】
国際公開第2021/182199号
特開2022-072444号公報
特開2021-189892号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
1つのタスクとして、センテンスをクエリとし、映像の中からセンテンスの内容とマッチする区間を抽出するタスクがある。従来、このようなタスクを処理するための機械学習モデル(以下、単に「映像抽出モデル」と呼ぶ。)では、クエリとなる様々なセンテンスに対して十分な汎化性能を得ることができていない。
【0007】
本開示の1つの目的は、入力となる様々なセンテンスに対して汎化性能が高い映像抽出モデルの生成を可能とする技術を提供することにある。
【課題を解決するための手段】
【0008】
本開示の第1の観点は、映像の中から入力センテンスの内容とマッチするマッチング区間を抽出する映像抽出モデルを生成するモデル生成方法に関する。
【0009】
第1の観点に係るモデル生成方法は、コンピュータによって実行され、複数のセンテンスを映像抽出モデルに入力して訓練映像の中から複数のセンテンスそれぞれに対する複数のマッチング区間を抽出することを含む。複数のセンテンスは、ベースセンテンスと、ベースセンテンスより短い少なくとも1つのサブセンテンスを含む。少なくとも1つのサブセンテンスは、ベースセンテンスに含まれる単語を含み、ベースセンテンスと無関係のノイズ単語を含まない正例サブセンテンスと、ノイズ単語を少なくとも含む負例サブセンテンスと、のうち少なくとも1つを含む。複数のマッチング区間は、ベースセンテンスに対するベースマッチング区間と、少なくとも1つのサブセンテンスに対する少なくとも1つのサブマッチング区間と、を含む。モデル生成方法は、さらに、正解区間に応じた訓練映像の特徴量に基づいて、ベースセンテンスを再構成する学習タスクを処理することにより第1損失を算出することと、ベースマッチング区間に応じた訓練映像の特徴量に基づいて、ベースセンテンスを再構成する学習タスクを処理することにより第2損失を算出することと、少なくとも1つのサブマッチング区間に応じた訓練映像の特徴量に基づいて、ベースセンテンスを再構成する学習タスクを処理することにより少なくとも1つのサブ損失を算出することと、第1損失が第2損失よりも小さくなり、且つ、第2損失が少なくとも1つのサブ損失よりも小さくなるように映像抽出モデルの機械学習を実施することと、を含む。
【0010】
本開示の第2の観点は、映像の中から入力センテンスの内容とマッチするマッチング区間を抽出する映像抽出モデルを生成するモデル生成システムに関する。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
認証システム
10日前
個人
保証金管理システム
4日前
個人
鑑定証明システム
10日前
アズビル株式会社
防爆装置
1か月前
個人
業界地図作成システム
1か月前
個人
人的価値発掘システム
1か月前
株式会社セガフェイブ
遊戯機
1か月前
株式会社宗建
SNSサーバー
1か月前
株式会社MRC
集客システム
4日前
個人
技術マッチングシステム
16日前
キヤノン電子株式会社
情報処理装置
1か月前
キヤノン株式会社
印刷制御装置
25日前
ミサワホーム株式会社
管理装置
1か月前
ミサワホーム株式会社
システム
1か月前
株式会社ジール
文章の分析装置
1か月前
トヨタ自動車株式会社
分析装置
4日前
キヤノン株式会社
印刷管理装置
2日前
株式会社ネットブリッジ
展示販売装置
11日前
個人
配送システムおよび同包箱
1か月前
個人
文字入力方法、文字入力プログラム
17日前
アスエネ株式会社
森林管理の方法
1か月前
大同特殊鋼株式会社
棒材計数装置
1か月前
個人
動作のデザイン評価の方法及び装置
1か月前
オムロン株式会社
認証中継サーバ
1か月前
ミサワホーム株式会社
プログラム
10日前
株式会社インザック
コンピュータシステム
16日前
トヨタ自動車株式会社
車載機
10日前
トヨタ自動車株式会社
部品管理装置
10日前
株式会社チノー
ユーザ認証システム
1か月前
個人
口座悪用を防止する口座管理システム
1か月前
トヨタ自動車株式会社
作業評価装置
23日前
株式会社LIFE
送迎管理システム
3日前
個人
後払いポイントシステム「先用後利」
11日前
株式会社八咲
イベント管理システム
1か月前
三菱電機モビリティ株式会社
メモリ制御装置
1か月前
ミサワホーム株式会社
水素配送システム
1か月前
続きを見る