TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024125264
公報種別公開特許公報(A)
公開日2024-09-18
出願番号2024013885
出願日2024-02-01
発明の名称機械学習モデル学習用データセット生成装置及びその方法
出願人株式会社ソニー・インタラクティブエンタテインメント
代理人個人
主分類G06N 20/00 20190101AFI20240910BHJP(計算;計数)
要約【解決手段】機械学習モデルを訓練するためのデータを生成する装置は、連続する画像フレームからなるビデオデータを受信する受信ユニットと、複数の前記連続する画像フレームを記憶する記憶ユニットと、ターゲット画像フレームに関して、記憶された画像フレームのサブセットを選択する選択ユニットと、を備える。前記サブセットは、前記機械学習モデルに対して、ターゲット画像フレームに関連するコンテキストデータを提供する。前記選択ユニットは、サンプリング値を連続的に生成する。連続的に生成されるサンプリング値間の差は、連続的に生成される各サンプリング値とともに増加する。前記選択ユニットは、連続的に生成されたサンプリング値ごとに、記憶された画像フレームからそれぞれの画像フレームを選択する。それぞれの画像フレームのフレーム番号は、連続的に生成されたサンプリング値の最新の値と一致する。
【選択図】図2
特許請求の範囲【請求項1】
機械学習モデルを訓練するためのデータを生成する装置であって、
連続する画像フレームからなるビデオデータを受信する受信ユニットと、
複数の前記連続する画像フレームを記憶する記憶ユニットと、
ターゲット画像フレームに関して、記憶された画像フレームのサブセットを選択する選択ユニットと、
を備え、
前記サブセットは、前記機械学習モデルに対して、ターゲット画像フレームに関連するコンテキストデータを提供し、
前記選択ユニットは、サンプリング値を連続的に生成し、
連続的に生成されるサンプリング値間の差は、連続的に生成される各サンプリング値とともに増加し、
前記選択ユニットは、連続的に生成されたサンプリング値ごとに、記憶された画像フレームからそれぞれの画像フレームを選択し、
それぞれの画像フレームのフレーム番号は、連続的に生成されたサンプリング値の最新の値と一致することを特徴とする装置。
続きを表示(約 920 文字)【請求項2】
前記それぞれの画像フレームのフレーム番号は、
i.ターゲット画像フレーム
ii.以前に選択された画像フレーム
のいずれかに関するものであることを特徴とする請求項1に記載の装置。
【請求項3】
前記選択ユニットは、サンプリング関数を用いてサンプリング値を連続的に生成し、
前記サンプリング関数は数学的関数であることを特徴とする請求項1に記載の装置。
【請求項4】
連続的に生成されるサンプリング値間の差が、連続的に生成される各サンプリング値とともに増加する程度が、前記サンプリング関数を構成する1つ以上のサンプリングパラメータのそれぞれの値に対応することを特徴とする請求項3に記載の装置。
【請求項5】
前記サンプリングパラメータの少なくとも1つは、係数、底または指数の少なくとも1つであることを特徴とする請求項4に記載の装置。
【請求項6】
前記ターゲット画像フレームの画像コンテンツに基づいて、前記サンプリングパラメータの値を決定する値決定ユニットを備えることを特徴とする請求項4または5に記載の装置。
【請求項7】
サンプリングパラメータが基数または指数である場合、当該サンプリングパラメータの値は1より大きいことを特徴とする請求項4から6のいずれかに記載の装置。
【請求項8】
特定の画像フレームに関連する1つ以上の指標に基づいて、記憶された画像フレームのうちの特定の画像フレームをターゲット画像フレームとするか否かを決定するフレームノミネーションユニットを備えることを特徴とする請求項4から7のいずれかに記載の装置。
【請求項9】
前記特定の画像フレームに関連する1つ以上の指標は、当該画像フレームに関連するメタデータを含むことを特徴とする請求項8に記載の装置。
【請求項10】
前記特定の画像フレームに関連する1つ以上の指標は、当該画像フレームの画像コンテンツを含むことを特徴とする請求項8または9に記載の装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、機械学習モデルを学習するためのデータセットを生成するための装置及びその方法に関する。
続きを表示(約 1,800 文字)【背景技術】
【0002】
本明細書において提供される「背景」の説明は、本開示の文脈を一般的に示すことを目的とする。
【0003】
模倣学習(IL)は、環境(現実であっても仮想であってもよい)の現在の状態に対して最も適切な行動および/または方針を選択するよう機械学習エージェントを訓練しようとする点で、強化学習に似ている。しかしILは、強化学習とは異なり、エージェントによる行動/方針選択の動機付けに報酬関数を使わない。むしろILは、環境状態だけでなく、そのような環境状態に対応して取るべき最も適切な(または少なくとも望ましい)行動/方針からなる訓練データセットをエージェントに提供する。これらの行動/方針は、環境内に位置する要素(映画、ビデオゲームなどのキャラクター/アバター)によって実行される。
【0004】
この訓練データセットがILエージェントに提供されると、ILエージェントは、要素によって実行されたアクション/ポリシーを模倣することを学習し、また、アクション/ポリシーが実行されたコンテキスト(環境状態)を学習する。これにより、訓練されたILエージェントのその後の利用において、同様のコンテキストが発生した場合、エージェントは、模倣することを学習したアクション/ポリシーを実行することができる。その結果、最も適切/望ましい方法でコンテキストに対応することができる。
【0005】
ILの有効性(すなわち、最も適切な/望ましい方法でコンテキストに対応する能力)は、訓練データによってカバーされる期間に依存する。非限定的な例として、特にビデオゲーム用のILエージェントは、近接攻撃をかわすように訓練されることがある。敵の近接攻撃とそれに対応するアバターのかわす動作のみを描写したビデオ映像を使ってILエージェントを訓練した場合、敵がアバターに向かって走ったり、敵が拳を引いて近接攻撃を行ったり、その後アバターが近接攻撃をかわしたりする様子を描写したビデオ映像を使ってILエージェントを訓練した場合に比べて、ILエージェントは、その後のゲームプレイにおいて、かわす動作があまり効果的でない可能性がある。これは、前者の訓練データセットでは、後者と異なり、ILエージェントが身をかわすタイミングを計るために頼りにする攻撃前の手がかりが得られないからである。従って、前者の訓練データセットを使って訓練した場合、ILエージェントはかわすタイミングを誤る可能性がある(例えば、ILエージェントは、かわすアニメーションを開始する前に、敵の拳が自分に向かって動き出すのを待つ可能性がある)。この場合、襲ってくる敵の一撃をかわすことができない。
【発明の概要】
【発明が解決しようとする課題】
【0006】
ILエージェントの有効性は、訓練データセットがカバーする期間に依存する。しかし、より長い期間をカバーするために訓練データセット内のデータ量を単純に増やすこと(例えば、ビデオフレーム数を単純に増やすこと)は、ILエージェントによるメモリの過剰使用につながるため望ましくない。この過剰なメモリ使用は、ILエージェントを実行するコンピューティングシステムの性能に影響を与える可能性がある。
【0007】
さらに、訓練データセットのデータ量の大幅な増加は、訓練データセットによってカバーされる期間の大幅な増加と必ずしも相関しない。例えば、ビデオゲームのフレームレートが増加すると、所与の期間内に収まるビデオフレームの数が増加するため、所与の期間内に構成されるビデオデータの量も増加する。補足として、このフレームレートの増加は、よく知られている消失勾配の問題により、ILエージェントの不十分な訓練を引き起こす可能性さえある。
【0008】
本発明は、この問題を緩和または軽減しようとするものである。
【課題を解決するための手段】
【0009】
第1の態様では、請求項1において、機械学習モデルを訓練するためのデータセットを生成する装置が提供される。
【0010】
別の態様では、請求項13において、機械学習モデルを訓練するためのデータセットを生成する方法が提供される。
(【0011】以降は省略されています)

特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する

関連特許

個人
防災情報システム
1か月前
個人
情報処理システム
18日前
日本精機株式会社
表示装置
11日前
個人
指先受の付いたマウス。
14日前
個人
都市経営シミュレーション
3日前
個人
介護者指名システム
25日前
國立臺灣大學
操作補助システム
4日前
エムケー精工株式会社
洗車場システム
27日前
個人
支援システム及び支援方法
5日前
株式会社Haul
採用支援方法
26日前
株式会社Asuka
本人認証方法
28日前
個人
災害情報表示システム
1か月前
個人
すべて大吉となるおみくじ制作装置
10日前
株式会社美好屋商店
広告システム
3日前
トヨタ自動車株式会社
表認識方法
1か月前
株式会社にしがき
会員権システム
1か月前
トヨタ自動車株式会社
画像処理装置
27日前
株式会社mov
情報処理装置
25日前
日本信号株式会社
料金精算システム
10日前
トヨタ自動車株式会社
情報処理装置
1か月前
株式会社JVCケンウッド
処理装置
1か月前
トヨタ自動車株式会社
画像処理装置
1か月前
株式会社デンソー
演算処理装置
3日前
個人
オフラインバックアップシステム
20日前
長屋印刷株式会社
思い出の品保管方法
1か月前
株式会社アイラボ
ICタグ広告
17日前
株式会社mov
情報処理システム
18日前
富士通株式会社
プロセッサ
3日前
個人
情報蓄積・検索利用システム
27日前
シャープ株式会社
表示装置
11日前
株式会社ファンクリエイト
逆走検出装置
3日前
個人
ネットワークコンピュータシステム
24日前
トヨタ自動車株式会社
電力供給システム
24日前
シャープ株式会社
課金明細発行方法
1か月前
東京都公立大学法人
企業価値評価システム
11日前
トヨタ自動車株式会社
車両点検装置
4日前
続きを見る