TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025012742
公報種別
公開特許公報(A)
公開日
2025-01-24
出願番号
2023115813
出願日
2023-07-14
発明の名称
動作生成装置、動作生成モデル学習装置、及びプログラム
出願人
日本電信電話株式会社
,
国立大学法人 東京大学
代理人
弁理士法人志賀国際特許事務所
主分類
G06N
3/0455 20230101AFI20250117BHJP(計算;計数)
要約
【課題】本発明は、フレームレベルでイベントに応じた動作生成が可能となる動作生成装置、動作生成モデル学習装置、及びプログラムを提供することを目的としている。
【解決手段】動作生成装置は、潜在変数を求めるエンコーダと、潜在変数から動作を生成するデコーダと、を備え、潜在変数は、フレームレベルのイベント編集を実現するため、イベントごとに遷移するように制約が与えられている。
【選択図】図1
特許請求の範囲
【請求項1】
潜在変数を求めるエンコーダと、
前記潜在変数から動作を生成するデコーダと、を備え、
前記潜在変数は、フレームレベルのイベント編集を実現するため、イベントごとに遷移するように制約が与えられている、動作生成装置。
続きを表示(約 1,300 文字)
【請求項2】
前記エンコーダは、テキストから前記潜在変数を求め、
前記テキストから動作を生成する、請求項1に記載の動作生成装置。
【請求項3】
前記エンコーダは、動作から前記潜在変数を求め、
前記動作から動作を再構成する、請求項1に記載の動作生成装置。
【請求項4】
前記潜在変数の時間方向の長さを調整することで前記イベントのフレーム数を変え、
または、前記潜在変数の値を変えることで前記イベントの特性を変え、
あるいは、第1の前記潜在変数と第2の前記潜在変数の間に新たな潜在変数を挿入することで新たなイベントの挿入を行うことで生成対象を編集できる、請求項1に記載の動作生成装置。
【請求項5】
学習データは、テキストと動作のペアデータであり、
前記動作から第1の潜在変数を推定する動作エンコーダと、
推定された前記第1の潜在変数から動作を再構成するデコーダと、
前記テキストから第2の潜在変数を推定するテキストエンコーダと、
学習部と、を備え、
前記学習部は、
前記第1の潜在変数から動作を再構成した時に、前記動作エンコーダの入力動作と前記デコーダの出力動作が近づくようにする学習と、
前記第2の潜在変数を推定した時に、前記第1の潜在変数と前記第2の潜在変数が近づくようにする学習と、を同時に行うことによって前記第1の潜在変数と前記第2の潜在変数を最適化する、
動作生成モデル学習装置。
【請求項6】
前記学習部は、
前記潜在変数の学習の際に、前記潜在変数の切り替えに対して、切り替えが必要な時のみ遷移を許容される制約を課しながら学習する、請求項5に記載の動作生成モデル学習装置。
【請求項7】
前記学習部は、
前記第1の潜在変数に関する第1の損失関数と、
前記デコーダの再構成に関する第2の損失関数と、
前記動作エンコーダが求めた第1の潜在変数と、前記テキストエンコーダが求めた前記第2の潜在変数との差異を表す第3の損失関数と、
前記潜在変数の事前分布と事後分布の分布間距離を表す第4の損失関数と、
前記動作のフレーム長を予測するための第5の損失関数と、
前記第1の潜在変数の系列と、前記第2の潜在変数の系列に対して、前記動作と前記テキストが対応するデータから得られたものの場合は近づくようにし、前記動作と前記テキストが対応しないデータから得られたものの場合は離れるようにする第6の損失関数と、
のうち少なくとも1つの前記損失関数を最小化するように最適化を行い、前記第1の潜在変数と前記第2の潜在変数を最適化する、請求項5に記載の動作生成モデル学習装置。
【請求項8】
動作生成装置のコンピュータに、
潜在変数を求めさせ、
前記潜在変数から動作を生成させ、
前記潜在変数は、フレームレベルのイベント編集を実現するため、イベントごとに遷移するように制約が与えられている、
プログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、動作生成装置、動作生成モデル学習装置、及びプログラムの技術に関する。
続きを表示(約 2,100 文字)
【背景技術】
【0002】
入力テキストに応じて動作を生成する技術がある(例えば非特許文献1参照)。非特許文献1に記載の技術では、テキストと動作のペアデータから構成された学習データを用いてテキストと動作の関係を学習することで、入力されたテキストに対応した動作を生成する。これにより、非特許文献1に記載の技術では、複数動作を含む時系列データ(例えば「ある人が歩いていた。彼は,突然止まって、物を拾い上げた。」など)をテキストに基づき生成できる。
【先行技術文献】
【非特許文献】
【0003】
Chuan Guo, Shihao Zou, Xinxin Zuo, et al., “Generating Diverse and Natural 3D Human Motions from Text”, in Proc. CVPR, 2022
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術では、個々のイベントをフレームレベルで個別に編集するということは考慮されておらず、フレームレベルのイベントに応じた動作生成への対応が簡単ではないという問題があった。
【0005】
上記事情に鑑み、本発明は、フレームレベルでイベントに応じた動作生成が可能となる動作生成装置、動作生成モデル学習装置、及びプログラムを提供することを目的としている。
【課題を解決するための手段】
【0006】
本発明の一態様は、潜在変数を求めるエンコーダと、前記潜在変数から動作を生成するデコーダと、を備え、前記潜在変数は、フレームレベルのイベント編集を実現するため、イベントごとに遷移するように制約が与えられている、動作生成装置である。
【0007】
本発明の一態様は、学習データは、テキストと動作のペアデータであり、前記動作から第1の潜在変数を推定する動作エンコーダと、推定された前記第1の潜在変数から動作を再構成するデコーダと、前記テキストから第2の潜在変数を推定するテキストエンコーダと、学習部と、を備え、前記学習部は、前記第1の潜在変数から動作を再構成した時に、前記動作エンコーダの入力動作と前記デコーダの出力動作が近づくようにする学習と、前記第2の潜在変数を推定した時に、前記第1の潜在変数と前記第2の潜在変数が近づくようにする学習と、を同時に行うことによって前記第1の潜在変数と前記第2の潜在変数を最適化する、動作生成モデル学習装置である。
【0008】
本発明の一態様は、動作生成装置のコンピュータに、潜在変数を求めさせ、前記潜在変数から動作を生成させ、前記潜在変数は、フレームレベルのイベント編集を実現するため、イベントごとに遷移するように制約が与えられている、プログラムである。
【発明の効果】
【0009】
本発明により、フレームレベルでイベントに応じた動作生成が可能となる。
【図面の簡単な説明】
【0010】
実施形態の動作生成装置の構成例を示す図である。
イベント表現を示す図である。
実施形態における動作生成モデルの学習方法例の概要を示す図である。
実施形態における動作生成モデルの学習方法例を示す図である。
c
d
1:L
とc’
d
1:L
の概念的なイメージ図である。
実施形態における学習済み動作生成モデルを用いた動作の生成方法の手順を示す図である。
実施形態におけるテキストからの動作生成の処理手順を示す図である。
実施形態における動作から動作の再構成の処理手順を示す図である。
実施形態の方法でテキストから作成した動作例を示す図である。
テキストc
pri
1:L’
から推定されたイベント表現列から得られる[c
pri
1
,c
pri
1
,…,c
pri
L’-1
,c
pri
L’-1
,c
pri
L’
]を用いて実施形態の方法で編集された動作を示す図である。
オリジナルの動作を示す図である。
図11のオリジナル動作の55~68番目のフレームのセグメントを、55~110番目のフレームに拡張した図である。
「イベントの特性の編集」方法で、イベントの特性の編集を行った結果を示す図である。
追加されるイベント表現が1つだけのモーションセグメントを示す図である。
「新規イベントの挿入」方法で、図11の146番目のフレームに図14のイベントを挿入した結果を示す図である。
【発明を実施するための形態】
(【0011】以降は省略されています)
特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する
関連特許
日本電信電話株式会社
IDタグおよび散乱体
6日前
日本電信電話株式会社
振動提示装置、および振動提示方法
10日前
日本電信電話株式会社
IDタグ、測定システムおよび配置方法
6日前
日本電信電話株式会社
学習装置、学習方法、およびプログラム
6日前
日本電信電話株式会社
状態提示制御装置、方法およびプログラム
6日前
日本電信電話株式会社
推定システム、推定方法及び推定プログラム
6日前
日本電信電話株式会社
画像生成方法、画像生成装置およびプログラム
6日前
日本電信電話株式会社
画像処理方法、画像処理装置およびプログラム
6日前
日本電信電話株式会社
情報処理装置、情報処理方法、及びプログラム
6日前
日本電信電話株式会社
動作生成装置、動作生成モデル学習装置、及びプログラム
6日前
日本電信電話株式会社
無線通信システム、送信機、無線通信方法、および無線通信用プログラム
今日
日本電信電話株式会社
署名生成方法、署名検証方法、存在証明システム、通信装置、プログラム
6日前
日本電信電話株式会社
署名生成方法、署名検証方法、存在証明システム、通信装置、プログラム
6日前
日本電信電話株式会社
学習装置、学習方法、判定装置、判定方法及びコンピュータープログラム
6日前
日本電信電話株式会社
無線通信システム、送信機、無線通信方法、および無線通信用プログラム
今日
日本電信電話株式会社
無線通信システム、無線通信装置、無線通信方法および無線通信用プログラム
今日
日本電信電話株式会社
トレーニング支援装置、トレーニング支援方法及びトレーニング支援プログラム
6日前
日本電信電話株式会社
カラー撮像素子および撮像装置
10日前
日本電信電話株式会社
身体技能獲得支援装置、身体技能獲得支援方法、および身体技能獲得支援プログラム
6日前
日本電信電話株式会社
ハイパースペクトル画像生成装置、ハイパースペクトル画像生成方法及びプログラム
6日前
日本電信電話株式会社
支援装置、支援方法およびプログラム
2日前
日本電信電話株式会社
電子権利流通システム、発行者装置、利用者装置、改札者装置、電子権利流通方法、及びプログラム
6日前
日本電信電話株式会社
対応装置、学習装置、対応方法、学習方法、及びプログラム
6日前
個人
物品
1か月前
個人
情報提示方法
7日前
個人
自動精算システム
15日前
個人
プログラム
6日前
個人
RFタグ読取装置
24日前
個人
アカウントマップ
今日
個人
自動精算システム
1か月前
個人
売買システム
21日前
個人
救急搬送システム
1か月前
個人
管理サーバ
1か月前
個人
市場受発注システム
13日前
個人
発想支援方法及びシステム
10日前
日本精機株式会社
車両用表示装置
23日前
続きを見る
他の特許を見る