TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024121786
公報種別
公開特許公報(A)
公開日
2024-09-06
出願番号
2024006941
出願日
2024-01-19
発明の名称
アバター制御
出願人
富士通株式会社
,
カーネギー-メロン ユニバーシティ
,
CARNEGIE-MELLON UNIVERSITY
代理人
個人
,
個人
主分類
G06T
19/00 20110101AFI20240830BHJP(計算;計数)
要約
【課題】2D表現の動的オブジェクトから生成された3Dオブジェクトに基づくアバターの表示及び制御を提供する。
【解決手段】一例で、方法は、変形光線を得るよう第1ニューラルネットワーク及び潜在コードを用いて第1時間における動的オブジェクトに関連した第1光線を変形させることを含む。方法はまた、第1光線、第1時間、及び潜在コードを第2ニューラルネットワークに入力することによって、第1光線に関連したハイパースペースコードを取得することを含む。方法は更に、変形光線から1つ以上のポイントをサンプリングすることを含む。方法はまた、サンプリングされたポイント及びハイパースペースコードをネットワーク入力にまとめることを含む。方法は更に、第2時間における動的オブジェクトを表す3次元シーンの画像をレンダリングするためのRGB値を得るようネットワーク入力を第3ニューラルネットワークに入力することを含む。
【選択図】図1
特許請求の範囲
【請求項1】
変形光線を得るよう第1ニューラルネットワーク及び潜在コードを用いて第1時間における動的オブジェクトに関連した第1光線を変形させることと、
前記第1光線、前記第1時間、及び前記潜在コードを第2ニューラルネットワークに入力することによって前記第1光線に関連したハイパースペースコードを取得することと、
前記変形光線から1つ以上のポイントをサンプリングすることと、
前記サンプリングされたポイント及び前記ハイパースペースコードをネットワーク入力にまとめることと、
第2時間における前記動的オブジェクトを表す3次元シーンの画像をレンダリングするためのRGB値を得るよう前記ネットワーク入力を第3ニューラルネットワークに入力することと
を有する方法。
続きを表示(約 1,100 文字)
【請求項2】
前記第1光線、前記第1時間、及び属性値を第1属性ニューラルネットワークに入力することによって前記第1光線に関連したハイパースペース属性値を取得することと、
前記ハイパースペース属性値、前記変形光線、及び前記ハイパースペースコードを第2属性ニューラルネットワークに入力することによって前記属性値に関連したスカラーマスクを決定することと、
前記スカラーマスク及び前記ハイパースペース属性値を属性ベクトルにまとめることと、
前記属性ベクトルを前記サンプリングされたポイント及び前記ハイパースペースコードと結合して、前記第3ニューラルネットワークへ入力される前記ネットワーク入力にまとめることと
を更に有する、請求項1に記載の方法。
【請求項3】
前記ハイパースペースコードは、前記ハイパースペースコードが前記ハイパースペース属性値によって影響されないように前記スカラーマスクに対して調整される、
請求項2に記載の方法。
【請求項4】
前記動的オブジェクトに関連したビデオデータ及び訓練データを用いて教師ニューラルネットワークを訓練することと、
知識蒸留を用いて前記教師ニューラルネットワークから前記第3ニューラルネットワークを訓練することと、
前記ビデオデータを用いて前記第3ニューラルネットワークを調整することと
を更に有する、請求項1に記載の方法。
【請求項5】
前記第1ニューラルネットワーク、前記第2ニューラルネットワーク、又は前記第3ニューラルネットワークのうちの1つ以上は、知識蒸留により訓練される、
請求項1に記載の方法。
【請求項6】
前記動的オブジェクトを表す前記3次元シーンの前記画像が表示されるように前記RGB値を表示デバイスに表示することを更に有する、
請求項1に記載の方法。
【請求項7】
前記第1ニューラルネットワーク及び前記第2ニューラルネットワークは、フィードフォワード人工ニューラルネットワークである、
請求項1に記載の方法。
【請求項8】
前記第1ニューラルネットワーク及び前記第2ニューラルネットワークは、浅い多層パーセプトロンネットワークである、
請求項7に記載の方法。
【請求項9】
前記第3ニューラルネットワークは、深い残差色多層パーセプトロンリグレッサである、
請求項1に記載の方法。
【請求項10】
前記変形光線は、時間の関数としての正準光線空間への前記第1ニューラルネットワークによる前記第1光線のマッピングである、
請求項1に記載の方法。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本開示で議論される実施形態は、アバター制御に関係がある。
続きを表示(約 2,100 文字)
【背景技術】
【0002】
マシンビジョンは、機能及び精度において、2D観察を使用して3Dオブジェクトに関する決定を行うことに対するものを含め、進歩し続けている。様々なニューラルネットワークのいくつかの実施は計算が複雑である場合があり、その結果、3Dオブジェクトのレンダリングに時間が長くなったり、及び/又は3Dオブジェクトの表現が不十分であったりすることがある。例えば、いくつかのニューラルネットワークは、2Dオブジェクトを3D表現に変換するために2Dオブジェクトからピクセルごとに決定を行う場合がある。
【0003】
ここで請求される対象は、上述されたような環境でしか動作しない実施形態や、上述された如何なる欠点も解消する実施形態に制限されない。むしろ、この背景は、ここで記載されるいくつかの実施形態が実施される可能性がある技術分野の一例を説明するためにのみ設けられている。
【発明の概要】
【0004】
実施形態の側面に従って、方法は、変形光線を得るよう第1ニューラルネットワーク及び潜在コードを用いて第1時間における動的オブジェクトに関連した第1光線を変形させることを含んでよい。方法はまた、第1光線、第1時間、及び潜在コードを第2ニューラルネットワークに入力することによって、第1光線に関連したハイパースペースコードを取得することを含んでよい。方法は更に、変形光線から1つ以上のポイントをサンプリングすることを含んでよい。方法はまた、サンプリングされたポイント及びハイパースペースコードをネットワーク入力にまとめることを含んでよい。方法は更に、第2時間における動的オブジェクトを表す3次元シーンの画像をレンダリングするためのRGB値を得るようネットワーク入力を第3ニューラルネットワークに入力することを含んでよい。
【0005】
実施形態の目的及び利点は、少なくとも、特許請求の範囲で特に指し示されている要素、特徴、及び組み合わせによって、実現され達成されるであろう。
【0006】
上記の概要及び下記の詳細な説明はいずれも、例として与えられている実例であり、請求されている発明を限定するものではない。
【0007】
例となる実施形態は、添付の図面の使用を通じて更なる特定及び詳細を用いて記載され説明であろう。
【図面の簡単な説明】
【0008】
アバター制御をサポートするよう構成される環境の例のブロック図である。
アバター制御をサポートするよう構成される環境の他の例のブロック図である。
アバター制御とともに使用され得るニューラルネットワークを訓練することをサポートするよう構成される環境の例のブロック図である。
アバター制御の方法の例のフローチャートである。
アバター制御に関連した制御可能な属性入力の方法の例のフローチャートである。
アバター制御のために使用され得るコンピューティングシステムの例を表す。
【発明を実施するための形態】
【0009】
マシンビジョン、及び/又はマシンビジョンを使用したオブジェクトの表現は、近年大幅に進歩している。例えば、3次元(3D)オブジェクト及び/又はシーン(明示的に別なふうに言及されない限り、「オブジェクト」と総称される。)は、マシンビジョンシステムがオブジェクトの2次元(2D)画像を観察し解釈することを通じてモデル化及び/又は表現され得る。いくつかの状況で、マシンビジョンシステムは、2Dでオブジェクトを観察して、その3D表現を生成するために、1つ以上の機械学習システムを実装する。2Dオブジェクトの多くの3D表現は静止オブジェクトに基づく可能性があり、そのため、3D表現も静止している。静止オブジェクトに対するマシンビジョンシステムの機能性及び/又は計算時間の向上のために改善が導入されてきたが、動的オブジェクト(例えば、動く可能性がある又は動作中であり得るオブジェクト)のマシンビジョン処理は静止オブジェクト(例えば、動いていないオブジェクト)と比べて付加的な計算複雑性を含む場合がある。
【0010】
いくつかの状況で、光場ネットワーク(Light Field Network,LFN)が、2D観察から3Dオブジェクトを表現するためにマシンビジョンシステムで使用されることがある。例えば、LFNは、暗黙的なニューラル表現によりパラメータ化される360度の4次元光場での基礎となる3Dシーンのジオメトリ及び外観の両方の表現を含むことができる。更に、LFNは、好ましくは、剛体変形を含む可能性のある静止オブジェクト物体とともに使用され得る。例えば、時間とともに動的に変化する3Dオブジェクト、及び/又はオブジェクトに対して変化する画像キャプチャデバイスの関連する視点は、LFNによって表現され得ない及び/又は不正確に表現される可能性がある非剛体変形を導入する可能性がある。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
富士通株式会社
測定装置
24日前
富士通株式会社
データセット特徴タイプ推論
10日前
富士通株式会社
信号相関量の確定装置と方法
10日前
富士通株式会社
光伝送装置および光伝送システム
11日前
富士通株式会社
双方向光リンクの異常モニタリング
13日前
富士通株式会社
バイアスのための生成人工知能の検査
3日前
富士通株式会社
大規模言語モデルを使用したデータ調整
10日前
富士通株式会社
制御プログラム、制御方法及び決済装置
6日前
富士通株式会社
情報処理プログラムおよび情報処理方法
10日前
富士通株式会社
選択プログラム、選択装置、及び選択方法
13日前
富士通株式会社
無線アクセスネットワークプロビジョニング
10日前
富士通株式会社
光送信機サブ信号光位相差の確定装置と方法
10日前
富士通株式会社
広告画像を生成する方法、装置及び記憶媒体
17日前
富士通株式会社
赤外線センサ、及び赤外線センサの製造方法
19日前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
10日前
富士通株式会社
量子ビットデバイス及び量子ビットデバイスの製造方法
17日前
富士通株式会社
情報処理プログラム、情報処理方法、及び情報処理装置
11日前
富士通株式会社
情報処理プログラム、情報処理装置、および情報処理方法
6日前
富士通株式会社
光送信機のサブ信号の遅延差のリアルタイム監視装置及び方法
10日前
富士通株式会社
ブロックチェーンに基づくエスクローされたマーケットプレイス
10日前
富士通株式会社
共有メモリ制御プログラム、共有メモリ制御方法および情報処理装置
10日前
富士通株式会社
光伝送路特性推定装置、光伝送システム、及び光伝送路特性推定方法
11日前
富士通株式会社
スタート支援装置、スタート支援方法、およびスタート支援プログラム
11日前
富士通株式会社
棄却なしの並列試行マルコフ連鎖モンテカルロ法を用いた統計的サンプリング
3日前
富士通株式会社
機械学習プログラム、機械学習方法、推論プログラム、推論方法及び情報処理装置
24日前
富士通株式会社
依存情報を列に集約したマトリクススケジューラ及びマトリクススケジューリング方法
18日前
富士通株式会社
量子回路シミュレーションプログラム、量子回路シミュレーション方法および情報処理装置
19日前
富士通株式会社
機械学習プログラム、判定プログラム、機械学習方法、判定方法、機械学習装置、および判定装置
3日前
個人
対話装置
1か月前
個人
情報処理装置
1か月前
個人
情報処理システム
3日前
個人
情報処理装置
27日前
個人
検査システム
5日前
個人
記入設定プラグイン
19日前
株式会社サタケ
籾摺・調製設備
4日前
個人
情報入力装置
1か月前
続きを見る
他の特許を見る