TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025137128
公報種別公開特許公報(A)
公開日2025-09-19
出願番号2024036149
出願日2024-03-08
発明の名称情報処理装置、情報処理方法、及びプログラム
出願人日本電気株式会社
代理人個人
主分類G06T 15/00 20110101AFI20250911BHJP(計算;計数)
要約【課題】空間の表現能力が向上した3次元形状補完手法を実現する情報処理装置、方法及びプログラムを提供する。
【解決手段】情報処理装置は、学習フェーズ用の入力データを取得する取得部と、入力データに含まれる各ピクセルの3次元座標を、デプスデータにおける各ピクセルのデプスデータを参照することによって特定して3次元構造データを生成する3次元構造データ生成部と、3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成するサンプリング部と、サンプリング後の3次元構造データに対して、遮蔽個所や欠損個所を推定して補完処理を適用する補完部と、補完処理における中間特徴量を参照した形状推定処理を実行する推定部と、形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、補完手段を学習させる第1の学習部とを備える。
【選択図】図1
特許請求の範囲【請求項1】
入力データを取得する取得手段と、
前記入力データから3次元構造データを生成する3次元構造データ生成手段と、
前記3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成するサンプリング手段と、
前記サンプリング後の3次元構造データに対して補完処理を適用する補完手段と、
前記補完処理における中間特徴量を参照した形状推定処理を実行する推定手段と、
前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させる第1の学習手段と
を備えている情報処理装置。
続きを表示(約 1,900 文字)【請求項2】
前記推定手段は、前記形状推定処理において1又は複数の距離関数値を算出し、
前記第1の損失値は、前記1又は複数の距離関数値に関する損失値である
請求項1に記載の情報処理装置。
【請求項3】
前記推定手段は、
前記補完処理における前記中間特徴量を潜在変数に変換する特徴量変換手段と、
前記潜在変数と、前記前記サンプリング後の3次元構造データとを参照して前記形状推定処理を実行する形状推定手段と
を備えている
請求項2に記載の情報処理装置。
【請求項4】
前記補完手段は、
前記サンプリング後の3次元構造データが入力され、前記中間特徴量を出力するエンコーダと、
前記中間特徴量が入力され、補完後の3次元構造データを出力するデコーダと
を備え、
前記第1の学習手段は、
前記第1の損失値を参照して、前記エンコーダを機械学習させる
請求項1から3の何れか1項に記載の情報処理装置。
【請求項5】
前記デコーダが出力した前記補完後の3次元構造データと、前記3次元構造データ生成手段が生成した3次元構造データとの相違を示す第2の損失値を参照して、前記エンコーダと前記デコーダとを機械学習させる第2の学習手段と
を備えている請求項4に記載の情報処理装置。
【請求項6】
入力データを取得する取得手段と、
前記入力データから3次元構造データを生成する3次元構造データ生成手段と、
前記3次元構造データに対して補完処理を適用する補完手段と、
前記補完処理が適用された3次元構造データから出力データを生成する出力データ生成手段と
を備え、
前記補完手段は、
学習用データから生成された3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成するサンプリング処理と、
前記サンプリング後の3次元構造データに対する当該補完手段による補完処理と、
前記補完処理における中間特徴量を参照した形状推定処理と、
前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させる第1の学習処理と
によって学習されたものである
情報処理装置。
【請求項7】
入力データを取得することと、
前記入力データから3次元構造データを生成することと、
前記3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成することと、
前記サンプリング後の3次元構造データに対して補完手段による補完処理を適用することと、
前記補完処理における中間特徴量を参照した形状推定処理を実行することと、
前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させることと
を含んでいる情報処理方法。
【請求項8】
入力データを取得することと、
前記入力データから3次元構造データを生成することと、
前記3次元構造データに対して補完手段による補完処理を適用することと、
前記補完処理が適用された3次元構造データから出力データを生成することと
を含み、
前記補完手段は、
学習用データから生成された3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成することと、
前記サンプリング後の3次元構造データに対する当該補完手段による補完処理を適用することと、
前記補完処理における中間特徴量を参照した形状推定処理を実行することと、
前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させることと
によって学習されたものである
情報処理方法。
【請求項9】
請求項1に記載の情報処理装置としてコンピュータを機能させるためのプログラムであって、前記取得手段、前記3次元構造データ生成手段、前記サンプリング手段、前記補完手段、前記推定手段、及び前記第1の学習手段としてコンピュータを機能させるためのプログラム。
【請求項10】
請求項6に記載の情報処理装置としてコンピュータを機能させるためのプログラムであって、前記取得手段、前記3次元構造データ生成手段、前記補完手段、及び前記出力データ生成手段としてコンピュータを機能させるためのプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及びプログラムに関する。
続きを表示(約 1,900 文字)【背景技術】
【0002】
実世界をセンサによってスキャンし再構成する技術が知られている。また、当該再構成によって得られた3次元データには、遮蔽領域や欠損領域が発生し得ることから、これらの領域を補完する方法も知られている(例えば非特許文献1)。
【先行技術文献】
【非特許文献】
【0003】
Angela Dai et. al.,SG-NN: Sparse Generative Neural Networks for Self-Supervised Scene Completion of RGB-D Scans,2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR).
【発明の概要】
【発明が解決しようとする課題】
【0004】
非特許文献1に記載の技術は、Voxelベースの3次元形状補完手法であるが、空間の表現能力が限定的であるという問題があった。
【0005】
本開示は、上記の問題に鑑みてなされたものであり、その一例示的目的は、空間の表現能力が向上した3次元形状補完手法を提供することにある。
【課題を解決するための手段】
【0006】
本開示の一例示的側面に係る情報処理装置は、入力データを取得する取得手段と、前記入力データから3次元構造データを生成する3次元構造データ生成手段と、前記3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成するサンプリング手段と、前記サンプリング後の3次元構造データに対して補完処理を適用する補完手段と、前記補完処理における中間特徴量を参照した形状推定処理を実行する推定手段と、前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させる第1の学習手段とを備えている。
【0007】
本開示の一例示的側面に係る情報処理装置は、入力データを取得する取得手段と、前記入力データから3次元構造データを生成する3次元構造データ生成手段と、前記3次元構造データに対して補完処理を適用する補完手段と、前記補完処理が適用された3次元構造データから出力データを生成する出力データ生成手段とを備え、前記補完手段は、学習用データから生成された3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成するサンプリング処理と、前記サンプリング後の3次元構造データに対する当該補完手段による補完処理と、前記補完処理における中間特徴量を参照した形状推定処理と、前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させる第1の学習処理とによって学習されたものである。
【0008】
本開示の一例示的側面に係る情報処理方法は、入力データを取得することと、前記入力データから3次元構造データを生成することと、前記3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成することと、前記サンプリング後の3次元構造データに対して補完手段による補完処理を適用することと、前記補完処理における中間特徴量を参照した形状推定処理を実行することと、前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させることとを含んでいる。
【0009】
本開示の一例示的側面に係る情報処理方法は、入力データを取得することと、前記入力データから3次元構造データを生成することと、前記3次元構造データに対して補完手段による補完処理を適用することと、前記補完処理が適用された3次元構造データから出力データを生成することとを含み、前記補完手段は、学習用データから生成された3次元構造データをサンプリングすることによって、サンプリング後の3次元構造データを生成することと、前記サンプリング後の3次元構造データに対する当該補完手段による補完処理を適用することと、前記補完処理における中間特徴量を参照した形状推定処理を実行することと、前記形状推定処理によって得られた形状に関する損失値である第1の損失値を参照して、前記補完手段を学習させることとによって学習されたものである。
【発明の効果】
【0010】
本開示の一例示的側面によれば、空間の表現能力が向上した3次元形状補完手法を提供することができるという一例示的効果を奏する。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

日本電気株式会社
学習装置
22日前
日本電気株式会社
学習装置
15日前
日本電気株式会社
原子発振器
17日前
日本電気株式会社
超伝導量子回路
11日前
日本電気株式会社
マルチバンドバラン
9日前
日本電気株式会社
移相器およびアンテナ装置
29日前
日本電気株式会社
移相器およびアンテナ装置
29日前
日本電気株式会社
移相器およびアンテナ装置
29日前
日本電気株式会社
端末装置および無線通信方法
2日前
日本電気株式会社
機器冷却装置及びその冷却方法
3日前
日本電気株式会社
プログラム、算出装置、及び方法
3日前
日本電気株式会社
TS合成装置および放送システム
18日前
日本電気株式会社
ケージ、光伝送装置及び挿抜方法
26日前
日本電気株式会社
処理装置、方法、及びプログラム
15日前
日本電気株式会社
リング共振器、およびその製造方法
17日前
日本電気株式会社
リング共振器、およびその製造方法
16日前
日本電気株式会社
ピーク抑圧装置及びピーク抑圧方法
1日前
日本電気株式会社
処理装置、処理方法、及びプログラム
29日前
日本電気株式会社
処理装置、処理方法、及びプログラム
25日前
日本電気株式会社
判定装置、判定方法、及び、プログラム
11日前
日本電気株式会社
通信システム及びパケット順序補正方法
2日前
日本電気株式会社
管理システム、管理方法及びプログラム
1日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
18日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
15日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
15日前
日本電気株式会社
画像検索装置、画像検索方法及び記憶媒体
12日前
日本電気株式会社
マルチコアファイバ増幅器及び光増幅方法
9日前
日本電気株式会社
自動可変チルト装置及び光信号利得等化方法
10日前
日本電気株式会社
情報収集装置、情報収集方法及びプログラム
10日前
日本電気株式会社
処理システム、処理方法、およびプログラム
19日前
日本電気株式会社
光増幅装置、光伝送システム及び光増幅方法
29日前
日本電気株式会社
人数計数装置、人数計数方法及びプログラム
1日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
10日前
日本電気株式会社
マッチング装置、マッチング方法、プログラム
10日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
1日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
15日前
続きを見る