TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024054680
公報種別公開特許公報(A)
公開日2024-04-17
出願番号2022161081
出願日2022-10-05
発明の名称情報処理装置、情報処理装置の制御方法、及びコンピュータプログラム
出願人キヤノン株式会社
代理人個人,個人,個人
主分類G06T 7/00 20170101AFI20240410BHJP(計算;計数)
要約【課題】画像認識に係る処理を改善することである。
【解決手段】物体の種別名を表す種別情報、及び物体の空間中の三次元的な位置情報からなる物体特性情報を、少なくとも2以上含む、物体特性群情報を入力する物体特性群情報入力手段と、物体の種別名を表す種別情報を、物体の空間中の三次元的な位置情報と関連づけて保持する物体配置特性データベースと、前記物体特性群情報入力手段で入力された前記物体特性群情報と前記物体配置特性データベースとに基づき、前記物体特性群情報に含まれる情報に関連する情報を予測する予測手段と、前記物体特性群情報入力手段が入力した前記物体特性群情報と、前記予測手段の予測結果とに基づいて、前記物体配置特性データベースを更新する物体配置特性データベース更新手段と、を有する。
【選択図】図8


特許請求の範囲【請求項1】
物体の種別名を表す種別情報、及び物体の空間中の三次元的な位置情報からなる物体特性情報を、少なくとも2以上含む、物体特性群情報を入力する物体特性群情報入力手段と、
物体の種別名を表す種別情報を、物体の空間中の三次元的な位置情報と関連づけて保持する物体配置特性データベースと、
前記物体特性群情報入力手段で入力された前記物体特性群情報と前記物体配置特性データベースとに基づき、前記物体特性群情報に含まれる情報に関連する情報を予測する予測手段と、
前記物体特性群情報入力手段が入力した前記物体特性群情報と、前記予測手段の予測結果とに基づいて、前記物体配置特性データベースを更新する物体配置特性データベース更新手段と、
を有する情報処理装置。
続きを表示(約 2,100 文字)【請求項2】
前記物体特性群情報入力手段で入力された前記位置情報は、前記物体の空間中の三次元位置、前記物体間の空間中の三次元の相対位置、前記物体の空間中の三次元位置を表すラベル、及び前記物体間の空間中の三次元の相対位置を表すラベルの少なくともいずれか一つである、
ことを特徴とする請求項1に記載の情報処理装置
【請求項3】
前記物体特性群情報入力手段は、入力された前記物体特性群情報に含まれる前記種別情報又は前記位置情報の少なくとも一方をマスキングするか、又は別の種別情報又は位置情報に変更するかのどちらか一方を実施した改変物体特性群情報を生成し、
前記予測手段は、前記物体特性群情報入力手段が入力した前記物体特性群情報に含まれる物体に関連する情報又は前記物体特性群情報に含まれる物体の関係性として、前記種別情報又は前記位置情報の少なくとも一方を周囲の物の配置関係に基づいて予測し、
前記物体配置特性データベース更新手段は、前記予測手段の予測結果と、前記物体特性群情報入力手段が入力した前記物体特性群情報との差が減少するように、前記物体配置特性データベースを更新する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記物体特性群情報入力手段は、少なくとも2以上の前記物体特性群情報と、該2以上の前記物体特性群情報が関連する場所か否かを表すフラグとを入力し、
前記予測手段は、前記物体特性群情報に含まれる物体の関係性に関連する情報として、前記物体特性群情報入力手段が入力した前記前記物体特性群情報が関連した場所であるか否かの値を周囲の物の配置関係に基づいて予測し、
前記物体配置特性データベース手段は、前記物体特性群情報入力手段が入力した前記フラグと予測手段の予測結果の前記フラグとの差が減少するように、前記物体配置特性データベースを更新する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項5】
画像から空間の物体ラベル付き三次元空間を復元し、前記復元した三次元空間における物体の種別情報と位置情報を前記物体特性群情報として類推する類推手段を有する、
ことを特徴とする請求項1に記載の情報処理装置
【請求項6】
物の配置関係を認識して特定のタスクを解くためのタスクデータベースを有し、
前記物体特性群情報入力手段は、さらに特定のタスクの正解データである教師データを入力し、
前記予測手段は、前記物体特性群情報と前記物体配置特性データベース、及び前記タスクデータベースに基づき、前記物体特性群情報に含まれる物体に関連する情報又は前記物体特性群情報に含まれる物体の関係性に関連する情報を予測データとして予測し、
前記物体特性群情報入力手段が入力した教師データと、前記予測手段が予測した予測データとの差が減少するように、前記物体配置特性データベース又は前記タスクデータベースの少なくともどちら一方を学習する学習手段を有する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項7】
前記物体特性群情報に含まれる物体の関係性に関連する情報とは、前記物体特性群情報が生成された場所のカテゴリのことであり、
前記教師データとは、前記物体特性群情報が生成された場所のカテゴリを表す場所ラベルであり、
前記タスクデータベースとは、前記物体特性群情報が生成された場所ラベルを予測する場所予測データベースであり、
前記予測手段は、前記物体特性群情報と前記物体配置特性データベース、及び前記場所予測データベースに基づき、前記物体特性群情報が生成された場所ラベルを予測し、
前記予測手段が予測する場所ラベルと、前記入力した場所ラベルとの差が減少するように前記物体配置特性データベース又は場所予測データベースの少なくともどちらか一方を学習する学習手段を有する、
ことを特徴とする請求項6に記載の情報処理装置。
【請求項8】
前記物体配置特性データベースとは、ニューラルネットワークモデルである、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項9】
空間の三次元形状モデルの三次元形状データを保持する三次元形状データ保持手段と、
前記三次元形状データから複数の物体を抽出し、その物体の種別情報と位置情報と合わせて物体特性群情報を生成する物体特性群情報算出手段と、を有する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項10】
画像を入力する画像入力手段と、
前記画像から三次元形状データを生成する三次元形状データ生成手段と、
前記画像から画素の物体ラベルを行う物体認識手段と、
前記三次元形状データと前記物体ラベルとに基づき、前記三次元形状データに前記物体ラベルを割り当てる三次元形状データラベリング手段と、を有する、
ことを特徴とする請求項1に記載の情報処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、情報処理装置、情報処理装置の制御方法、及びコンピュータプログラムに関するものである。
続きを表示(約 1,900 文字)【背景技術】
【0002】
近年、画像認識により、画像に写っている物体の種別や位置といった物体特性を機械が認識することができるようになってきている。特許文献1では、画像から物体を取り囲むバウンディングボックスと物体種別を出力するようにデータベースを更新していた。
【先行技術文献】
【特許文献】
【0003】
特表2019-517701号公報
【非特許文献】
【0004】
Jacob.et.al, BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding, arXiv 2018
Wald.et.al, Learning 3D Semantic Scene Graphs from 3D Indoor Reconstructions, CVPR2020
Glorot.et.al, Understanding the difficulty of training deep feedforward neural networks. AIStats2010
Kaiming.et.al, Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification, CVPR2015
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、画像認識においては、画像に写っているのにもかかわらず、物体が認識されないことがあった。また、このような認識タスク毎にデータベースを一から構築する必要があり、手間がかかった。このため、従来、画像認識に係る処理に改善の余地があった。
【0006】
本発明は以上を鑑みて、画像認識に係る処理を改善することを1つの目的とする。
【課題を解決するための手段】
【0007】
本発明の1側面としての情報処理装置は、物体の種別名を表す種別情報、及び物体の空間中の三次元的な位置情報からなる物体特性情報を、少なくとも2以上含む、物体特性群情報を入力する物体特性群情報入力手段と、物体の種別名を表す種別情報を、物体の空間中の三次元的な位置情報と関連づけて保持する物体配置特性データベースと、前記物体特性群情報入力手段で入力された前記物体特性群情報と前記物体配置特性データベースとに基づき、前記物体特性群情報に含まれる情報に関連する情報を予測する予測手段と、前記物体特性群情報入力手段が入力した前記物体特性群情報と、前記予測手段の予測結果とに基づいて、前記物体配置特性データベースを更新する物体配置特性データベース更新手段と、を有する。
【発明の効果】
【0008】
本発明によれば、画像認識に係る処理を改善することができる。
【図面の簡単な説明】
【0009】
本発明に係る情報処理装置を利用する状況を説明する図である。
実施例1の情報処理装置の機能構成を示すブロック図である。
実施例1の情報処理装置のハードウェア構成を示す図である。
実施例1の概念を示す図である。
実施例1の情報処理装置の処理の流れを示すフローチャートである。
実施例1の情報処理装置の予測処理の詳細の流れを示すフローチャートである。
変形例2の情報処理装置の機能構成を示すブロック図である。
変形例3の概念を示す図である。
図8に示したタスクデータベースのバリエーションを示す図である。
実施例2の情報処理装置の機能構成を示すブロック図である。
実施例2の情報処理装置の処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一又は同様の構成に同一の参照番号を付し、重複した説明は省略する。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

キヤノン株式会社
記録装置
12日前
キヤノン株式会社
電子機器
5日前
キヤノン株式会社
撮像装置
12日前
キヤノン株式会社
制御装置
今日
キヤノン株式会社
発光装置
7日前
キヤノン株式会社
光学機器
5日前
キヤノン株式会社
カメラ装置
5日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
画像形成装置
12日前
キヤノン株式会社
画像形成装置
12日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
画像形成装置
12日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
有機発光素子
12日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
画像形成装置
6日前
キヤノン株式会社
画像形成装置
7日前
キヤノン株式会社
画像形成装置
12日前
キヤノン株式会社
液滴吐出装置
5日前
キヤノン株式会社
画像形成装置
6日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
バッテリーパック
12日前
キヤノン株式会社
スイッチング電源
7日前
キヤノン株式会社
仮想現実システム
7日前
キヤノン株式会社
光電変換装置、機器
今日
キヤノン株式会社
半導体回路および機器
6日前
キヤノン株式会社
液体容器及び記録装置
6日前
キヤノン株式会社
半導体素子を有する装置
6日前
キヤノン株式会社
定着ベルト及び熱定着装置
5日前
キヤノン株式会社
現像装置及び画像形成装置
6日前
キヤノン株式会社
印刷装置及びその制御方法
7日前
キヤノン株式会社
ノズルプレートの製造方法
今日
キヤノン株式会社
容器、及び容器の製造方法
5日前
続きを見る