TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025012476
公報種別公開特許公報(A)
公開日2025-01-24
出願番号2023115333
出願日2023-07-13
発明の名称情報処理装置、撮像装置、情報処理方法及びプログラム
出願人キヤノン株式会社
代理人個人
主分類G06T 7/00 20170101AFI20250117BHJP(計算;計数)
要約【課題】画像内のオブジェクトのカテゴリを精度よく推定する。
【解決手段】画像に対してモデルを適用して、特徴量を抽出する抽出処理を行う抽出手段と、前記特徴量に基づいて、前記画像内のオブジェクトについて、各カテゴリに分類される確からしさを表す尤度を推定する推定処理を行う推定手段と、前記画像の正解情報と、前記推定処理により推定された各カテゴリの尤度と、に基づいて、各カテゴリの尤度誤差を算出する第1の算出手段と、各カテゴリの尤度誤差に基づいて、カテゴリ全体の尤度の誤差を表す全体尤度誤差を算出する第2の算出手段と、前記全体尤度誤差に基づいて、前記モデルの学習を行う学習手段と、を有し、前記第2の算出手段は、前記全体尤度誤差を算出する際に、各カテゴリの尤度誤差に対し、対象とするカテゴリごとに、前記対象とするカテゴリと他のカテゴリとの関係性に基いた重み付けをする。
【選択図】図7
特許請求の範囲【請求項1】
画像に対してモデルを適用して、特徴量を抽出する抽出処理を行う抽出手段と、
前記特徴量に基づいて、前記画像内のオブジェクトについて、各カテゴリに分類される確からしさを表す尤度を推定する推定処理を行う推定手段と、
前記画像の正解情報と、前記推定処理により推定された各カテゴリの尤度と、に基づいて、各カテゴリの尤度誤差を算出する第1の算出手段と、
各カテゴリの尤度誤差に基づいて、カテゴリ全体の尤度の誤差を表す全体尤度誤差を算出する第2の算出手段と、
前記全体尤度誤差に基づいて、前記モデルの学習を行う学習手段と、
を有し、
前記第2の算出手段は、前記全体尤度誤差を算出する際に、各カテゴリの尤度誤差に対し、対象とするカテゴリごとに、前記対象とするカテゴリと他のカテゴリとの関係性に基いた重み付けをすることを特徴とする情報処理装置。
続きを表示(約 1,200 文字)【請求項2】
前記第1の算出手段は、同一の正解カテゴリをもつ複数の前記画像に対して、前記抽出処理と、前記推定処理とを行って得られた、各カテゴリの尤度に基づいて、各カテゴリの尤度誤差を算出し、
前記第2の算出手段は、各カテゴリの尤度誤差に対し、対象とするカテゴリごとに、前記対象とするカテゴリと前記正解カテゴリとの関係性に基いた重み付けをすることを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記モデルの学習の対象とする、前記画像と当該画像の正解情報とを含む、学習データ群を解析した結果に基づいて、前記重み付けを調整する調整手段、
を更に有することを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記画像の正解カテゴリと、前記推定処理により推定されたカテゴリとの組み合わせごとに、前記推定処理により推定された尤度を集計した結果に基づいて、前記重み付けを調整する調整手段、
を更に有することを特徴とする請求項1に記載の情報処理装置。
【請求項5】
前記調整手段は、正解カテゴリが第1のカテゴリである画像についての、前記推定処理により推定された第2のカテゴリの尤度に基づく第1の誤差と、正解カテゴリが前記第2のカテゴリである画像についての、前記推定処理により推定された前記第1のカテゴリに基づく第2の誤差と、を算出し、前記第1の誤差と前記第2の誤差との差分を集計した結果に基づいて、前記重み付けを調整することを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記調整手段は、前記差分が大きい場合、前記第1のカテゴリと前記第2のカテゴリの組み合わせについては、前記重み付けを小さくすることを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記調整手段は、前記差分が小さく、且つ、前記第1の誤差と前記第2の誤差が共に大きい場合、前記第1のカテゴリと前記第2のカテゴリの組み合わせについては、前記重み付けを大きくすることを特徴とする請求項5に記載の情報処理装置。
【請求項8】
カテゴリの組み合わせごとの前記重み付けを保持する保持手段、
を更に有し、
前記第2の算出手段は、対象とするカテゴリと別のカテゴリとの組み合わせに応じた前記重み付けを、前記保持手段から取得することを特徴する請求項1に記載の情報処理装置。
【請求項9】
カテゴリの組み合わせに応じた前記重み付けを、ユーザからの操作に応じて調整する調整手段
を更に有することを特徴とする請求項8に記載の情報処理装置。
【請求項10】
カテゴリの組み合わせに応じた前記重み付けを、外部ソフトウェアから入力された情報に応じて調整する調整手段
を更に有することを特徴とする請求項8に記載の情報処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、機械学習に関する。
続きを表示(約 2,000 文字)【背景技術】
【0002】
デジタルカメラには、カメラが自動的に検出した被写体や、ユーザが任意で選択した被写体に適した画像を取得するためのさまざまな機能が搭載されている。例えば、自動的に焦点を合わせるオートフォーカス(AF)機能、自動的に明るさを調整するオートエクスポージャー(AE)機能、自動的に適切な色に調整するオートホワイトバランス(AWB)機能がある。また、選択された被写体を後のフレームにおいても追従し続けることで、その被写体にフォーカスを合わせ続けたり、明るさや色を調整し続けたりする、追尾機能を有するカメラも知られている。これらの機能では入力画像において、被写体が存在する領域と、その被写体のカテゴリを推定することで、精度の高い処理を行うことが可能である。特許文献1には、畳み込みネットワークを用いて入力画像における物体を適切なクラスに分類する方法が記載されている。
【先行技術文献】
【特許文献】
【0003】
特開2020-64604号公報
【0004】
Multi-Task Learning as Multi-Objective Optimization,In Neural Information Processing Systems (NeurIPS) 2018
【発明の概要】
【発明が解決しようとする課題】
【0005】
ディープネット(あるいはディープニューラルネット、ディープラーニング)と呼ばれる多階層のニューラルネットワークを用いて物体のカテゴリを分類するカテゴリ分類の学習を行うためには、カテゴリの学習画像とGT情報を準備して、学習を行う必要がある。なおここでは、GT(Ground Truth)情報は、学習画像内の位置と大きさを示した枠情報とする。学習画像として、実際に撮影された画像を使用する場合、あるカテゴリのGT内に特定の別のカテゴリが頻繁に含まれるケースが存在する。例えば、バイクのGT内には、人が含まれていることが多い。このような特定のカテゴリ間における関係性は学習を行う際に考慮されていない。そのためGT内に複数のカテゴリが重なったデータが含まれるデータセットを用いてマルチカテゴリ分類のための学習を行うと、ユーザが本来意図しているカテゴリとは別のカテゴリのものをカテゴリの特徴として学習されてしてしまうおそれがある。その結果、最終的なモデルの精度が向上しないという課題がある。
【0006】
そこで本発明は上記課題に鑑み、画像内のオブジェクトのカテゴリの推定の精度を向上させることを目的とする。
【課題を解決するための手段】
【0007】
本発明は、画像に対してモデルを適用して、特徴量を抽出する抽出処理を行う抽出手段と、前記特徴量に基づいて、前記画像内のオブジェクトについて、各カテゴリに分類される確からしさを表す尤度を推定する推定処理を行う推定手段と、前記画像の正解情報と、前記推定処理により推定された各カテゴリの尤度と、に基づいて、各カテゴリの尤度誤差を算出する第1の算出手段と、各カテゴリの尤度誤差に基づいて、カテゴリ全体の尤度の誤差を表す全体尤度誤差を算出する第2の算出手段と、前記全体尤度誤差に基づいて、前記モデルの学習を行う学習手段と、を有し、前記第2の算出手段は、前記全体尤度誤差を算出する際に、各カテゴリの尤度誤差に対し、対象とするカテゴリごとに、前記対象とするカテゴリと他のカテゴリとの関係性に基いた重み付けをすることを特徴とする。
【発明の効果】
【0008】
本発明によれば、画像内のオブジェクトのカテゴリの推定の精度を向上させることができる。
【図面の簡単な説明】
【0009】
カメラシステムの全体構成例を示す図である。
学習装置のハードウェア構成例を示す図である。
カメラの機能構成例を示す図である。
カメラにより実行される処理を示すフローチャートである。
ニューラルネットワークのネットワーク構造を示す図である。
学習装置の機能構成例を示す図である。
学習装置により実行される処理を示すフローチャートである。
学習画像の例を示す図である。
学習装置の機能構成例を示す図である。
学習装置の機能構成例を示す図である。
【発明を実施するための形態】
【0010】
以下、添付の図面を参照して、本発明の実施形態について説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。なお、図面間で符号の同じものは同じ動作をするとして重ねての説明を省く。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

キヤノン株式会社
記録装置
6日前
キヤノン株式会社
定着装置
6日前
キヤノン株式会社
記録装置
6日前
キヤノン株式会社
撮像装置
6日前
キヤノン株式会社
電子機器
7日前
キヤノン株式会社
操作装置
7日前
キヤノン株式会社
撮像装置
6日前
キヤノン株式会社
撮像装置
今日
キヤノン株式会社
撮像装置
6日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
液体吐出装置
6日前
キヤノン株式会社
情報処理装置
今日
キヤノン株式会社
画像形成装置
6日前
キヤノン株式会社
画像形成装置
6日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
画像形成装置
6日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
光電変換装置
6日前
キヤノン株式会社
画像形成装置
6日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
液体収容容器
今日
キヤノン株式会社
画像形成装置
6日前
キヤノン株式会社
画像形成装置
10日前
キヤノン株式会社
画像形成装置
今日
キヤノン株式会社
シート給送装置
6日前
キヤノン株式会社
シート給送装置
6日前
キヤノン株式会社
シート給送装置
6日前
キヤノン株式会社
インク収容容器
6日前
キヤノン株式会社
液体吐出ヘッド
6日前
キヤノン株式会社
シート搬送装置
6日前
キヤノン株式会社
画像形成システム
6日前
キヤノン株式会社
トナーの製造方法
7日前
キヤノン株式会社
光学装置及び撮像装置
今日
キヤノン株式会社
撮像装置及び制御方法
7日前
キヤノン株式会社
光学系および撮像装置
7日前
キヤノン株式会社
光電変換装置および機器
今日
続きを見る