TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025106196
公報種別
公開特許公報(A)
公開日
2025-07-15
出願番号
2024211934
出願日
2024-12-05
発明の名称
改善されたオブジェクト属性分類
出願人
アクシス アーベー
代理人
園田・小林弁理士法人
主分類
G06T
7/00 20170101AFI20250708BHJP(計算;計数)
要約
【課題】画像におけるオブジェクト属性分類のための方法を提供する。
【解決手段】異なる空間解像度に関連する複数の特徴マップ層を使用してオブジェクトを位置特定し、オブジェクトを分類するようにトレーニングされた人工ニューラルネットワークエンティティから複数のオブジェクト提案を取得すること(S410)と、主要なオブジェクト提案と1つまたは複数の他のオブジェクト提案とを識別すること(S420)と、特徴マップ層を最も重要性が低い特徴マップ層から最も重要性が高い特徴マップ層までランク付けすること(S430)と、主要な提案と他の提案との属性クラス信頼性スコアに基づいて第1の属性についての属性クラスを決定すること(S440)と、を含む。第1の属性についての属性クラスを決定することは、特徴マップ層のランク付け並びにオブジェクトロケーション重複を考慮に入れることを含む。
【選択図】図4
特許請求の範囲
【請求項1】
画像(100)におけるオブジェクト属性分類の方法(400)であって、
- 異なる空間解像度に関連する複数の特徴マップ層(216-j)を使用して画像中のオブジェクト(110、112)を位置特定し、前記オブジェクト(110、112)を分類するようにトレーニングされた人工ニューラルネットワーク(ANN)エンティティ(200、201)の出力から、同じ画像中の複数のオブジェクト提案を取得すること(S410)であって、各オブジェクト提案が、少なくとも、i)同じ第1のオブジェクトクラスについてのオブジェクトクラス信頼性スコアと、ii)前記画像中の推定されるオブジェクトロケーションと、iii)同じ第1の属性についての1つまたは複数の異なる属性クラスの各々についての属性クラス信頼性スコアとを示し、各オブジェクト提案が、前記特徴マップ層のうちの1つに関連する、同じ画像中の複数のオブジェクト提案を取得すること(S410)と、
- 前記複数のオブジェクト提案の中で、およびそれらのそれぞれの示されたオブジェクトクラス信頼性スコアに基づいて、主要なオブジェクト提案と1つまたは複数の他のオブジェクト提案とを含む第1のセットを識別すること(S420)と、
- 前記第1の属性の分類のために有用な情報を抽出する能力に関して、前記特徴マップ層を最も重要性が低い特徴マップ層から最も重要性が高い特徴マップ層までランク付けすること(S430)と、
- 前記第1のセットのすべてのメンバーの1つまたは複数の属性クラス信頼性スコアに基づいて前記第1の属性についての属性クラスを決定すること(S440)であって、前記決定することの一部として、前記1つまたは複数の他のオブジェクト提案に関連する前記特徴マップ層の前記ランク付け、ならびに、前記主要なオブジェクト提案と前記1つまたは複数の他のオブジェクト提案とのオブジェクトロケーション重複を考慮に入れることを含む、前記第1の属性についての属性クラスを決定すること(S440)と
を含み、
前記第1の属性についての前記属性クラスを決定することが、
- 前記1つまたは複数の属性クラスの各特定の属性クラスについて、
* 前記特定の属性クラスについての属性クラス信頼性スコアを示す、前記第1のセットのメンバーにわたって反復すること、
* 各反復について、前記第1のセットの前記メンバーと前記主要なオブジェクト提案とのオブジェクトロケーション重複サイズと、前記メンバーに関連する前記特徴マップ層についての全体的ランク付けスコアと、前記メンバーによって示された前記特定の属性クラスについての前記属性クラス信頼性スコアとの積に等しいまたは前記積に比例する項を決定すること、および
* 前記特定の属性クラスについての全体的属性クラススコアを、前記反復することの間に決定された前記項の和に等しいまたは前記和に比例するものとして決定することと、
- 前記第1の属性についての前記属性クラスを、最も高い全体的属性クラススコアを有する前記属性クラスとして決定することと
をさらに含む、方法(400)。
続きを表示(約 1,200 文字)
【請求項2】
各オブジェクト提案の前記オブジェクトロケーションが、バウンディングボックス(320~326)として示され、前記方法が、前記主要なオブジェクト提案(322)と前記1つまたは複数の他のオブジェクト提案(321、323~326)との前記オブジェクトロケーション重複を決定するための共通部分/和集合(IOU)演算を使用することをさらに含む、請求項1に記載の方法。
【請求項3】
前記ランク付けおよび前記オブジェクトロケーション重複を考慮に入れることは、前記主要なオブジェクト提案とのより大きいオブジェクト重複を有する、およびより重要性が高いとしてランク付けされた特徴マップ層に関連する、オブジェクト提案によって示された属性クラス信頼性スコアが、前記第1の属性の前記属性クラスを決定することにとって、前記主要なオブジェクト提案とのより小さいオブジェクト重複を有する、およびより重要性が低いとしてランク付けされた特徴マップ層に関連する、オブジェクト提案によって示された属性クラス信頼性スコアよりも重要性が高くされることを含む、請求項1または2に記載の方法。
【請求項4】
前記反復することが、前記特定の属性クラスについての最も高い属性クラス信頼性スコアを示す、前記第1のセットのメンバーにわたってのみ実施される、請求項1から3のいずれか一項に記載の方法。
【請求項5】
各特定の属性クラスについての前記全体的属性クラススコアが、さらに、反復される前記第1のセットの前記メンバーの数に反比例するものとして定義される、請求項1から4のいずれか一項に記載の方法。
【請求項6】
前記メンバーに関連する前記特徴マップ層についての前記全体的ランク付けスコアが、前記特徴マップ層についてのランク付けスコアと、前記複数の特徴マップ層のすべてについてのそのようなランク付けスコアの和との比として定義される、請求項1から5のいずれか一項に記載の方法。
【請求項7】
前記複数の特徴マップ層の前記ランク付けが、前記第1の属性に依存する、請求項1から6のいずれか一項に記載の方法。
【請求項8】
非最大抑制(NMS)動作を使用して、前記主要なオブジェクト提案と前記1つまたは複数の他のオブジェクト提案とを識別することをさらに含む、請求項1から7のいずれか一項に記載の方法。
【請求項9】
前記ANNエンティティが、前記複数の特徴マップ層を提供するための特徴ピラミッドネットワーク(FPN)(220)を備える、請求項1から8のいずれか一項に記載の方法。
【請求項10】
前記ANNエンティティが、前記画像の前記異なる空間解像度を提供するための複数の畳み込み層(210)を備える、請求項1から9のいずれか一項に記載の方法。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本開示は、一般に、画像処理の分野に関する。詳細には、本開示は、画像におけるオブジェクトの位置特定(localization)および分類に関し、ならびにオブジェクト属性の分類に関する。
続きを表示(約 3,600 文字)
【背景技術】
【0002】
人工ニューラルネットワーク(ANN)ベースアーキテクチャは、静止画像、またはビデオの画像フレームなど、画像におけるいくつかのオブジェクトクラスの(セマンティック)オブジェクトのインスタンスを検出するために有用であることが判明している。オブジェクトクラスの例は、たとえば、人間、動物、車両、ライセンスプレート、顔、および同様のものを含む。あるオブジェクトクラスのオブジェクトが画像中に存在する可能性があるかどうかをただ決定することに加えて、そのようなアーキテクチャはまた、そのオブジェクトが画像中のどこに位置決め(locate)されるかを推定するようにトレーニングされ得る。現代のそのようなアーキテクチャの一例は特徴ピラミッドネットワーク(FPN)であり、FPNは、異なるスケールにおいてオブジェクトを検出するのに特に好適であると考えられている。
【0003】
ANNベースアーキテクチャはまた、オブジェクトの、1つまたは複数の属性、特徴、さらにはアクティビティを分類するために使用され得る。オブジェクトの属性が、たとえば、色、テクスチャ、オブジェクト形状を含み、たとえば、オブジェクトが現在、ある方向に向いているかどうか、オブジェクトが移動しているのか静止しているのか、オブジェクトが(道路、歩道などの)特定のタイプの表面上に位置決めされるかどうか、あるいはカテゴリー分類され、ラベリングされ得る、オブジェクトまたはそのオブジェクトの所在の任意の他の詳細など、たとえばコンテキストを含み得る。属性分類は、たとえばコンピュータビジョンにおいて、たとえば、属性の適切な分類が、たとえば、同じシーン中に存在する異なるオブジェクトを区別するのを助け得るので、大切なタスクと見なされる。
【0004】
しかしながら、現代のANNベースアーキテクチャは、しばしば、異なるオブジェクトを区別することが可能でなく、代わりに、いくつかのオブジェクト提案を提供することによって働く。各そのような提案は、たとえば、提案されるオブジェクトロケーション、1つまたは複数のオブジェクトクラスについての信頼性スコア、ならびに1つまたは複数の属性についての1つまたは複数の属性クラスについての信頼性スコアを含み得る。したがって、たとえば、画像中にいくつの別個のオブジェクトがあるか、それらのオブジェクトがどこに位置決めされるか、ならびに、最も可能性が高いオブジェクトおよび/またはそのオブジェクトについての属性クラスを確定するために、ANNベースアーキテクチャからの出力の後処理が必要とされる。知られているそのような後処理動作は、いわゆる非最大抑制(NMS:non-maximum suppression)および共通部分/和集合(IOU:intersection-over-union)測度の使用を含む。
【0005】
本開示は、ANNベースアーキテクチャからのオブジェクト提案のそのような後処理を発展させ、現代の技術の1つまたは複数の短所を緩和することを目指す。
【先行技術文献】
【特許文献】
【0006】
Dong Liuら、Simultaneous object localization and attribute classification using multitask deep neural networks、US11087130B2
【非特許文献】
【0007】
Kaiming Heら、Deep Residual Learning for Image Recognition、https://doi.org/10.48550/arXiv.1512.03385
Jing Xuら、RegNet:Self-Regulated Network for Image Classification、https://doi.org/10.48550/arXiv.2101.00590
Tsung-Yi Linら、Feature Pyramid Networks for Object Detection、https://doi.org/10.48550/arXiv.1612.03144
Mingxing Tanら、EfficientDet:Scalable and Efficient Object Detection、https://doi.org/10.48550/arXiv.1911.09070
Wei Liuら、SSD:Single Shot MultiBox Detector、https://doi.org/10.48550/arXiv.1512.02325
Tsung-Yi Linら、Focal Loss for Dense Object Detection、https://doi.org/10.48550/arXiv.1708.02002
Takuya Akibaら、Optuna:A Next-generation Hyperparameter Optimization Framework、https://doi.org/10.48550/arXiv.1907.10902
【発明の概要】
【0008】
上記で述べられた目的のために、本開示は、添付の独立請求項によって定義される、画像におけるオブジェクト属性分類のための改善された方法、デバイス、コンピュータプログラムおよびコンピュータプログラム製品を提案する。様々な実施形態が、添付の従属請求項によって定義される。
【0009】
本開示の第1の態様によれば、画像におけるオブジェクト属性分類の方法が提供される。本方法は、異なる空間解像度に関連する複数の特徴マップ層を使用して画像中のオブジェクトを位置特定し、そのオブジェクトを分類するようにトレーニングされた人工ニューラルネットワーク(ANN)エンティティの出力から、同じ画像中の複数のオブジェクト提案を取得することであって、各オブジェクト提案が、少なくとも、i)同じ第1のオブジェクトクラスについてのオブジェクトクラス信頼性スコアと、ii)画像中の推定されるオブジェクトロケーションと、iii)同じ第1の属性についての1つまたは複数の異なる属性クラスの各々についての属性クラス信頼性スコアとを示し、各オブジェクト提案が、特徴マップ層のうちの1つに関連する、同じ画像中の複数のオブジェクト提案を取得することを含む。本方法は、複数のオブジェクト提案の中で、およびそれらのそれぞれの示されたオブジェクトクラス信頼性スコアに基づいて、主要なオブジェクト提案と1つまたは複数の他のオブジェクト提案とを含む第1のセットを識別することをさらに含む。本方法は、特徴マップ層を最も重要性が低い(least significant)特徴マップ層から最も重要性が高い(most significant)特徴マップ層までランク付けすることをさらに含む。本方法は、第1のセットのすべてのメンバーの1つまたは複数の属性クラス信頼性スコアに基づいて第1の属性についての属性クラスを決定することであって、上記決定することの一部として、1つまたは複数の他のオブジェクト提案に関連する特徴マップ層のランク付け、ならびに、主要なオブジェクト提案と1つまたは複数の他のオブジェクト提案とのオブジェクトロケーション重複を考慮に入れることを含む、第1の属性についての属性クラスを決定することをさらに含む。
【0010】
本明細書で後でより詳細に説明されるように、想定される方法は、主要なオブジェクト提案であると見なされない1つまたは複数のオブジェクト提案において見つけられるオブジェクト属性に関係する情報をただ無視するのではないという点で、現在利用可能な技術を改善する。代わりに、想定される方法は、この情報を、主要なオブジェクト提案によって提供される情報とともに使用し、特に、オブジェクトの特定の第1の属性についての最終の推定される属性クラスを判断するとき、特定の特徴マップ層から発生した情報が、より多い重みを与えられるべきであるのかより少ない重みを与えられるべきであるのかをも考慮する。本明細書において後に例示されるように、これは、たとえば、2つ以上のオブジェクトが画像の同じ部分中に存在するとき、属性を間違って分類する危険を低減する。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
対話装置
1か月前
個人
政治のAI化
2か月前
個人
裁判のAI化
5日前
個人
情報処理装置
1か月前
個人
情報処理システム
12日前
個人
記入設定プラグイン
28日前
個人
検査システム
14日前
個人
情報処理装置
1か月前
個人
プラグインホームページ
1か月前
個人
情報入力装置
1か月前
株式会社サタケ
籾摺・調製設備
13日前
キヤノン電子株式会社
携帯装置
13日前
個人
不動産売買システム
20日前
株式会社カクシン
支援装置
今日
個人
物価スライド機能付生命保険
1か月前
個人
備蓄品の管理方法
12日前
個人
マイホーム非電子入札システム
1か月前
キヤノン株式会社
画像処理装置
2か月前
キヤノン株式会社
情報処理装置
13日前
キヤノン株式会社
情報処理装置
13日前
株式会社BONNOU
管理装置
1か月前
サクサ株式会社
中継装置
13日前
キヤノン電子株式会社
名刺管理システム
14日前
東洋電装株式会社
操作装置
13日前
サクサ株式会社
カードの制動構造
1か月前
個人
決済手数料0%のクレジットカード
1か月前
株式会社ワコム
電子消去具
20日前
ホシデン株式会社
タッチ入力装置
20日前
東洋電装株式会社
操作装置
13日前
アスエネ株式会社
排水量管理方法
13日前
株式会社東芝
電子機器
21日前
村田機械株式会社
割当補助システム
1か月前
株式会社ライト
情報処理装置
1か月前
個人
パターン抽出方法及び通信多重化方法
19日前
トヨタ自動車株式会社
情報処理装置
1か月前
株式会社JVCケンウッド
管理装置
14日前
続きを見る
他の特許を見る