TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025106799
公報種別公開特許公報(A)
公開日2025-07-16
出願番号2024216063
出願日2024-12-11
発明の名称特徴抽出装置、画像マッチング機器及びコンピュータプログラム
出願人富士通株式会社
代理人弁理士法人ITOH
主分類G06V 10/82 20220101AFI20250709BHJP(計算;計数)
要約【課題】本発明は、特徴抽出装置、画像マッチング機器及びプログラムを提供する。
【解決手段】特徴抽出装置は、マッチング待ち画像から複数のスケール及び複数の特徴次元を有する特徴を抽出し;抽出された全部又は一部の特徴を特徴次元で整列し、そして、特徴次元で整列された特徴をスケール次元で「小から大へ」かつ「大から小へ」の順に2つずつ整列することで、融合特徴を生成し;複数の分類器を含み、各分類器は対応する融合特徴に割り当てられ、かつスケール次元で「小から大へ」の順に整列された各融合特徴の予測結果と、「大から小へ」の順に整列されたすべての融合特徴の予測結果との間の差を最小化するように訓練され;及び、所定のルールに基づいて融合特徴を前景特徴と背景特徴に分割し、かつ訓練時に、他の分類器について、背景特徴に1つのクラスを増加させる、モジュールを含む。
【選択図】図1

特許請求の範囲【請求項1】
特徴を抽出するための装置であって、
マッチング待ち画像から複数のスケール及び複数の特徴次元を有する特徴をそれぞれ抽出するように構成される特徴抽出モジュール;
抽出された特徴のうちの全部又は一部の特徴を特徴次元で整列し、そして、特徴次元で整列された特徴をスケール次元で「小から大へ」及び「大から小へ」の順に2つずつ整列することで、融合特徴を生成するように構成される特徴融合モジュールであって、前記融合特徴は整列後の特徴及び整列前の特徴を含む、特徴融合モジュール;
複数の分類器を含む分類器モジュールであって、前記複数の分類器のうちの各々は対応する融合特徴に割り当てられ、かつスケール次元で「小から大へ」の順に整列された各融合特徴の予測結果と、「大から小へ」の順に整列されたすべての融合特徴の予測結果との間の差が最小になり、又は、「小から大へ」の順に整列された各融合特徴の予測結果と、「大から小へ」の順に整列されたすべての融合特徴の予測結果との間の差が最小になるように訓練される、分類器モジュール;及び
所定のルールに基づいて前記融合特徴を前景特徴と背景特徴に分割し、かつ前記訓練のときに、他の分類器について、前記前景特徴と比較して前記背景特徴に1つのクラスを増加させるように構成される前景強化モジュールであって、前記前景特徴は前記マッチング待ち画像内の対象のカテゴリーに関連付けられる特徴である、前景強化モジュールを含む、装置。
続きを表示(約 2,300 文字)【請求項2】
請求項1に記載の装置であって、
前記特徴抽出モジュールはN個のバックボーンブロックを含み、前記複数のスケールはN個のスケールを含み、各バックボーンブロックは前記N個のスケールのうちの1つのスケールを有する特徴を抽出するように構成され、Nは2以上の整数である、装置。
【請求項3】
請求項2に記載の装置であって、
前記複数の分類器はN×2個の分類器を含み、前記融合特徴はスケールに基づいてN×2個の特徴集合に分割され、前記N×2個の分類器はそれぞれ前記N×2個の特徴集合に割り当てられる、装置。
【請求項4】
請求項1乃至3のうちの任意の1項に記載の装置であって、
前記予測結果は、前記対象が2つ以上のカテゴリーのうちの各カテゴリーに属する確率分布である、装置。
【請求項5】
請求項4に記載の装置であって、
前記所定のルールは、すべての分類器によって出力される確率分布の正解カテゴリーでの並べ替えに基づいて、前記融合特徴を前記前景特徴と前記背景特徴に分割することである、装置。
【請求項6】
請求項1乃至3のうちの任意の1項に記載の装置であって、
前記複数の分類器は第一損失関数及び第二損失関数に基づいて訓練され、前記前景強化モジュールにおける他の分類器は前記第二損失関数に基づいて訓練され、
総損失関数が記第一損失関数と前記第二損失関数の加重和であり、
前記訓練は、前記総損失関数を最小化することを含む、装置。
【請求項7】
請求項1乃至3のうちの任意の1項に記載の装置であって、
前記特徴次元は抽出される特徴の長さであり、前記スケールは前記マッチング待ち画像の解像度に基づいて取得される、装置。
【請求項8】
画像マッチング機器であって、
マッチング待ち画像から複数のスケール及び複数の特徴次元を有する特徴をそれぞれ抽出するように構成される特徴抽出モジュールであって、抽出された特徴は前記マッチング待ち画像内の対象に関するものである、特徴抽出モジュール;
抽出された特徴のうちの全部又は一部の特徴を特徴次元で整列し、そして、特徴次元で整列された特徴をスケール次元で「小から大へ」及び「大から小へ」の順に2つずつ整列することで、融合特徴を生成するように構成される特徴融合モジュールであって、前記融合特徴は整列後の特徴及び整列前の特徴を含む、特徴融合モジュール;及び
前記融合特徴のうちの全部又は一部をスティッチングし、スティッチング後の特徴と、画像ライブラリ内のすべての画像との間の距離を計算し、そして、計算された結果に基づいて前記画像ライブラリ内のすべての画像を並べ替えるように構成される、マッチングモジュールを含み、
前記特徴抽出モジュール及び前記特徴融合モジュールのそれぞれのネットワークパラメータは、請求項1乃至3のうちの任意の1項に記載の装置を訓練することによって設定される、画像マッチング機器。
【請求項9】
コンピュータに、特徴を抽出するための方法を実行させるためのプログラムであって、
前記方法は、
マッチング待ち画像から複数のスケール及び複数の特徴次元を有する特徴をそれぞれ抽出し;
抽出された特徴のうちの全部又は一部の特徴を特徴次元で整列し、そして、特徴次元で整列された特徴をスケール次元で「小から大へ」及び「大から小へ」の順に2つずつ整列することで、融合特徴を生成し、前記融合特徴は整列後の特徴及び整列前の特徴を含み;
複数の分類器を訓練し、前記複数の分類器のうちの各々は対応する融合特徴に割り当てられ、かつスケール次元で「小から大へ」の順に整列された各融合特徴の予測結果と、「大から小へ」の順に整列されたすべての融合特徴の予測結果との間の差を最小化し、又は、「大から小へ」の順に整列された各融合特徴の予測結果と、「小から大へ」の順に整列されたすべての融合特徴の予測結果との間の差を最小化するように訓練され;及び
所定のルールに基づいて前記融合特徴を前景特徴と背景特徴に分割し、かつ前記訓練のときに、他の分類器について、前記前景特徴と比較して前記背景特徴に1つのクラスを増加させ、前記前景特徴は前記マッチング待ち画像内の対象のカテゴリーに関連付けられる特徴である、ことを含む、プログラム。
【請求項10】
コンピュータに、画像マッチング方法を実行させるためのプログラムであって、
前記画像マッチング方法は、
マッチング待ち画像から複数のスケール及び複数の特徴次元を有する特徴をそれぞれ抽出し、抽出された特徴は前記マッチング待ち画像内の対象に関するものであり;
抽出された特徴のうちの全部又は一部の特徴を特徴次元で整列し、そして、特徴次元で整列された特徴をスケール次元で「小から大へ」及び「大から小へ」の順に2つずつ整列することで、融合特徴を生成し、前記融合特徴は整列後の特徴及び整列前の特徴を含み;及び
前記融合特徴のうちの全部又は一部をスティッチングし、スティッチング後の特徴と、画像ライブラリ内のすべての画像との間の距離を計算し、そして、計算された結果に基づいて前記画像ライブラリ内のすべての画像を並べ替えることを含み、
前記特徴の抽出及び融合は、請求項8に記載の画像マッチング機器における前記特徴抽出モジュール及び前記特徴融合モジュールによって実行される、プログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、ニューラルネットワークの技術分野に関し、特に、細粒度の検証のための特徴抽出技術に関する。
続きを表示(約 1,600 文字)【背景技術】
【0002】
近年、画像又はビデオ内の画像フレームに基づいて買い物客の商品選択の興味を理解する技術が広く注目されている。これは通常、クエリされた商品画像と、画像ライブラリ内の対応する画像とのマッチングを行うことを要する。
【0003】
大型スーパーマーケットでは、往々にして、数百又は数千の商品がある。幾つかの異なるカテゴリーの商品は非常に似ている。同一のカテゴリーの商品であっても、異なる角度から見れば、その外観の相違もかなり大きい。また、商品画像の背景は通常、比較的複雑であり、その中には顧客の手、ショッピングカート、陳列棚などが含まれる可能性がある。これによって、商品を識別(認識)するための特徴を取得することがさらに困難になる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の目的は、従来技術に存在する上述のような問題を解決するために、特徴抽出装置、画像マッチング機器及びコンピュータプログラムを提供することにある。
【課題を解決するための手段】
【0005】
本発明の1つの側面によれば、特徴を抽出するための装置が提供され、それは、
マッチング待ち画像から、複数のスケール(尺度)及び複数の特徴次元を有する特徴をそれぞれ抽出するように構成される特徴抽出モジュール;
抽出された特徴のうちの全部又は一部の特徴を特徴次元で整列(align)し、そして、特徴次元で整列された特徴をスケール次元で「小から大へ」及び「大から小へ」の順に2つずつ整列することで、融合特徴を生成するように構成される特徴融合モジュールであって、融合特徴は整列後の特徴及び整列前の特徴を含む、特徴融合モジュール;
複数の分類器を含む分類器モジュールであって、複数の分類器のうちの各々は対応する融合特徴に割り当てられ、かつスケール次元で「小から大へ」の順に整列された各融合特徴の予測結果と、「大から小へ」の順に整列されたすべての融合特徴の予測結果との間の差を最小化し、又は、「大から小へ」の順に整列された各融合特徴の予測結果と、「小から大へ」の順に整列されたすべての融合特徴の予測結果との間の差を最小化するように訓練(training)される、分類器モジュール;及び
所定のルール(規則)に基づいて融合特徴を前景特徴と背景特徴に分割し、かつ訓練時に、他の分類器について、前景特徴と比較して背景特徴に1つのクラスを増加させるように構成される前景強化モジュールであって、前景特徴はマッチング待ち画像内の対象のカテゴリー(識別カテゴリー/識別待ちカテゴリー)に関連付けられる特徴である、前景強化モジュールを含む。
【0006】
好ましくは、特徴抽出モジュールはN個のバックボーンブロックを含み、複数のスケールはN個のスケールを含み、かつ各バックボーンブロックはN個のスケールのうちの1つのスケールを有する特徴を抽出するように構成され、そのうち、Nは2以上の整数である。
【0007】
好ましくは、複数の分類器はN×2個の分類器を含み、融合特徴はスケールに基づいてN×2個の特徴集合(set)に分割され、かつN×2個の分類器はそれぞれ、N×2個の特徴集合に割り当てられる。
【0008】
好ましくは、複数の分類器は全結合層によって実現され得る。
【0009】
好ましくは、予測結果は、対象が2つ以上のカテゴリーのうちの各カテゴリーに属する確率分布である。
【0010】
好ましくは、所定のルールは、すべての分類器から出力される確率分布の正解(グラウンドトゥルース(Ground Truth))カテゴリーでの並べ替えに基づいて、融合特徴を前景特徴と背景特徴に分割することである。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
対話装置
1か月前
個人
裁判のAI化
5日前
個人
情報処理装置
1か月前
個人
情報処理システム
12日前
個人
情報処理装置
1か月前
個人
検査システム
14日前
個人
記入設定プラグイン
28日前
個人
情報入力装置
1か月前
株式会社サタケ
籾摺・調製設備
13日前
個人
不動産売買システム
20日前
キヤノン電子株式会社
携帯装置
13日前
個人
物価スライド機能付生命保険
1か月前
株式会社カクシン
支援装置
今日
個人
マイホーム非電子入札システム
1か月前
個人
備蓄品の管理方法
12日前
サクサ株式会社
中継装置
13日前
株式会社BONNOU
管理装置
1か月前
キヤノン株式会社
情報処理装置
13日前
キヤノン株式会社
情報処理装置
13日前
東洋電装株式会社
操作装置
13日前
株式会社ワコム
電子消去具
20日前
アスエネ株式会社
排水量管理方法
13日前
ホシデン株式会社
タッチ入力装置
20日前
株式会社東芝
電子機器
21日前
東洋電装株式会社
操作装置
13日前
キヤノン電子株式会社
名刺管理システム
14日前
個人
パターン抽出方法及び通信多重化方法
19日前
株式会社JVCケンウッド
管理装置
14日前
株式会社ライト
情報処理装置
1か月前
株式会社CBE-A
情報処理システム
19日前
住友重機械工業株式会社
力覚伝達装置
1か月前
大王製紙株式会社
RFIDタグ
19日前
株式会社WellGo
個人情報秘匿方法
1か月前
株式会社WellGo
個人情報利用方法
1か月前
キヤノン株式会社
通信端末
14日前
株式会社半導体エネルギー研究所
検索支援方法
1か月前
続きを見る