TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025022789
公報種別
公開特許公報(A)
公開日
2025-02-14
出願番号
2024119492
出願日
2024-07-25
発明の名称
シーン検出
出願人
富士通株式会社
代理人
弁理士法人ITOH
主分類
G06T
7/00 20170101AFI20250206BHJP(計算;計数)
要約
【課題】シーン検出のためのコンピュータにより実施される方法、プログラム及び情報処理装置を提供する。
【解決手段】入力されたシーングラフに基づいてグラフベクトルを生成し、画像ベクトルを生成するよう入力画像を符号化し、更新されたグラフベクトル及び更新されたオブジェクトクエリベクトルを生成するよう更新プロセスを実行する方法であって、更新プロセスは、グラフベクトルに基づきオブジェクトクエリベクトルを更新するステップA、画像ベクトルに基づきオブジェクトクエリベクトルを更新するステップB、オブジェクトクエリベクトルに基づきグラフベクトルを更新するステップC及びオブジェクトの領域及びカテゴリを更新されたオブジェクトクエリベクトルから抽出し、更新されたオブジェクトクエリベクトル及び更新されたグラフベクトルに基づき、入力画像と入力されたシーングラフとの間の類似度を計算するステップDを含む。
【選択図】図6
特許請求の範囲
【請求項1】
コンピュータにより実施される方法であって、
入力されたシーングラフに基づいて、複数のグラフベクトルを生成することと、
複数の画像ベクトルを生成するよう入力画像を符号化することと、
前記複数のグラフベクトル及び少なくとも1つのオブジェクトクエリベクトルを更新して複数の更新されたグラフベクトル及び少なくとも1つの更新されたオブジェクトクエリベクトルを生成するよう更新プロセスを実行することであり、前記更新プロセスは、
前記複数のグラフベクトルに基づき前記少なくとも1つのオブジェクトクエリベクトルを更新することと、
前記複数の画像ベクトルに基づき前記少なくとも1つのオブジェクトクエリベクトルを更新することと、
前記少なくとも1つのオブジェクトクエリベクトルに基づき前記複数のグラフベクトルを更新することと、を含む、前記実行することと、
少なくとも1つのオブジェクトの領域及び前記少なくとも1つのオブジェクトのカテゴリを示す情報を前記少なくとも1つの更新されたオブジェクトクエリベクトルから抽出することと、
前記少なくとも1つの更新されたオブジェクトクエリベクトル及び前記複数の更新されたグラフベクトルに基づき、前記入力画像と前記入力されたシーングラフとの間の類似度を示すマッチングスコアを計算することと
を有する方法。
続きを表示(約 3,100 文字)
【請求項2】
前記更新プロセスは、
前記複数のグラフベクトルに基づき前記少なくとも1つのオブジェクトクエリベクトルを繰り返し更新すること、及び/又は
前記複数の画像ベクトルに基づき前記少なくとも1つのオブジェクトクエリベクトルを繰り返し更新すること、及び/又は
前記少なくとも1つのオブジェクトクエリベクトルに基づき前記複数のグラフベクトルを繰り返し更新すること
を有する、
請求項1に記載のコンピュータにより実施される方法。
【請求項3】
前記更新プロセスは、更新されたマッチングクエリベクトルを生成するよう、入力されたマッチングクエリベクトルを更新することを有し、
前記入力されたマッチングクエリベクトルの更新は、更新されたマッチングクエリベクトルを生成するよう、前記少なくとも1つのオブジェクトクエリベクトル及び前記複数のグラフベクトルに基づき、入力されたマッチングクエリベクトルを更新することを有し、
前記マッチングスコアを計算することは、前記更新されたマッチングクエリベクトルに基づき前記マッチングスコアを計算することを有する、
請求項1又は2に記載のコンピュータにより実施される方法。
【請求項4】
前記複数のグラフベクトルに基づき前記少なくとも1つのオブジェクトクエリベクトルを更新することは、前記少なくとも1つのオブジェクトクエリベクトルと前記複数のグラフベクトルとの間の相関に基づき前記少なくとも1つのオブジェクトクエリベクトルを更新することを有し、かつ/あるいは、
前記複数の画像ベクトルに基づき前記少なくとも1つのオブジェクトクエリベクトルを更新することは、前記少なくとも1つのオブジェクトクエリベクトルと前記複数の画像ベクトルとの間の相関に基づき前記少なくとも1つのオブジェクトクエリベクトルを更新することを有し、かつ/あるいは、
前記少なくとも1つのオブジェクトクエリベクトルに基づき前記複数のグラフベクトルを更新することは、前記少なくとも1つのオブジェクトクエリベクトルのうちの少なくとも1つと前記複数のグラフベクトルとの間の相関に基づき前記複数のグラフベクトルのうちの少なくとも1つを更新することを有する、
請求項1又は2に記載のコンピュータにより実施される方法。
【請求項5】
前記入力されたマッチングクエリベクトルを更新することは、前記少なくとも1つのオブジェクトクエリベクトルと前記複数のグラフベクトルとの間の類似度に基づき前記入力されたマッチングクエリベクトルを更新することを有する、
請求項3に記載のコンピュータにより実施される方法。
【請求項6】
前記入力されたシーングラフは、ラベルが予測されるべきであるマスクノードを含み、
前記コンピュータにより実施される方法は、前記入力画像に基づき前記マスクノードの前記ラベルを予測するよう、前記複数の更新されたグラフベクトル及び/又は前記少なくとも1つの更新されたオブジェクトクエリベクトルから前記マスクノードに関する情報を抽出することを有する、
請求項1又は2に記載のコンピュータにより実施される方法。
【請求項7】
入力されたシーングラフに基づいて、複数回、夫々異なる入力画像を用いて請求項1又は2に記載のコンピュータにより実施される方法を実行して、前記入力されたシーングラフに最も類似している前記入力画像のうちの少なくとも1つを見つけることを有する、
コンピュータにより実施される方法。
【請求項8】
前記入力画像及び前記入力されたシーングラフは、夫々、訓練画像及び訓練シーングラフであり、訓練領域、訓練カテゴリ、訓練マスクノードラベル、及び訓練マッチングスコアのうちの少なくとも1つと関連付けられ、
前記入力されたシーングラフは、ラベルが予測されるべきであるマスクノードを含み、
前記コンピュータにより実施される方法は、前記領域、前記カテゴリ、前記マスクノードの前記ラベル、及び前記マッチングスコアのうちの少なくとも1つを、前記訓練領域、訓練カテゴリ、訓練マスクノードラベル、及び訓練マッチングスコアのうちの少なくとも1つと夫々比較し、該比較に基づき少なくとも1つのネットワーク重みを更新することを更に有する、
請求項1又は2に記載のコンピュータにより実施される方法。
【請求項9】
コンピュータで実行される場合に、前記コンピュータに、
入力されたシーングラフに基づいて、複数のグラフベクトルを生成することと、
複数の画像ベクトルを生成するよう入力画像を符号化することと、
前記複数のグラフベクトル及び少なくとも1つのオブジェクトクエリベクトルを更新して複数の更新されたグラフベクトル及び少なくとも1つの更新されたオブジェクトクエリベクトルを生成するよう更新プロセスを実行することであり、前記更新プロセスは、
前記複数のグラフベクトルに基づき前記少なくとも1つのオブジェクトクエリベクトルを更新することと、
前記複数の画像ベクトルに基づき前記少なくとも1つのオブジェクトクエリベクトルを更新することと、
前記少なくとも1つのオブジェクトクエリベクトルに基づき前記複数のグラフベクトルを更新することと、を含む、前記実行することと、
少なくとも1つのオブジェクトの領域及び前記少なくとも1つのオブジェクトのカテゴリを示す情報を前記少なくとも1つの更新されたオブジェクトクエリベクトルから抽出することと、
前記少なくとも1つの更新されたオブジェクトクエリベクトル及び前記複数の更新されたグラフベクトルに基づき、前記入力画像と前記入力されたシーングラフとの間の類似度を示すマッチングスコアを計算することと
を有する方法を実行させるコンピュータプログラム。
【請求項10】
メモリと、前記メモリに接続されるプロセッサとを有し、前記プロセッサは、
入力されたシーングラフに基づいて、複数のグラフベクトルを生成することと、
複数の画像ベクトルを生成するよう入力画像を符号化することと、
前記複数のグラフベクトル及び少なくとも1つのオブジェクトクエリベクトルを更新して複数の更新されたグラフベクトル及び少なくとも1つの更新されたオブジェクトクエリベクトルを生成するよう更新プロセスを実行することであり、前記更新プロセスは、
前記複数のグラフベクトルに基づき前記少なくとも1つのオブジェクトクエリベクトルを更新することと、
前記複数の画像ベクトルに基づき前記少なくとも1つのオブジェクトクエリベクトルを更新することと、
前記少なくとも1つのオブジェクトクエリベクトルに基づき前記複数のグラフベクトルを更新することと、を含む、前記実行することと、
少なくとも1つのオブジェクトの領域及び前記少なくとも1つのオブジェクトのカテゴリを示す情報を前記少なくとも1つの更新されたオブジェクトクエリベクトルから抽出することと、
前記少なくとも1つの更新されたオブジェクトクエリベクトル及び前記複数の更新されたグラフベクトルに基づき、前記入力画像と前記入力されたシーングラフとの間の類似度を示すマッチングスコアを計算することと
を実行するよう構成される、情報処理装置。
発明の詳細な説明
【技術分野】
【0001】
本発明は、画像解析、特に、シーングラフを使用した画像解析、すなわち、シーン検出に関係があり、本願では、コンピュータにより実施される方法、コンピュータプログラム、及び情報処理装置が開示される。
続きを表示(約 1,600 文字)
【背景技術】
【0002】
画像及び映像内の特定のオブジェクト、動作、及びシーンを検出することは大きい需要がある(例えば、画像認識及び関し、並びにソーシャルメディア投稿、ニュース報告若しくは他の現実世界の用途のための画像及び/又は映像編集などの目的のため)。人工知能、機械学習、及びニューラルネットワーク(NN)の出現は、画像解析並びにオブジェクト検出及び分類のための技術を改善してきた。しかし、新しい用途がこのような技術に生まれるなどのために、改善の必要性が存在する。
【発明の概要】
【0003】
上記を鑑み、シーン検出の方法が望まれている。
【0004】
第1の態様の実施形態に従って、本願では、入力されたシーングラフに基づいて、複数のグラフベクトルを生成することと、複数の画像ベクトルを生成するよう入力画像を符号化することと、複数のグラフベクトル及び少なくとも1つのオブジェクトクエリベクトルを更新して複数の更新されたグラフベクトル及び少なくとも1つの更新されたオブジェクトクエリベクトルを生成するよう更新プロセス(デコーダ処理)を実行することであり、更新プロセスは、(少なくとも1つのオブジェクトクエリベクトルが、シーングラフ内の少なくとも1つのオブジェクトを示す情報を含むように)複数のグラフベクトルに基づき少なくとも1つのオブジェクトクエリベクトルを(繰り返し)更新することと、(入力画像内で検出された少なくとも1つの(関連)オブジェクトを示す情報を用いて)複数の画像ベクトルに基づき少なくとも1つのオブジェクトクエリベクトルを(繰り返し)更新することと、(入力画像内で検出された少なくとも1つの(関連)オブジェクトを示す情報を用いて)少なくとも1つのオブジェクトクエリベクトルに基づき複数のグラフベクトルを(繰り返し)更新することと、を含む、ことと、(入力画像内で検出された)少なくとも1つのオブジェクトの領域及び少なくとも1つのオブジェクトのカテゴリ/クラスを示す情報を少なくとも1つの更新されたオブジェクトクエリベクトルから抽出することと、少なくとも1つの更新されたオブジェクトクエリベクトル及び複数の更新されたグラフベクトル(の間の類似度/相関)に基づき、入力画像(内の検出された少なくとも1つのオブジェクト)と入力されたシーングラフとの間の類似度を示すマッチングスコアを計算することとを有するコンピュータにより実施される方法が開示される。
【0005】
いずれかの態様/実施形態に係る特徴は、いずれかの他の態様/実施形態に適用されてもよい。
【0006】
これより、例として、添付の図面を参照する。
【図面の簡単な説明】
【0007】
比較法を表す図である。
比較法を表す図である。
比較法を表す図である。
システムを表す図である。
実施形態の理解に有用な図である。
更新処理の理解に有用な図である。
方法を表す図である。
システムを表す図である。
実施形態の理解に有用な結果を表す図である。
実施例を表す図である。
方法を表す図である。
システムを表す図である。
実施例を表す図である。
実施例を表す図である。
装置を表す図である。
【発明を実施するための形態】
【0008】
以下の用語が、本明細書中で使用されることがある(リストも定義も包括的ではない。)。
【0009】
ニューラルネットワーク:人間の脳をモデルにした機械学習ネットワーク。
【0010】
画像エンコーダ:入力画像とは異なる方法で、例えば、ピクセルではなく画像の形式で、画像のデータを符号化する処理。圧縮を含むことがある。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
富士通株式会社
電源装置
今日
富士通株式会社
プロセッサ
14日前
富士通株式会社
量子デバイス
14日前
富士通株式会社
画像生成方法
6日前
富士通株式会社
冷却モジュール
8日前
富士通株式会社
評価プログラム、方法、及び装置
6日前
富士通株式会社
無線アクセス・ネットワーク調整
10日前
富士通株式会社
人体のキーポイントの検出方法及び装置
13日前
富士通株式会社
病変検出方法および病変検出プログラム
15日前
富士通株式会社
病変検出方法および病変検出プログラム
15日前
富士通株式会社
タスク特有のグラフセット解析及び視覚化
14日前
富士通株式会社
制御プログラム、システムおよび制御方法
17日前
富士通株式会社
演算処理装置および演算処理装置の動作方法
13日前
富士通株式会社
車両の管理施設情報提供方法及びプログラム
16日前
富士通株式会社
予測プログラム、予測方法及び情報処理装置
1日前
富士通株式会社
方策学習装置、方策学習方法及び通信システム
1日前
富士通株式会社
修正候補特定方法及び修正候補特定プログラム
16日前
富士通株式会社
プログラム、情報処理方法および情報処理装置
6日前
富士通株式会社
プログラム、データ処理装置及びデータ処理方法
8日前
富士通株式会社
ハイブリッド古典‐量子教師なしマルチクラス分類
13日前
富士通株式会社
情報処理装置、手続きプログラムおよび手続き方法
7日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
7日前
富士通株式会社
言語処理プログラム、言語処理装置、及び言語処理方法
14日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
16日前
富士通株式会社
機械学習プログラム、機械学習方法および情報処理装置
13日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
13日前
富士通株式会社
半導体装置、無線通信装置、及び、半導体装置の製造方法
13日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理システム
6日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
2日前
富士通株式会社
期待値算出システム、期待値算出装置、及び期待値算出方法
2日前
富士通株式会社
情報処理プログラム、情報処理装置および情報処理システム
15日前
富士通株式会社
量子デバイスを用いた高次元データストリームにおける変化検出
13日前
富士通株式会社
ニューロモルフィックコンピューティング回路、及び、制御方法
9日前
富士通株式会社
安定構造探索システム、安定構造探索方法及び安定構造探索プログラム
17日前
富士通株式会社
エレベータ管理プログラム、エレベータ管理方法、エレベータ管理装置
3日前
富士通株式会社
スケジュール生成プログラム、スケジュール生成方法および情報処理装置
16日前
続きを見る
他の特許を見る