TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025076332
公報種別公開特許公報(A)
公開日2025-05-15
出願番号2024181408
出願日2024-10-17
発明の名称対象認識装置、対象認識方法及びコンピュータ読み取り可能な記憶媒体
出願人富士通株式会社
代理人弁理士法人ITOH
主分類G06T 7/00 20170101AFI20250508BHJP(計算;計数)
要約【課題】対象認識装置、対象認識方法及びコンピュータ読み取り可能な記憶媒体を提供する。
【解決手段】該対象認識装置は、ビデオセグメントに含まれる複数のフレームのうちの各フレームの認識すべき対象に関する特徴を抽出する特徴抽出部と、該複数のフレームのうちの各フレームの認識すべき対象に関する品質を推定する品質推定部と、該複数のフレームの品質に基づいて該ビデオセグメントを複数のサブセグメントに分割する分割部と、該複数のサブセグメントのうちの各サブセグメントの品質が第1の所定閾値以上であるフレームの特徴に基づいて、該ビデオセグメントの認識結果を取得する対象認識部と、を含む。
【選択図】図1

特許請求の範囲【請求項1】
ビデオセグメントに含まれる複数のフレームのうちの各フレームの認識すべき対象に関する特徴を抽出する特徴抽出部と、
前記複数のフレームのうちの各フレームの認識すべき対象に関する品質を推定する品質推定部と、
前記複数のフレームの品質に基づいて前記ビデオセグメントを複数のサブセグメントに分割する分割部と、
前記複数のサブセグメントのうちの各サブセグメントの品質が第1の所定閾値以上であるフレームの特徴に基づいて、前記ビデオセグメントの認識結果を取得する対象認識部と、を含む、対象認識装置。
続きを表示(約 1,600 文字)【請求項2】
前記ビデオセグメントの認識結果を取得することは、
前記複数のサブセグメントのうちの各サブセグメントについて、該サブセグメントに含まれる品質が前記第1の所定閾値以上であるフレームの特徴に基づいて、前記認識すべき対象を認識し、該サブセグメントの認識結果を取得することと、
前記複数のサブセグメントの認識結果に基づいて、前記ビデオセグメントの認識結果を決定することと、を含む、請求項1に記載の対象認識装置。
【請求項3】
前記分割部は、前記複数のフレームの品質を表す品質曲線の極小値に対応するフレームを分割点として決定し、前記分割点に基づいて前記ビデオセグメントを複数のサブセグメントに分割する、請求項2に記載の対象認識装置。
【請求項4】
前記分割部は、前記分割点から、
相互の間隔が第3の所定閾値以下である2つの隣接する分割点のうちの小さいフレーム番号に対応する分割点、及び/又は、
第2の所定閾値以上である極小値に対応する分割点を除去する、請求項3に記載の対象認識装置。
【請求項5】
前記特徴抽出部は、予め訓練されたモデルの特徴抽出層を用いて前記特徴を抽出し、
前記品質推定部は、前記予め訓練されたモデルの品質推定層を用いて前記品質を推定し、
前記予め訓練されたモデルは、目標対象の正解値及び品質の正解値がラベル付けされた訓練画像セットを用いてモデルを共同訓練することによって得られる、請求項1に記載の対象認識装置。
【請求項6】
前記対象認識部は、
前記複数のサブセグメントのうちの各サブセグメントについて、該サブセグメントに含まれるフレームのうちの品質が前記第1の所定閾値以上である複数のフレームの特徴の平均値を該サブセグメントの特徴として取得し、或いは、該サブセグメントに含まれるフレームのうちの品質が前記第1の所定閾値以上である複数のフレームのうちの各フレームの品質に基づいて該フレームの特徴に対して重みを設定し、重みが設定された前記複数のフレームの特徴の平均値を該サブセグメントの特徴として取得し、
該サブセグメントの特徴に基づいて前記認識すべき対象を認識し、該サブセグメントの認識結果を取得する、請求項2に記載の対象認識装置。
【請求項7】
該サブセグメントの特徴に基づいて前記認識すべき対象を認識することは、該サブセグメントの特徴と予め設定されたデータベースにおける特徴とを比較し、比較結果に基づいて前記認識すべき対象を認識することを含み、
前記対象認識装置は、サブセグメントの認識結果に基づいて、前記サブセグメントの特徴を前記予め設定されたデータベースに記憶する、請求項6に記載の対象認識装置。
【請求項8】
前記ビデオセグメントは、リアルタイムに撮影されたビデオから軌跡抽出方法を用いてリアルタイムに抽出される、請求項1乃至7の何れかに記載の対象認識装置。
【請求項9】
ビデオセグメントに含まれる複数のフレームのうちの各フレームの認識すべき対象に関する特徴を抽出するステップと、
前記複数のフレームのうちの各フレームの認識すべき対象に関する品質を推定するステップと、
前記複数のフレームの品質に基づいて前記ビデオセグメントを複数のサブセグメントに分割するステップと、
前記複数のサブセグメントのうちの各サブセグメントの品質が第1の所定閾値以上であるフレームの特徴に基づいて、前記ビデオセグメントの認識結果を取得するステップと、を含む、対象認識方法。
【請求項10】
命令が記憶されているコンピュータ読み取り可能な記憶媒体であって、前記命令がコンピュータにより実行される際に、前記コンピュータに請求項9に記載の対象認識方法を実行させる、記憶媒体。

発明の詳細な説明【技術分野】
【0001】
本開示は、対象認識の分野に関し、具体的には、対象認識装置、対象認識方法及びコンピュータ読み取り可能な記憶媒体に関する。
続きを表示(約 1,900 文字)【背景技術】
【0002】
情報化時代の全面的な発展に伴い、対象(例えば、人、動物、物体など)を認識する技術の応用範囲は益々広くなっている。
【発明の概要】
【発明が解決しようとする課題】
【0003】
以下は、本開示の態様を基本的に理解させるために、本開示の簡単な概要を説明する。なお、この簡単な概要は、本開示を網羅的な概要ではなく、本開示のポイント又は重要な部分を意図的に特定するものではなく、本開示の範囲を意図的に限定するものではなく、後述するより詳細的な説明の前文として、単なる概念を簡単な形で説明することを目的とする。
【0004】
本開示は、改良された対象認識装置、対象認識方法及びコンピュータ読み取り可能な記憶媒体を提供することを目的とする。
【課題を解決するための手段】
【0005】
本開示の1つの態様では、ビデオセグメントに含まれる複数のフレームのうちの各フレームの認識すべき対象に関する特徴を抽出する特徴抽出部と、前記複数のフレームのうちの各フレームの認識すべき対象に関する品質を推定する品質推定部と、前記複数のフレームの品質に基づいて前記ビデオセグメントを複数のサブセグメントに分割する分割部と、前記複数のサブセグメントのうちの各サブセグメントの品質が第1の所定閾値以上であるフレームの特徴に基づいて、前記ビデオセグメントの認識結果を取得する対象認識部と、を含む、対象認識装置を提供する。
【0006】
本開示のもう1つの態様では、ビデオセグメントに含まれる複数のフレームのうちの各フレームの認識すべき対象に関する特徴を抽出するステップと、前記複数のフレームのうちの各フレームの認識すべき対象に関する品質を推定するステップと、前記複数のフレームの品質に基づいて前記ビデオセグメントを複数のサブセグメントに分割するステップと、前記複数のサブセグメントのうちの各サブセグメントの品質が第1の所定閾値以上であるフレームの特徴に基づいて、前記ビデオセグメントの認識結果を取得するステップと、を含む、対象認識方法を提供する。
【0007】
本開示の他の態様では、上記の本開示の方法を実現するためのコンピュータプログラムコード及びコンピュータプログラム製品、並びに上記の本開示の方法を実現するためのコンピュータプログラムコードが記録されているコンピュータ読み取り可能な記憶媒体をさらに提供する。
【0008】
以下は、本開示の実施例の他の態様を説明し、特に本開示の好ましい実施例を詳細に説明するが、本開示はこれらの実施例に限定されない。
【図面の簡単な説明】
【0009】
本開示の原理及び利点を理解させるために、図面を参照しながら本開示の各実施例を説明する。全ての図面において、同一又は類似の符号で同一又は類似の構成部を示している。ここで説明される図面は、本開示の好ましい実施例を例示し、本開示の原理及び利点を解釈するためのものであり、全ての可能な実施例ではなく、本開示の範囲を限定するものではない。
本開示の実施例に係る対象認識装置の機能的構成の一例を示すブロック図である。
図2A及び図2Bは質量曲線の一例を示す図である。
図2A及び図2Bは質量曲線の一例を示す図である。
図3A乃至図3Cはサブセグメントの分割の一例を示す概略図である。
図3A乃至図3Cはサブセグメントの分割の一例を示す概略図である。
図3A乃至図3Cはサブセグメントの分割の一例を示す概略図である。
対象認識の一例を示す概略図である。
対象認識装置に適用可能なモデルの訓練プロセスの一例を示す概略図である。
本開示に係る技術と従来技術との比較の一例を示す図である。
本開示の実施例に係る対象認識方法の流れの一例を示すフローチャートである。
本開示の実施例に適用可能なパーソナルコンピュータの例示的な構成を示すブロック図である。
【発明を実施するための形態】
【0010】
以下、図面を参照しながら本開示の例示的な実施例を詳細に説明する。説明の便宜上、明細書には実際の実施形態の全ての特徴が示されていない。なお、実際に実施する際に、開発者の具体的な目標を実現するために、特定の実施形態を変更してもよい、例えばシステム及び業務に関する制限条件に応じて実施形態を変更してもよい。また、開発作業が非常に複雑であり、且つ時間がかかるが、本公開の当業者にとって、この開発作業は単なる例の作業である。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
測定装置
15日前
富士通株式会社
画像変換機器と方法
18日前
富士通株式会社
データセット特徴タイプ推論
1日前
富士通株式会社
信号相関量の確定装置と方法
1日前
富士通株式会社
光伝送装置および光伝送システム
2日前
富士通株式会社
双方向光リンクの異常モニタリング
4日前
富士通株式会社
大規模言語モデルを使用したデータ調整
1日前
富士通株式会社
情報処理プログラムおよび情報処理方法
1日前
富士通株式会社
圧縮プログラム、圧縮方法および圧縮装置
15日前
富士通株式会社
選択プログラム、選択装置、及び選択方法
4日前
富士通株式会社
赤外線センサ、及び赤外線センサの製造方法
10日前
富士通株式会社
広告画像を生成する方法、装置及び記憶媒体
8日前
富士通株式会社
無線アクセスネットワークプロビジョニング
1日前
富士通株式会社
光送信機サブ信号光位相差の確定装置と方法
1日前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
1日前
富士通株式会社
量子ビットデバイス及び量子ビットデバイスの製造方法
8日前
富士通株式会社
情報処理プログラム、情報処理方法、及び情報処理装置
2日前
富士通株式会社
光送信機のサブ信号の遅延差のリアルタイム監視装置及び方法
1日前
富士通株式会社
ブロックチェーンに基づくエスクローされたマーケットプレイス
1日前
富士通株式会社
光伝送路特性推定装置、光伝送システム、及び光伝送路特性推定方法
2日前
富士通株式会社
共有メモリ制御プログラム、共有メモリ制御方法および情報処理装置
1日前
富士通株式会社
スタート支援装置、スタート支援方法、およびスタート支援プログラム
2日前
富士通株式会社
機械学習プログラム、機械学習方法、推論プログラム、推論方法及び情報処理装置
15日前
富士通株式会社
交通シミュレーションの進化を予測するための、コンピュータにより実施される方法
17日前
富士通株式会社
依存情報を列に集約したマトリクススケジューラ及びマトリクススケジューリング方法
9日前
富士通株式会社
量子回路シミュレーションプログラム、量子回路シミュレーション方法および情報処理装置
10日前
個人
対話装置
22日前
個人
情報処理装置
22日前
個人
情報処理装置
18日前
個人
記入設定プラグイン
10日前
個人
情報入力装置
22日前
個人
不動産売買システム
2日前
個人
物価スライド機能付生命保険
22日前
個人
マイホーム非電子入札システム
22日前
株式会社BONNOU
管理装置
15日前
個人
決済手数料0%のクレジットカード
25日前
続きを見る