TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025161250
公報種別
公開特許公報(A)
公開日
2025-10-24
出願番号
2024064278
出願日
2024-04-11
発明の名称
検出プログラム、検出方法および情報処理装置
出願人
富士通株式会社
代理人
弁理士法人酒井国際特許事務所
主分類
G06T
7/00 20170101AFI20251017BHJP(計算;計数)
要約
【課題】映像データにおいて見え方が変化する物体への物体検出モデルの検出精度低下を抑制すること。
【解決手段】情報処理装置は、映像データの各フレームを物体検出モデルに入力し、フレームにおける物体の画像上の検出位置と、信頼度スコアを取得する。情報処理装置は、信頼度スコアが第1閾値以上である場合にフレームに物体が存在すると判定した第1結果と、信頼度スコアが第1閾値より高い第2閾値以上である場合にフレームに物体が存在すると判定した第2結果とを取得する。情報処理装置は、第1結果と第2結果に基づいて映像データのうち物体が存在する期間を特定した第3結果を取得する。情報処理装置は、第3結果と正解データとの差が小さくなるように第1閾値と第2閾値を設定する。
【選択図】図5
特許請求の範囲
【請求項1】
映像データの各フレームを物体検出モデルに入力し、前記フレームにおける物体の画像上の検出位置と、信頼度スコアを取得し、
前記信頼度スコアが第1閾値以上である場合に前記フレームに物体が存在すると判定した第1結果と、前記信頼度スコアが前記第1閾値より高い第2閾値以上である場合に前記フレームに物体が存在すると判定した第2結果とを取得し、
前記第1結果と前記第2結果に基づいて前記映像データのうち前記物体が存在する期間を特定した第3結果を取得し、
前記第3結果と正解データとの差が小さくなるように前記第1閾値と前記第2閾値を設定する
処理をコンピュータに実行させることを特徴とする検出プログラム。
続きを表示(約 1,400 文字)
【請求項2】
前記第1結果は前記信頼度スコアが第1閾値以上となる前記フレームの複数の第1期間を含み、前記第2結果は前記信頼度スコアが第2閾値以上となる前記フレームの複数の第2期間を含み、前記第3結果を取得する処理は、前記複数の第1期間のうち、前記第2期間を含む期間となる第1期間を、前記第3結果として取得することを特徴とする請求項1に記載の検出プログラム。
【請求項3】
映像データの各フレームを前記物体検出モデルに入力することで取得される前記信頼度スコアと、前記設定する処理によって設定された前記第1閾値と前記第2閾値とを基にして、前記映像データの各フレームから物体検出を行う処理を更にコンピュータに実行させることを特徴とする請求項1に記載の検出プログラム。
【請求項4】
先の第1期間の終了時刻から、前記先の第1期間の直後の第1期間の開始時刻までの時間が所定の時間閾値未満である場合に、前記先の第1期間の開始時刻から、前記直後の第1期間の終了時刻までの期間を、新たな第1期間に設定し、
先の第2期間の終了時刻から、前記先の第2期間の直後の第2期間の開始時刻までの時間が前記所定の時間閾値未満である場合に、前記先の第2期間の開始時刻から、前記直後の第2期間の終了時刻までの期間を、新たな第2期間に設定する処理を更にコンピュータに実行させることを特徴とする請求項1に記載の検出プログラム。
【請求項5】
前記正解データに含まれる時系列のフレームを分析し、前記時系列のフレームのうち、対象の物体が映っていないが、前記対象の物体が存在するフレームを特定し、特定したフレームに物体が存在する情報を付与する処理を更にコンピュータに実行させることを特徴とする請求項1に記載の検出プログラム。
【請求項6】
映像データの各フレームを物体検出モデルに入力し、前記フレームにおける物体の画像上の検出位置と、信頼度スコアを取得し、
前記信頼度スコアが第1閾値以上である場合に前記フレームに物体が存在すると判定した第1結果と、前記信頼度スコアが前記第1閾値より高い第2閾値以上である場合に前記フレームに物体が存在すると判定した第2結果とを取得し、
前記第1結果と前記第2結果に基づいて前記映像データのうち前記物体が存在する期間を特定した第3結果を取得し、
前記第3結果と正解データとの差が小さくなるように前記第1閾値と前記第2閾値を設定する
処理をコンピュータが実行することを特徴とする検出方法。
【請求項7】
映像データの各フレームを物体検出モデルに入力し、前記フレームにおける物体の画像上の検出位置と、信頼度スコアを取得し、
前記信頼度スコアが第1閾値以上である場合に前記フレームに物体が存在すると判定した第1結果と、前記信頼度スコアが前記第1閾値より高い第2閾値以上である場合に前記フレームに物体が存在すると判定した第2結果とを取得し、
前記第1結果と前記第2結果に基づいて前記映像データのうち前記物体が存在する期間を特定した第3結果を取得し、
前記第3結果と正解データとの差が小さくなるように前記第1閾値と前記第2閾値を設定する
処理を実行する制御部を有する情報処理装置。
発明の詳細な説明
【技術分野】
【0001】
本発明は、検出プログラム等に関する。
続きを表示(約 1,500 文字)
【背景技術】
【0002】
物体検出には、YOLO(You Only Look Once)等のDL(Deep Learning)モデルが利用されている。DLモデルからは、物体のラベル、画像上の物体の位置、信頼度スコアが得られる。信頼度スコアが高いほど、正しく物体を検出している可能性が高いことを示す。
【0003】
従来技術では、DLモデルを推論に用いる場合、信頼度スコアに対して閾値を設け、閾値を超える信頼度スコアの検出結果を採用する。なお、従来技術では、誤検出を抑制したい場合には閾値を高く設定し、未検出を抑制したい場合には閾値を低く設定している。
【先行技術文献】
【特許文献】
【0004】
特表2022-545030号公報
特開2020-86545号公報
特表2021-506017号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述した従来技術では、誤検出を抑制しようとすると未検出が増え、未検出を抑制しようとすると誤検出が増えるという、互いに影響を及ぼす関係にあるため、信頼度スコアに対する閾値の設定が難しい。以下の説明では、適宜、信頼度スコアの閾値を、単に閾値と表記する。
【0006】
図21は、DLモデルの閾値と検出結果の関係を説明するための図である。図21に示すグラフG1の縦軸は「Precision」に対応する軸であり、横軸は「Recall」に対応する軸である。線l1は、Precision Recall Curveと呼ばれ、閾値を変更することで、描画される(閾値に応じて、PrecisionとRecallとの関係が定まる)。
【0007】
図22は、PrecisionおよびRecallを説明するための図である。図22のテーブルTa1において、「正解:陽性」は、正解データが陽性であることを示す。「正解:陰性」は、正解データが陰性であることを示す。「予測:陽性」は、DLモデルの予測結果(検出結果)が陽性であることを示す。「予測:陰性」は、DLモデルの予測結果が陰性であることを示す。
【0008】
「正解:陽性」かつ「予測:陽性」であることを「TP(True Positive)」とする。「正解:陽性」かつ「予測:陰性」であることを「FN(False Negative)」とする。「正解:陰性」かつ「予測:陽性」であることを「FP(False Positive)」とする。「正解:陰性」かつ「予測:陰性」であることを「TP(True Positive)」とする。
【0009】
ここで、Precisionは「TP/(TP+FP)」によって定義される。Precisionの値が大きいほど、誤検出が抑制されていることを示す。Recallは「TP/(TP+FN)」によって定義される。Recallの値が大きいほど、未検出が抑制されていることを示す。
【0010】
図21の説明に戻る。たとえば、閾値(conf-thres)を「0.9」に設定すると、Precision=「0.98」、Recall=「0.3」となる。一方、閾値を「0.1」に設定すると、Precision=「0.2」、Recall=「0.9」となる。すなわち、誤検出を抑制しようとして閾値を大きくすると未検出が増え、閾値を小さくして未検出を抑制しようとすると誤検出が増えることが、図21の線l1によって示される。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
富士通株式会社
半導体装置
16日前
富士通株式会社
行列演算回路
26日前
富士通株式会社
周波数変換器
29日前
富士通株式会社
画像処理モデル
4日前
富士通株式会社
メッシュ微細化
17日前
富士通株式会社
半導体デバイス
16日前
富士通株式会社
演算器及び演算方法
17日前
富士通株式会社
ポイントクラウド分類
11日前
富士通株式会社
ハイブリッド光増幅器
1か月前
富士通株式会社
冷却装置及び電子機器
26日前
富士通株式会社
電子機器筐体及び電子機器
15日前
富士通株式会社
アレイアンテナモジュール
18日前
富士通株式会社
光送信器及び光トランシーバ
15日前
富士通株式会社
通信制御装置及び移動中継装置
23日前
富士通株式会社
演算処理装置及び演算処理方法
1か月前
富士通株式会社
基板及びこれを備えた電子装置
18日前
富士通株式会社
テキスト案内される画像エディタ
11日前
富士通株式会社
波長変換装置および波長変換方法
1日前
富士通株式会社
動的多次元メディアコンテンツ投影
1か月前
富士通株式会社
ラックマウント装置及びラック装置
1日前
富士通株式会社
メモリ管理装置及びメモリ管理方法
10日前
富士通株式会社
異常予測方法および異常予測プログラム
1か月前
富士通株式会社
管理装置、管理方法、および管理プログラム
24日前
富士通株式会社
演算システムおよび演算システムの制御方法
1か月前
富士通株式会社
生成人工知能を使用したデータセット符号化
1か月前
富士通株式会社
プログラム、情報処理方法および情報処理装置
22日前
富士通株式会社
予測プログラム、予測方法および情報処理装置
1か月前
富士通株式会社
交通シミュレーションのための方法および装置
1か月前
富士通株式会社
シストリック型の演算アレイ装置及び制御方法
1か月前
富士通株式会社
推定プログラム、推定方法および情報処理装置
1か月前
富士通株式会社
生成プログラム、生成方法および情報処理装置
9日前
富士通株式会社
検出プログラム、検出方法および情報処理装置
1日前
富士通株式会社
制御プログラム、制御方法、および情報処理装置
24日前
富士通株式会社
探索プログラム、探索方法、および情報処理装置
15日前
富士通株式会社
キャッシュ装置およびキャッシュ装置の制御方法
16日前
富士通株式会社
プログラム、データ処理装置及びデータ処理方法
16日前
続きを見る
他の特許を見る