TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025074025
公報種別
公開特許公報(A)
公開日
2025-05-13
出願番号
2024184519
出願日
2024-10-21
発明の名称
ビデオ内の手の動きを検出するための装置、方法及びコンピュータプログラム
出願人
富士通株式会社
代理人
弁理士法人ITOH
主分類
G06T
7/60 20170101AFI20250502BHJP(計算;計数)
要約
【課題】本発明は、ビデオ内の手の動きを検出するための装置、方法及び記憶媒体を提供する。
【解決手段】装置は、ビデオ内の各フレーム画像における手の3Dキーポイントに関する情報を得るユニットであって、手の3Dキーポイントに関する情報は少なくとも、手の各関節点の3D空間における位置を含む、もの;手の3Dキーポイントに関する情報に基づいて各フレーム画像の手の状態情報を得るユニットであって、手の状態情報は少なくとも、指セグメントの屈曲状態を含む、もの;ビデオの時間フラグメントにおける手の状態情報の変化を得るユニット;及び、手の状態情報の変化及び手の動きに関するルールに基づいて時間フラグメントにおける手の動きを確定するユニットを含む。
【選択図】図2
特許請求の範囲
【請求項1】
ビデオ内の手の動きを検出するための装置であって、
前記ビデオ内の各フレーム画像におけるの前記手の3Dキーポイントに関する情報を取得する取得ユニットであって、前記手の3Dキーポイントに関する情報は少なくとも、前記手の各関節点の3D空間における位置を含む、取得ユニット;
前記手の3Dキーポイントに関する情報に基づいて各フレーム画像の前記手の状態情報を取得する計算ユニットであって、前記手の状態情報は少なくとも、指セグメントの屈曲状態を含む、計算ユニット;
前記ビデオの時間フラグメント内の前記手の状態情報の変化を取得する分析ユニット;及び
前記手の状態情報の変化と、前記手の動きに関するルールとに基づいて、前記時間フラグメント内の前記手の動作を確定する確定ユニットを含む、装置。
続きを表示(約 1,900 文字)
【請求項2】
請求項1に記載の装置であって、
前記指セグメントの屈曲状態とは指セグメントの屈曲度合いを指し、
前記計算ユニットは前記手の3Dキーポイントに関する情報に基づいて各フレーム画像の指セグメントの屈曲度合いを計算し、
前記分析ユニットは各スライディングウィンドウについて、前記ビデオのスライディングウィンドウ内のマルチフレーム画像の指セグメントの屈曲度合いの傾向を分析し、
複数の連続したスライディングウィンドウのうちの各スライディングウィンドウにおいて指セグメントの屈曲度合いがすべて増加する場合に、前記確定ユニットは複数の連続したスライディングウィンドウの時間長内のビデオが手の掴み動作に関連していると確定する、装置。
【請求項3】
請求項2に記載の装置であって、
前記確定ユニットは前記スライディングウィンドウ内の手の甲の向きの変化が第一閾値よりも大きいかを判断し、第一閾値よりも大きい場合に、動作が掴み動作ではないと確定する、装置。
【請求項4】
請求項2に記載の装置であって、
前記分析ユニットは複数の連続したスライディングウィンドウの時間長内の指セグメントの屈曲度合いのシーケンスの傾きを分析し、
前記傾きが第二閾値よりも大きいときに、前記確定ユニットは前記動作が掴み動作であると確定する、装置。
【請求項5】
請求項1に記載の装置であって、
前記指セグメントの屈曲状態とは指セグメントの屈曲度合いを指し、
前記計算ユニットは前記ビデオのスライディングウィンドウ内のマルチフレーム画像の指の向き、指セグメントの屈曲度合い、及び手の甲の向きを計算し、
前記分析ユニットは前記指の向き、前記指セグメントの屈曲度合い、及び前記手の甲の向きの変化を分析し、
複数の連続したスライディングウィンドウのうちの各スライディングウィンドウの計算結果が、すべて、
指の向きの偏差が増加し;
指セグメントの屈曲度合いの変化が第三閾値よりも小さく;
手の甲の向きの変化が第四閾値よりも小さく;及び
スライディングウィンドウ内の指セグメントの屈曲度合いの平均値が第五閾値よりも大きい
という条件を満たす場合に、前記確定ユニットは複数の連続したスライディングウィンドウの時間長内のビデオが手のひねり動作に関連していると確定する、装置。
【請求項6】
請求項2又は5に記載の装置であって、
前記指セグメントの屈曲度合いが親指以外の4つの指と、付け根の骨格との間の夾角の平均値で表され;又は
前記指セグメントの屈曲度合いが親指以外の4つの指の3つの関節点の屈曲度の和で表され、かつ屈曲度の和を求めるときに、関節点が付け根に近いほど、該関節点の屈曲度の重みが高くなる、装置。
【請求項7】
請求項5に記載の装置であって、
前記指の向きが前記指の所在する平面の法線ベクトルで表され、
前記計算ユニットはスライディングウィンドウ内の各フレーム画像と、初期フレーム画像との間の指の向きの偏差を計算することで指の向きの偏差を取得する、装置。
【請求項8】
請求項3又は5に記載の装置であって、
前記手の甲の向きが手首と、人差し指の付け根とにより形成されるベクトル、及び、手首と、小指の付け根とにより形成されるベクトルの法線方向で表され、
前記手の甲の向きの変化が前記手の甲の向きと、前記手の所在する座標系のx軸、y軸及びz軸との間の夾角の標準偏差で表される、装置。
【請求項9】
ビデオ内の手の動きを検出するための方法であって、
前記ビデオ内の各フレーム画像における手の3Dキーポイントに関する情報を取得し、前記手の3Dキーポイントに関する情報は少なくとも、前記手の各関節点の3D空間における位置を含み;
前記手の3Dキーポイントに関する情報に基づいて各フレーム画像の前記手の状態情報を取得し、前記手の状態情報は少なくとも、指セグメントの屈曲状態を含み;
前記ビデオの時間フラグメント内の前記手の状態情報の変化を取得し;及び
前記手の状態情報の変化と、前記手の動きに関するルールとに基づいて、前記時間フラグメント内の手の動作を確定することを含む、方法。
【請求項10】
コンピュータに、請求項9に記載の方法を実行させるためのプログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、ビデオ分析(解析)の技術分野に関し、特に、ビデオ内の手の動き(動作)を検出するための装置、方法及びコンピュータプログラムに関する。
続きを表示(約 2,600 文字)
【背景技術】
【0002】
手の動きの検出がコンピュータビジョンにおけるよくある課題であり、それは人間とコンピュータのインタラクション、仮想現実、知的生産と生活などの分野で幅広く適用されている。動作検出のためのデータのソースについて言えば、一般的な特徴抽出方法は、シングルフレーム画像からRGB特徴及び手のキーポイント特徴を空間領域特徴として抽出し、及び連続したマルチフレーム画像からオプティカルフロー特徴を時間領域特徴として抽出することを含む。そのうち、RGB特徴は豊富なテクスチャ情報及びシーンのコンテキスト認識(感知)情報を有し、手のキーポイント特徴は比較的強い空間構造制約を有し、手の外観(外表)、照明、視野角(視角)などの要因による干渉を回避できるので、手の動きをより直観的に反映でき、また、オプティカルフロー特徴はフレーム間の動きの形でカメラと観察される手との間の相対運動を伝達する。
【0003】
近年、ディープニューラルネットワーク技術が絶えずに発展し進歩しているため、それは動作検出の分野では幅広く使用されるようになっている。このような方法の全体的なネットワーク構造は図1に示すとおりである。ディープニューラルネットワークに基づく動作検出は比較的良い検出結果を取得できるが、このような方法は実際の適用シーン(シナリオ)では多くの制限がある。工場における生産プロセスが手の動きの検出技術の一般的な適用シーンの1つであり、生産作業員の手の動きを検出することで、その動きが速度、ワークフロー、姿勢などの面で生産要件を満たしたかを判断できるため、作業員のワーキング効率を向上させることができる。周知のとおり、ディープニューラルネットワークに基づく方法では、モデルを訓練(トレーニング)する前に手の動きのカテゴリ(手動作カテゴリともいう)を定義する必要がある。しかしながら、異なる工場におけるユーザーの関心の手動作カテゴリが異なるため、統一した手動作カテゴリによる定義の方法は異なるユーザーのニーズを満たすことが困難である。異なるユーザーのためにパーソナライズされた手動作カテゴリをそれぞれ定義し、かつ定義された動作に基づいてモデルをそれぞれ訓練する方法を採用すれば、効率の低下及び計算リソースの浪費を来すことがある。また、ユーザーの機密保持要件及びデータ収集条件の制限により、実際の生産シーンではディープニューラルネットワークモデルを訓練するのに十分なデータを収集することが困難である。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明の目的は、上述の問題のうちの1つ又は複数を解決するための手動作検出装置、方法及びコンピュータプログラムを提供することにある。
【課題を解決するための手段】
【0005】
本発明の一側面によれば、ビデオ内の手の動きを検出するための装置が提供され、それは、
ビデオ内の各フレーム画像における手の3Dキーポイントに関する情報を取得する取得ユニットであって、手の3Dキーポイントに関する情報は少なくとも、手の各関節点の3D空間における位置を含む、もの;
手の3Dキーポイントに関する情報に基づいて各フレーム画像の手の状態情報を取得する計算ユニットであって、手の状態情報は少なくとも、指セグメントの屈曲(湾曲)状態を含む、もの;
ビデオの時間フラグメントにおける手の状態情報の変化を取得する分析ユニット;及び
手の状態情報の変化、及び手の動きに関するルール(規則)に基づいて、時間フラグメントにおける手の動きを確定する確定ユニットを含む。
【0006】
本発明のもう1つの側面によれば、ビデオ内の手の動きを検出するための方法が提供され、それは、
ビデオ内の各フレーム画像における手の3Dキーポイントに関する情報を取得し、手の3Dキーポイントに関する情報は少なくとも、手の各関節点の3D空間における位置を含み;
手の3Dキーポイントに関する情報に基づいて各フレーム画像の手の状態情報を取得し、手の状態情報は少なくとも、指セグメントの屈曲状態を含み;
ビデオの時間フラグメントにおける手の状態情報の変化を取得し;及び
手の状態情報の変化、及び手の動きに関するルールに基づいて、時間フラグメントにおける手の動きを確定することを含む。
【0007】
本発明の他の側面によれば、コンピュータプログラムが提供され、それは、コンピュータに、本発明による検出方法を実行させる。
【発明の効果】
【0008】
本発明による動作検出装置、動作検出方法及びコンピュータプログラムを用いて、指セグメントの屈曲状態をフレームごとに分析し、手の動きのルールを策定することにより、再利用可能な手の動きの検出を実現できる。
【図面の簡単な説明】
【0009】
ニューラルネットワークに基づく動作検出の全体的なネットワーク構造を示す図である。
本発明の実施例による検出装置の構成図である。
手のキーポイントと指セグメントとの対応関係を示す図である。
本発明の実施例による検出装置が「掴み」動作を検出するプロセスにおける指セグメントの屈曲度合いの変化を示す図である。
本発明の実施例による検出装置が実行する処理を示す図である。
本発明の実施例による検出装置が実行するもう1つの処理のフローチャートである。
もう1つの指セグメントの屈曲度合いの計算を示す図である。
本発明の実施例による検出装置が「ひねり」動作を検出する原理を示す図である。
本発明の実施例による検出方法のフローチャートである。
本発明の実施例による検出装置と方法を実現し得る汎用パーソナルコンピュータの例示的な構成図である。
【発明を実施するための形態】
【0010】
以下、添付した図面を参照しながら、本発明を実施するための好適な実施例を詳細に説明する。なお、このような実施例は例示に過ぎず、本発明を限定するものではない。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
富士通株式会社
車線区分装置及び方法
22日前
富士通株式会社
商品状態検出装置及び方法
18日前
富士通株式会社
商品棚の検出装置及び方法
18日前
富士通株式会社
量子デバイス上の誤り訂正
2日前
富士通株式会社
キャッシュメモリ搭載演算装置
7日前
富士通株式会社
伝送路監視装置及び伝送路監視方法
14日前
富士通株式会社
情報処理装置,プログラムおよび制御方法
22日前
富士通株式会社
推定プログラム、推定方法及び情報処理装置
3日前
富士通株式会社
分子動力学計算プログラム、方法、及び装置
22日前
富士通株式会社
光伝送装置、光伝送方法、及び光伝送システム
3日前
富士通株式会社
機械学習アプローチを用いたラマンポンプ設計
8日前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
18日前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
18日前
富士通株式会社
プログラム、データ処理装置及びデータ処理方法
15日前
富士通株式会社
情報処理プログラム、情報処理方法、および管理装置
14日前
富士通株式会社
タスク制御プログラム、情報処理装置及びタスク制御方法
22日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
23日前
富士通株式会社
医薬品管理装置、医薬品管理方法、医薬品管理プログラム
23日前
富士通株式会社
業務管理プログラム、業務管理方法、および情報処理装置
29日前
富士通株式会社
光パワー制御装置、光パワー制御方法および光伝送システム
8日前
富士通株式会社
モデル生成プログラム、モデル生成方法および情報処理装置
4日前
富士通株式会社
量子コンピューティング・システム・モデルのトレーニング
2日前
富士通株式会社
把持期間判定プログラム,把持期間判定方法及び情報処理装置
14日前
富士通株式会社
光伝送路監視装置、光伝送路監視方法、および光伝送システム
2日前
富士通株式会社
歩行訓練支援プログラム、歩行訓練支援方法、および情報処理装置
24日前
富士通株式会社
光伝送路監視装置、光伝送路監視方法、および光伝送路監視システム
2日前
富士通株式会社
対象認識装置、対象認識方法及びコンピュータ読み取り可能な記憶媒体
1日前
富士通株式会社
ビデオ内の手の動きを検出するための装置、方法及びコンピュータプログラム
3日前
富士通株式会社
サイドリンクリソースの再選択方法及び装置
23日前
富士通株式会社
ワイヤーハーネス製造図設計支援プログラム、ワイヤーハーネス製造図設計支援方法、および情報処理装置
22日前
個人
物品給付年金
1日前
個人
非正規コート
1か月前
個人
在宅介護システム
14日前
個人
RFタグ読取装置
14日前
個人
人物再現システム
29日前
個人
AI飲食最適化プラグイン
22日前
続きを見る
他の特許を見る