TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024056495
公報種別公開特許公報(A)
公開日2024-04-23
出願番号2022163400
出願日2022-10-11
発明の名称機械学習プログラム,機械学習方法及び情報処理装置
出願人富士通株式会社
代理人弁理士法人真田特許事務所,個人
主分類G06V 10/82 20220101AFI20240416BHJP(計算;計数)
要約【課題】ネットワーク環境を構築する際に、接続作業の工数を削減し、誤接続や誤設定を防止する。
【解決手段】コンピュータは、訓練データを用いて訓練された第1の機械学習モデルに、第1のフレーム画像221-1と第2のフレーム画像221-2とを少なくとも含む動画データを入力し、第1の機械学習モデルによる推論結果に基づいて、第1のフレーム画像221-1及び第2のフレーム画像221-2からそれぞれ第1対象物223-1及び第2対象物223-2を検出し、検出された第1対象物223-1と第2対象物223-2との同一性を判断し、同一性を有すると判断された第1対象物223-1を含む第1画像領域における第1データ226と第2対象物223-2を含む第2画像領域における第2データ227とを符号化器230に入力して符号化器230を訓練する。
【選択図】図7
特許請求の範囲【請求項1】
訓練データを用いて訓練された第1の機械学習モデルに、第1のフレーム画像と第2のフレーム画像とを少なくとも含む動画データを入力し、
前記第1の機械学習モデルによる推論結果に基づいて、前記第1のフレーム画像及び前記第2のフレーム画像からそれぞれ第1対象物及び第2対象物を検出し、
検出された前記第1対象物と前記第2対象物との同一性を判断し、
前記同一性を有すると判断された前記第1対象物を含む第1画像領域における第1データと前記第2対象物を含む第2画像領域における第2データとを符号化器に入力して前記符号化器を訓練する、
処理をコンピュータに実行させる、機械学習プログラム。
続きを表示(約 1,800 文字)【請求項2】
前記符号化器を訓練する処理において、
前記第1データを前記符号化器に入力して得られる第1の特徴量と、前記第2データを第2の特徴量との一致度を高めるように機械学習する、
処理を前記コンピュータに実行させる、請求項1に記載の機械学習プログラム。
【請求項3】
訓練された前記符号化器に基づいて、画像中から対象物を検出する第2の機械学習モデルを訓練する、
処理を前記コンピュータに実行させる、請求項1または2に記載の機械学習プログラム。
【請求項4】
前記第2の機械学習モデルを訓練する処理において、
入力される画像データを複数の分割領域に分割して複数の分割画像を得て、
前記分割領域のそれぞれにおける前記分割画像を前記符号化器に入力して、前記分割領域におけるそれぞれの特徴量を算出し、
前記算出された結果と、入力される前記画像データに対応するラベルとに基づいて前記第2の機械学習モデルを訓練する、
処理を前記コンピュータに実行させる、請求項3に記載の機械学習プログラム。
【請求項5】
前記第2の機械学習モデルを訓練する処理において、
入力される画像データを第1の分割解像度に応じて複数の第1分割領域に分割して複数の第1分割画像を得て、
入力される前記画像データを前記第1の分割解像度と異なる第2の分割解像度に応じて複数の第2分割領域に分割して複数の第2分割画像を得て、
前記第1分割領域のそれぞれにおける前記第1分割画像を前記符号化器に入力して、前記第1分割領域におけるそれぞれの特徴量を示す第1解像度特徴マップを得て、
前記第2分割領域のそれぞれにおける前記第2分割画像を前記符号化器に入力して、前記第2分割領域におけるそれぞれの特徴量を示す第2解像度特徴マップを得て、
前記第1解像度特徴マップ、前記第2解像度特徴マップ、及び前記画像データに基づいて、前記第2の機械学習モデルを訓練する、
処理を前記コンピュータに実行させる、請求項3に記載の機械学習プログラム。
【請求項6】
動画における対象物の境界位置情報に関する特徴量を出力する位置情報モデルと、対象物のクラス分類に関する特徴量を出力するためのクラス分類モデルとを含む、第2の機械学習モデルにおいて、前記クラス分類モデルを前記符号化器として用い、
前記第1データを前記クラス分類モデルに入力して得られる第1のクラス分類用特徴量と、前記第2データを前記クラス分類モデルに入力して得られる第2のクラス分類用特徴量との一致度を高めるように機械学習する、
処理を前記コンピュータに実行させる、請求項1または2に記載の機械学習プログラム。
【請求項7】
訓練データを用いて訓練された第1の機械学習モデルに、第1のフレーム画像と第2のフレーム画像とを少なくとも含む動画データを入力し、
前記第1の機械学習モデルによる推論結果に基づいて、前記第1のフレーム画像及び前記第2のフレーム画像からそれぞれ第1対象物及び第2対象物を検出し、
検出された前記第1対象物と前記第2対象物との同一性を判断し、
前記同一性を有すると判断された前記第1対象物を含む第1画像領域における第1データと前記第2対象物を含む第2画像領域における第2データとを符号化器に入力して前記符号化器を訓練する、
処理をコンピュータが実行する、機械学習方法。
【請求項8】
訓練データを用いて訓練された第1の機械学習モデルに、第1のフレーム画像と第2のフレーム画像とを少なくとも含む動画データを入力し、
前記第1の機械学習モデルによる推論結果に基づいて、前記第1のフレーム画像及び前記第2のフレーム画像からそれぞれ第1対象物及び第2対象物を検出し、
検出された前記第1対象物と前記第2対象物との同一性を判断し、
前記同一性を有すると判断された前記第1対象物を含む第1画像領域における第1データと前記第2対象物を含む第2画像領域における第2データとを符号化器に入力して前記符号化器を訓練する、
プロセッサを備える、情報処理装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、機械学習プログラム,機械学習方法及び情報処理装置に関する。
続きを表示(約 2,200 文字)【背景技術】
【0002】
機械学習を用いて動画中の対象物を追跡する物体追跡技術が知られている。物体追跡技術は、物体検出技術と追跡技術を含み、物体追跡の性能は物体検出の性能に依存する。物体検出のための訓練データの量が十分に得られない場合には、過学習に起因して物体検出の性能が低くなるおそれがある。
【0003】
訓練データの量を増やす技術の一例として、ラベル伝播法が知られている。ラベル伝搬法は、物体追跡の結果を用いて、データのラベルを時間的または場所的に近傍にあるラベルなしデータに伝播(複写)する。ラベル伝播法は、予め定められた値以上の確信度で推論される推論結果に基づいて新たなラベルを生成する。
【先行技術文献】
【非特許文献】
【0004】
Yifu Zhang et al. “ByteTrack: Multi-Object Tracking by Associating Every Detection Box” arXiv:2110.06864v3 [cs.CV] 7 Apr 2022
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、ラベル伝播法によって得られる訓練データは、予め定められた値以上の確信度で推論された推論結果に基づいて生成されるため、摂動(別言すれば、遮蔽物の影響等)がある場面を考慮することが困難な場合がある。これは摂動が生じている場合には、確信度が低くなることに起因する。したがって、ラベル伝播法によって訓練データを増やした場合であっても、物体検出の性能を向上することが困難となるおそれがある。
【0006】
1つの側面では、摂動による影響を低減して物体検出の性能を向上することを目的とする。
【課題を解決するための手段】
【0007】
1つの側面では、機械学習プログラムは、訓練データを用いて訓練された第1の機械学習モデルに、第1のフレーム画像と第2のフレーム画像とを少なくとも含む動画データを入力し、前記第1の機械学習モデルによる推論結果に基づいて、前記第1のフレーム画像及び前記第2のフレーム画像からそれぞれ第1対象物及び第2対象物を検出し、検出された前記第1対象物と前記第2対象物との同一性を判断し、前記同一性を有すると判断された前記第1対象物を含む第1画像領域における第1データと前記第2対象物を含む第2画像領域における第2データとを符号化器に入力して前記符号化器を訓練する、処理をコンピュータに実行させる。
【発明の効果】
【0008】
1つの側面では摂動による影響を低減して物体検出の性能を向上することができる。
【図面の簡単な説明】
【0009】
ラベル伝播法の一例を模式的に示す図である。
対照学習について説明する図である。
実施形態に係る対照学習モデルの訓練を説明する図である。
実施形態に係る情報処理装置による物体追跡モデルの訓練処理の一例を示す図である。
実施形態に係る物体検出の訓練データの一例を模式的に示す図である。
図4で示した訓練された物体追跡モデルに入力されるラベル無し動画データの一例を示す。
実施形態に係る情報処理装置における対照学習モデルの訓練処理の一例を示す図である。
実施形態に係る情報処理装置における物体検出モデルの訓練処理の一例を示す図である。
実施形態に係る情報処理装置による訓練フェーズにおける機能構成例を示すブロック図である。
実施形態に係る情報処理装置による推論フェーズにおける機能構成例を示すブロック図である。
実施形態に係る情報処理装置の機能を実現するコンピュータのハードウェア(HW)構成例を示すブロック図である。
実施形態に係る情報処理装置による訓練フェーズにおける動作の一例を示すフローチャートである。
実施形態に係る情報処理装置による推論フェーズにおける動作の一例を示すフローチャートである。
第1変形例に係る情報処理装置による物体検出モデルの訓練処理の一例を示す図である。
第1変形例に係る情報処理装置による訓練フェーズにおける動作の一例を示すフローチャートである。
第1変形例に係る情報処理装置による推論フェーズにおける動作の一例を示すフローチャートである。
第2変形例に係る分離型物体検出モデルについて示す図である。
第2変形例に係る情報処理装置による分離型物体検出モデルの訓練処理の一例を示す図である。
第2変形例に係る情報処理装置による訓練フェーズにおける機能構成例を示すブロック図である。
第2変形例に係る情報処理装置による推論フェーズにおける機能構成例を示すブロック図である。
第2変形例に係る情報処理装置による訓練フェーズにおける動作の一例を示すフローチャートである。
第2変形例に係る情報処理装置による推論フェーズにおける動作の一例を示すフローチャートである。
【発明を実施するための形態】
【0010】
〔A〕関連技術
図1は、ラベル伝播法の一例を模式的に示す図である。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
光送信機
4日前
富士通株式会社
プロセッサ
11日前
富士通株式会社
光リンク電力プロファイル推定
4日前
富士通株式会社
光送信機、及びバイアス制御方法
23日前
富士通株式会社
演算処理装置および演算処理方法
16日前
富士通株式会社
評価プログラム、評価方法、評価装置
11日前
富士通株式会社
プログラム,方法,及び情報処理装置
10日前
富士通株式会社
性能監視プログラムおよび性能監視方法
4日前
富士通株式会社
機械学習プログラムおよび機械学習方法
4日前
富士通株式会社
検出プログラム,検出方法および検出装置
10日前
富士通株式会社
優先度決定方法及び優先度決定プログラム
19日前
富士通株式会社
抽出プログラム、抽出方法および情報処理装置
10日前
富士通株式会社
光伝送システム、波長変換器、及び光伝送装置
17日前
富士通株式会社
判定プログラム、判定方法、および情報処理装置
11日前
富士通株式会社
指標項目特定方法および指標項目特定プログラム
19日前
富士通株式会社
多重化変換器の伝送劣化を評価する方法及び装置
4日前
富士通株式会社
制御方法、制御プログラム、および情報処理装置
19日前
富士通株式会社
最適化プログラム、最適化方法および情報処理装置
4日前
富士通株式会社
最適化プログラム、最適化装置、および最適化方法
24日前
富士通株式会社
機械学習プログラム,機械学習方法及び情報処理装置
11日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
16日前
富士通株式会社
機械学習プログラム,機械学習方法及び情報処理装置
16日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
4日前
富士通株式会社
機械学習プログラム、情報処理装置および機械学習方法
16日前
富士通株式会社
機械学習プログラム、機械学習方法および情報処理装置
3日前
富士通株式会社
制御システム、制御装置、制御方法および制御プログラム
23日前
富士通株式会社
ソフトウェア・パッケージのためのバージョン更新の推奨
23日前
富士通株式会社
劣化診断プログラム、劣化診断方法、および情報処理装置
19日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
23日前
富士通株式会社
データ管理プログラム、データ管理方法及びデータ管理装置
23日前
富士通株式会社
フロー生成プログラム、フロー生成方法および情報処理装置
24日前
富士通株式会社
量子コンピュータを用いた浅い回路上での最適化問題の解法
9日前
富士通株式会社
商品購入支援プログラム、情報処理装置及び商品購入支援方法
18日前
富士通株式会社
トレーニング方法,演算処理装置及びトレーニングプログラム
9日前
富士通株式会社
サンプリングプログラム、サンプリング方法および情報処理装置
10日前
富士通株式会社
データ同期プログラム及びデータ同期方法、並びに情報処理装置
23日前
続きを見る