TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024091177
公報種別公開特許公報(A)
公開日2024-07-04
出願番号2022207685
出願日2022-12-23
発明の名称特定プログラム、特定方法および情報処理装置
出願人富士通株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06T 7/00 20170101AFI20240627BHJP(計算;計数)
要約【課題】画像から特定の物体を認識する精度を向上させることを課題とする。
【解決手段】情報処理装置は、物体を含む映像を取得し、複数の階層毎に物体の属性が対応付けられた参照元データを参照する機械学習モデルに対して、取得した映像を入力することで、第一の階層の物体の属性の中から、映像に含まれる物体の属性を絞り込み、絞り込んだ物体の属性を用いて、第一の階層の配下の第二の階層の物体の属性を識別し、取得した映像を、機械学習モデルに入力することで、第二の階層の物体の属性の中から、映像に含まれる物体の属性を特定する。
【選択図】図10
特許請求の範囲【請求項1】
物体を含む映像を取得し、
複数の階層毎に物体の属性が対応付けられた参照元データを参照する機械学習モデルに対して、取得した映像を入力することで、第一の階層の物体の属性の中から、前記映像に含まれる物体の属性を絞り込み、
絞り込んだ物体の属性を用いて、前記第一の階層の配下の第二の階層の物体の属性を識別し、
取得した映像を、前記機械学習モデルに入力することで、前記第二の階層の物体の属性の中から、前記映像に含まれる物体の属性を特定する、
処理をコンピュータに実行させることを特徴とする特定プログラム。
続きを表示(約 1,300 文字)【請求項2】
前記絞り込む処理は、前記機械学習モデルが有する画像エンコーダに対して前記映像を入力すると共に、前記機械学習モデルが有するテキストエンコーダに対して前記第一の階層の物体の属性ごとにテキストを入力し、前記画像エンコーダが出力する前記映像のベクトル及び前記テキストエンコーダが出力する前記テキストのベクトルの類似度に基づいて前記第一の階層の物体の属性のうち前記映像に含まれる物体の属性を絞り込む処理を含み、
前記特定する処理は、前記画像エンコーダに対して前記映像を入力すると共に、前記テキストエンコーダに対して前記第二の階層の物体の属性に対応するテキストを入力し、前記画像エンコーダが出力する前記映像のベクトル及び前記テキストエンコーダが出力する前記テキストのベクトルの類似度に基づいて前記第二の階層の物体の属性のうち前記映像に含まれる物体の属性を特定する処理を含む、
ことを特徴とする請求項1に記載の特定プログラム。
【請求項3】
前記絞り込む処理は、前記第一の階層の物体の属性のうち、前記映像のベクトルに対する類似度が最大であるテキストに対応する物体の属性に絞り込む処理を含み、
前記特定する処理は、前記第二の階層の物体の属性のうち、前記映像のベクトルに対する類似度が最大であるテキストに対応する物体の属性を特定する処理を含む、
ことを特徴とする請求項1に記載の特定プログラム。
【請求項4】
前記機械学習モデルは、ゼロショット画像分類器であることを特徴とする請求項1に記載の特定プログラム。
【請求項5】
前記第一の階層の物体の属性は、前記映像が撮影される店舗で販売される商品のカテゴリを含み、
前記第二の階層の物体の属性は、前記商品の価格を含む、
ことを特徴とする請求項1に記載の特定プログラム。
【請求項6】
物体を含む映像を取得し、
複数の階層毎に物体の属性が対応付けられた参照元データを参照する機械学習モデルに対して、取得した映像を入力することで、第一の階層の物体の属性の中から、前記映像に含まれる物体の属性を絞り込み、
絞り込んだ物体の属性を用いて、前記第一の階層の配下の第二の階層の物体の属性を識別し、
取得した映像を、前記機械学習モデルに入力することで、前記第二の階層の物体の属性の中から、前記映像に含まれる物体の属性を特定する、
処理をコンピュータが実行することを特徴とする特定方法。
【請求項7】
物体を含む映像を取得し、
複数の階層毎に物体の属性が対応付けられた参照元データを参照する機械学習モデルに対して、取得した映像を入力することで、第一の階層の物体の属性の中から、前記映像に含まれる物体の属性を絞り込み、
絞り込んだ物体の属性を用いて、前記第一の階層の配下の第二の階層の物体の属性を識別し、
取得した映像を、前記機械学習モデルに入力することで、前記第二の階層の物体の属性の中から、前記映像に含まれる物体の属性を特定する、
処理を実行する制御部を含むことを特徴とする情報処理装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、特定プログラム、特定方法および情報処理装置に関する。
続きを表示(約 3,000 文字)【背景技術】
【0002】
画像から特定の物体を認識する画像認識技術は、広く普及している。この技術では、例えば、画像における特定の物体の領域がバウンディングボックス(Bbox)として特定される。また、物体の画像認識を機械学習を用いて行う技術も存在する。そして、このような画像認識技術は、例えば、店舗における顧客の購買動作の監視や、工場における作業者の作業管理に応用することが考えられている。
【0003】
スーパーマーケットやコンビニエンスストア等の店舗において、セルフレジが普及している。セルフレジは、商品を購入するユーザ自身が、商品のバーコードの読み取りから精算までを行うPOS(Point of sale)レジシステムである。たとえば、セルフレジを導入することで、人口減少による人手不足の改善、人件費の抑制を実現することができる。
【先行技術文献】
【特許文献】
【0004】
特開2019-29021号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記のセルフレジでは、商品コードのスキャンや精算がユーザ自身に委ねられるので、不正行為を検出することが困難である側面がある。たとえば、上記の不正行為を検出する側面から画像認識AI(Artificial Intelligence)を適用しようにも、画像認識AIの訓練には大量の訓練データが必要となる。ところが、スーパーマーケットやコンビニエンスストア等の店舗では、多数の種類の商品が存在する上、個々の商品のライフサイクルも短いので、商品の入れ替えが頻繁に起こる。このような商品のライフサイクルに合わせて画像認識AIをチューニングしたり、あるいは新たな画像認識AIを訓練したりすることは困難である。
【0006】
1つの側面では、画像から特定の物体を認識する精度を向上させることを実現できる特定プログラム、特定方法および情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0007】
第1の案では、特定プログラムは、物体を含む映像を取得し、複数の階層毎に物体の属性が対応付けられた参照元データを参照する機械学習モデルに対して、取得した映像を入力することで、第一の階層の物体の属性の中から、前記映像に含まれる物体の属性を絞り込み、絞り込んだ物体の属性を用いて、前記第一の階層の配下の第二の階層の物体の属性を識別し、取得した映像を、前記機械学習モデルに入力することで、前記第二の階層の物体の属性の中から、前記映像に含まれる物体の属性を特定する、処理をコンピュータに実行させる。
【発明の効果】
【0008】
一実施形態によれば、画像から特定の物体を認識する精度を向上させることを実現できる。
【図面の簡単な説明】
【0009】
図1は、実施例1にかかるセルフレジシステムの全体構成例を示す図である。
図2は、実施例1にかかる情報処理装置の機能構成を示す機能ブロック図である。
図3は、第一の機械学習モデルの訓練データの例を説明する図である。
図4は、第一の機械学習モデルの機械学習を説明する図である。
図5は、第二の機械学習モデルの機械学習を説明する図である。
図6は、商品リストの一例を示す図である。
図7は、テンプレートの一例を示す図である。
図8は、階層構造データの生成を説明する図(1)である。
図9は、階層構造データの生成を説明する図(2)である。
図10は、階層構造の一例を示す図である。
図11は、手持ち商品画像の生成を説明する図(1)である。
図12は、手持ち商品画像の生成を説明する図(2)である。
図13は、セルフレジの表示例を示す図(1)である。
図14は、セルフレジの表示例を示す図(2)である。
図15は、手持ち商品画像の生成を説明する図(3)である。
図16は、手持ち商品画像の生成を説明する図(4)である。
図17は、商品アイテムを特定する事例1を示す模式図(1)である。
図18は、商品アイテムを特定する事例1を示す模式図(2)である。
図19は、商品アイテムを特定する事例1を示す模式図(3)である。
図20は、商品アイテムを特定する事例2を示す模式図(1)である。
図21は、商品アイテムを特定する事例2を示す模式図(2)である。
図22は、アラートの表示例を示す図(1)である。
図23は、アラートの表示例を示す図(2)である。
図24は、アラートの表示例を示す図(3)である。
図25は、アラートの表示例を示す図(4)である。
図26は、実施例1にかかるデータ生成処理の流れを示すフローチャートである。
図27は、実施例1にかかる映像取得処理の流れを示すフローチャートである。
図28は、実施例1にかかる第一の検出処理の流れを示すフローチャートである。
図29は、実施例1にかかる第二の検出処理の流れを示すフローチャートである。
図30は、実施例1にかかる特定処理の流れを示すフローチャートである。
図31は、階層構造の応用例1を示す図である。
図32は、商品アイテムを特定する事例3を示す模式図(1)である。
図33は、商品アイテムを特定する事例3を示す模式図(2)である。
図34は、商品アイテムを特定する事例3を示す模式図(3)である。
図35は、アラートの表示例を示す図(5)である。
図36は、アラートの表示例を示す図(6)である。
図37は、応用例1にかかる第一の検出処理の流れを示すフローチャートである。
図38は、階層構造の応用例2を示す図である。
図39は、セルフレジの表示例を示す図(3)である。
図40は、商品アイテムを特定する事例4を示す模式図(1)である。
図41は、商品アイテムを特定する事例4を示す模式図(2)である。
図42は、商品アイテムを特定する事例4を示す模式図(3)である。
図43は、アラートの表示例を示す図(7)である。
図44は、アラートの表示例を示す図(8)である。
図45は、応用例2にかかる第二の検出処理の流れを示すフローチャートである。
図46は、階層構造の応用例3を示す図である。
図47は、階層構造の応用例4を示す図である。
図48は、情報処理装置のハードウェア構成例を説明する図である。
図49は、セルフレジのハードウェア構成例を説明する図である。
【発明を実施するための形態】
【0010】
以下に、本願の開示する特定プログラム、特定方法および情報処理装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。また、各実施例は、矛盾のない範囲内で適宜組み合わせることができる。
【実施例】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
光半導体デバイス
4日前
富士通株式会社
無線通信装置及び推定方法
3日前
富士通株式会社
訓練データ生成プログラム、方法、及び装置
4日前
富士通株式会社
プログラム、情報処理方法および情報処理装置
7日前
富士通株式会社
管理プログラム、管理方法、および情報処理装置
14日前
富士通株式会社
トランス接続相判定プログラム、方法、及び装置
4日前
富士通株式会社
情報処理プログラム、情報処理方法、情報処理装置
1日前
富士通株式会社
窒化物半導体装置及び窒化物半導体装置の製造方法
4日前
富士通株式会社
情報処理装置、情報処理方法および情報処理プログラム
4日前
富士通株式会社
実行制御プログラム、実行制御方法、および情報処理装置
7日前
富士通株式会社
処理装置、データ管理方法、およびデータ管理プログラム
3日前
富士通株式会社
センシングデバイス、及びセンシングデバイスの製造方法
4日前
富士通株式会社
量子計算プログラム、量子計算方法、および情報処理装置
7日前
富士通株式会社
情報処理装置、情報処理方法、および情報処理プログラム
7日前
富士通株式会社
分散台帳上の制限された利用可能性を有するトークンの構成
10日前
富士通株式会社
解決策特定方法、解決策特定プログラム、および情報処理装置
4日前
富士通株式会社
情報処理装置、情報処理方法及び機器読み取り可能な記憶媒体
7日前
富士通株式会社
解決策特定方法、解決策特定プログラム、および情報処理装置
4日前
富士通株式会社
仮想ネットワーク制御システムおよび仮想ネットワーク制御方法
7日前
富士通株式会社
情報収集支援プログラム、情報収集支援方法及び情報収集支援装置
14日前
富士通株式会社
パラメータ修正プログラム、パラメータ修正方法および情報処理装置
4日前
富士通株式会社
デプロイ支援装置、デプロイ支援方法、およびデプロイ支援プログラム
4日前
富士通株式会社
ストレージ制御プログラム,ストレージ制御装置及びストレージ制御方法
4日前
個人
GPSロガー
9日前
個人
デトろぐシステム
8日前
個人
情報処理システム
29日前
個人
管理装置
1日前
日本精機株式会社
表示装置
22日前
個人
指先受の付いたマウス。
25日前
個人
都市経営シミュレーション
14日前
個人
管理装置
3日前
個人
特徴検討支援システム
1日前
株式会社テクロス
情報処理装置
7日前
個人
支援システム及び支援方法
16日前
國立臺灣大學
操作補助システム
15日前
株式会社野村総合研究所
検証装置
7日前
続きを見る