TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025091110
公報種別
公開特許公報(A)
公開日
2025-06-18
出願番号
2023206158
出願日
2023-12-06
発明の名称
情報処理装置及び情報処理方法
出願人
東芝ライテック株式会社
代理人
弁理士法人酒井国際特許事務所
主分類
G06T
7/00 20170101AFI20250611BHJP(計算;計数)
要約
【課題】精度の高い推定を可能にする。
【解決手段】本願に係る情報処理装置は、判定部と、実行部とを備える。判定部は、検知対象の撮像状況が所定の条件を満たすか否かを判定する。実行部は、判定部により所定の条件を満たすと判定された場合にVQA(Visual Question Answering)を用いた処理を実行する。
【選択図】図12
特許請求の範囲
【請求項1】
検知対象の撮像状況が所定の条件を満たすか否かを判定する判定部と、
前記判定部により前記所定の条件を満たすと判定された場合にVQA(Visual Question Answering)を用いた処理を実行する実行部と、
を有することを特徴とする情報処理装置。
続きを表示(約 970 文字)
【請求項2】
前記判定部は、
前記検知対象の撮像画像を用いて前記撮像状況が前記所定の条件を満たすか否かを判定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記判定部は、
予め定められた高さの位置から撮像された前記撮像画像を用いて前記撮像状況が前記所定の条件を満たすか否かを判定する
ことを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記判定部は、
前記高さと撮像装置に応じた係数とに基づき決定された閾値に基づき、前記撮像状況が前記所定の条件を満たすか否かを判定する
ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記判定部は、
前記検知対象の座標データが前記所定の条件を満たすか否かを判定することで、前記検知対象の撮像状況が前記所定の条件を満たすか否かを判定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記判定部は、
前記検知対象を示す所定形状の図形の全ての頂点の座標データが前記所定の条件を満たすか否かを判定する
ことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記判定部は、
前記座標データが所定の閾値を超えているか否かを判定することで、前記検知対象の撮像状況が前記所定の条件を満たすか否かを判定する
ことを特徴とする請求項5に記載の情報処理装置。
【請求項8】
前記判定部は、
VQAの質問文と対応する範囲が所定の条件を満たすか否かを判定することで、前記検知対象の撮像状況が前記所定の条件を満たすか否かを判定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項9】
コンピュータが実行する情報処理方法であって、
検知対象の撮像状況が所定の条件を満たすか否かを判定する判定工程と、
前記判定工程により前記所定の条件を満たすと判定された場合にVQA(Visual Question Answering)を用いた処理を実行する実行工程と、
を含むことを特徴とする情報処理方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、情報処理装置及び情報処理方法に関する。
続きを表示(約 1,700 文字)
【背景技術】
【0002】
従来、所定の情報に基づき特定の状態を推定する技術が知られている。例えば、VQA(Visual Question Answering)と呼ばれるAI技術を用いることで、撮像画像(現場画像)に基づいて安全マニュアルに違反した装備状態や危険な状態を推定する技術が知られている。
【先行技術文献】
【特許文献】
【0003】
特開2022-071675号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術では、十分な状態の推定ができない場合でも状態を推定してしまう場合があるため、精度の高い推定を行うための更なる改善の余地があった。
【0005】
本願は、上記に鑑みてなされたものであって、精度の高い推定を可能にする情報処理装置及び情報処理方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本願に係る情報処理装置は、検知対象の撮像状況が所定の条件を満たすか否かを判定する判定部と、前記判定部により前記所定の条件を満たすと判定された場合にVQA(Visual Question Answering)を用いた処理を実行する実行部と、を有することを特徴とする。
【発明の効果】
【0007】
実施形態の一態様によれば、精度の高い推定を可能にすることができるという効果を奏する。
【図面の簡単な説明】
【0008】
図1は、実施形態に係る情報処理システムの構成例を示す図である。
図2は、実施形態に係る判定対象を説明するための説明図である。
図3は、実施形態に係る撮像視点を説明するための説明図である。
図4は、実施形態に係る撮像視点を説明するための説明図である。
図5は、実施形態に係る判定対象範囲を説明するための説明図(その1)である。
図6は、実施形態に係る判定対象範囲を説明するための説明図(その2)である。
図7は、実施形態に係る閾値を説明するための説明図である。
図8は、実施形態に係る矩形のサイズに閾値を設定した場合の検知対象との関係性を説明するための説明図である。
図9は、実施形態に係る矩形のサイズを検知対象に適用した場合に判定対象となるか否かを説明するための説明図である。
図10は、実施形態に係る情報処理の一例を示す図である。
図11は、実施形態に係る端末装置の構成例を示す図である。
図12は、実施形態に係る情報処理装置の構成例を示す図である。
図13は、実施形態に係る想定回答記憶部の一例を示す図である。
図14は、実施形態に係るVQAモデル記憶部の一例を示す図である。
図15は、実施形態に係る情報処理の一例を示すフローチャート(その1)である。
図16は、実施形態に係る情報処理の一例を示すフローチャート(その2)である。
【発明を実施するための形態】
【0009】
以下に、本願に係る情報処理装置及び情報処理方法を実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置及び情報処理方法が限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
従来、所定の情報に基づき特定の状態を推定する技術が知られている。例えば、VQAと呼ばれるAI技術を用いることで、撮像画像に基づいて安全マニュアルに違反した装備状態や危険な状態を推定する技術が知られている。VQAは、コンピュータビジョンと自然言語処理とを統合した技術であり、撮像画像内の物体やシーンに関する質問を自然言語で受け付け、それに対する回答を生成する。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
対話装置
14日前
個人
政治のAI化
1か月前
個人
情報処理装置
14日前
個人
物品給付年金
1か月前
個人
在宅介護システム
1か月前
個人
RFタグ読取装置
1か月前
個人
人物再現システム
2か月前
個人
情報処理装置
10日前
個人
記入設定プラグイン
2日前
個人
プラグインホームページ
28日前
個人
AI飲食最適化プラグイン
2か月前
個人
情報入力装置
14日前
キヤノン株式会社
通信装置
1か月前
個人
物価スライド機能付生命保険
14日前
個人
電話管理システム及び管理方法
2か月前
個人
マイホーム非電子入札システム
14日前
株式会社BONNOU
管理装置
7日前
個人
全アルゴリズム対応型プログラム
1か月前
キヤノン株式会社
画像処理装置
1か月前
個人
決済手数料0%のクレジットカード
17日前
シャープ株式会社
電子機器
1か月前
大同特殊鋼株式会社
輝線検出方法
1か月前
株式会社CROSLAN
支援装置
1か月前
サクサ株式会社
カードの制動構造
16日前
ひびきの電子株式会社
認証システム
1か月前
株式会社アジラ
データ転送システム
1か月前
ミサワホーム株式会社
情報処理装置
1か月前
ミサワホーム株式会社
宅配ロッカー
1か月前
長屋印刷株式会社
画像形成システム
1か月前
パテントフレア株式会社
交差型バーコード
1か月前
株式会社ライト
情報処理装置
7日前
トヨタ自動車株式会社
情報処理装置
20日前
村田機械株式会社
割当補助システム
20日前
トヨタ自動車株式会社
欠け検査装置
1か月前
株式会社ユピテル
電子機器及びプログラム等
1か月前
トヨタ自動車株式会社
管理装置
1か月前
続きを見る
他の特許を見る