TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025140802
公報種別
公開特許公報(A)
公開日
2025-09-29
出願番号
2024040386
出願日
2024-03-14
発明の名称
情報処理装置、情報処理方法、及びプログラム
出願人
日本電気株式会社
代理人
個人
主分類
G06T
7/00 20170101AFI20250919BHJP(計算;計数)
要約
【課題】画像中の物体検出を行うための好適なプロンプトを生成する情報処理装置、情報処理方法及びプログラムを提供する。
【解決手段】情報処理装置は、検出対象を指定する入力データを参照して、当該検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得するテキスト群取得部と、前記視覚表現テキスト群を参照してプロンプトを生成するプロンプト生成部と、プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記プロンプト生成部が生成したプロンプトを提供する提供部と、を備えている。
【選択図】図1
特許請求の範囲
【請求項1】
検出対象を指定する入力データを参照して、当該検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得するテキスト群取得手段と、
前記視覚表現テキスト群を参照してプロンプトを生成するプロンプト生成手段と、
プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記プロンプト生成手段が生成したプロンプトを提供する提供手段と
を備えている情報処理装置。
続きを表示(約 1,700 文字)
【請求項2】
前記プロンプト生成手段によるプロンプト生成処理には、
前記視覚表現テキスト群に含まれる少なくとも何れかのテキストの適切性を評価する評価処理が含まれている
請求項1に記載の情報処理装置。
【請求項3】
前記プロンプト生成手段によるプロンプト生成処理には、
前記プロンプトを生成するために用いる1又は複数のテキストを、前記評価処理の結果を参照して、前記視覚表現テキスト群から選択する選択処理が含まれている
請求項2に記載の情報処理装置。
【請求項4】
前記プロンプト生成手段によるプロンプト生成処理には、
前記選択処理によって選択された1又は複数のテキスト以外のテキストを、前記プロンプトを生成するために用いる更なるテキストとして探索する探索処理が含まれている
請求項3に記載の情報処理装置。
【請求項5】
前記プロンプト生成手段によるプロンプト生成処理には、
前記探索処理によって前記更なるテキストが見出されなかった場合に、前記選択処理によって選択された1又は複数のテキストからプロンプトを生成する処理が含まれる
請求項4に記載の情報処理装置。
【請求項6】
前記テキスト群取得手段によるテキスト群取得処理には、
互いに異なる複数の生成モデルを用いて、複数の前記視覚表現テキスト群を生成する処理が含まれており、
前記評価処理には、
互いに異なる複数の評価モデルを用いて、複数の前記視覚表現テキスト群を評価する処理が含まれている
請求項2から5の何れか1項に記載の情報処理装置。
【請求項7】
前記テキスト群取得処理には、
第1の生成モデルを用いて第1のテキスト群を生成する処理と、
第2の生成モデルを用いて第2のテキスト群を生成する処理と、
前記第1の生成モデルを含む第1の評価モデルを用いて、前記第2のテキスト群を評価する処理と、
前記第2の生成モデルを含む第2の評価モデルを用いて、前記第1のテキスト群を評価する処理と
が含まれている
請求項6に記載の情報処理装置。
【請求項8】
検出対象を指定する入力データを取得する取得手段と、
プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記入力データを参照して得られるプロンプトを提供する提供手段と
を備えており、
前記提供手段が提供するプロンプトは、
前記検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得するテキスト群取得処理と、
前記視覚表現テキスト群を参照してプロンプトを生成するプロンプト生成処理と
を含む処理によって生成されたプロンプトである
情報処理装置。
【請求項9】
検出対象を指定する入力データを参照して、当該検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得することと、
前記視覚表現テキスト群を参照してプロンプトを生成することと、
プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記生成したプロンプトを提供することと
を含んでいる情報処理方法。
【請求項10】
情報処理装置としてコンピュータを機能させるプログラムであって、
前記コンピュータを、
検出対象を指定する入力データを参照して、当該検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得するテキスト群取得手段と、
前記視覚表現テキスト群を参照してプロンプトを生成するプロンプト生成手段と、
プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記プロンプト生成手段が生成したプロンプトを提供する提供手段と
として機能させるプログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、情報処理装置、情報処理方法、及びプログラムに関する。
続きを表示(約 1,500 文字)
【背景技術】
【0002】
画像中における物体を認識(検出)する画像認識技術が知られている(例えば特許文献1)。このような技術では、物体に関する認識(検出)を精度よく行うことが求められる。
【先行技術文献】
【特許文献】
【0003】
特開平05-174147号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
一方、近年、画像中の物体と物体を表現するテキストプロンプトとが紐づくように物体検出器を学習させるテキストベースの物体検出技術が知られている。このような技術では、物体検出の精度がプロンプトに依存するため、より好適なプロンプトを生成することが望ましい。しかしながら、好適なプロンプトを生成することはユーザの負担になっていた。
【0005】
本開示は、上記の問題に鑑みてなされたものであり、その一例示的目的は、画像中の物体検出を行うための好適なプロンプトを生成することのできる技術を提供することにある。
【課題を解決するための手段】
【0006】
本開示の一例示的側面に係る情報処理装置は、検出対象を指定する入力データを参照して、当該検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得するテキスト群取得手段と、前記視覚表現テキスト群を参照してプロンプトを生成するプロンプト生成手段と、プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記プロンプト生成手段が生成したプロンプトを提供する提供手段と
を備えている。
【0007】
本開示の一例示的側面に係る情報処理装置は、検出対象を指定する入力データを取得する取得手段と、プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記入力データを参照して得られるプロンプトを提供する提供手段とを備えており、前記提供手段が提供するプロンプトは、前記検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得するテキスト群取得処理と、前記視覚表現テキスト群を参照してプロンプトを生成するプロンプト生成処理とを含む処理によって生成されたプロンプトである。
【0008】
本開示の一例示的側面に係る情報処理方法は、検出対象を指定する入力データを参照して、当該検出対象を視覚的に表現する複数のテキストを含む視覚表現テキスト群を取得することと、前記視覚表現テキスト群を参照してプロンプトを生成することと、プロンプトと画像とを入力とし、当該プロンプトによって指定される検出対象を当該画像から検出する検出モデルに対して、前記生成したプロンプトを提供することとを含んでいる。
【0009】
なお、各態様に係る情報処理装置は、コンピュータによって実現してもよく、この場合には、コンピュータを前記情報処理装置が備える各手段として動作させることにより前記情報処理装置をコンピュータにて実現させるプログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
【発明の効果】
【0010】
本開示の一例示的側面によれば、画像中の物体検出を行うための好適なプロンプトを生成することができるという一例示的効果を奏する。
【図面の簡単な説明】
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
日本電気株式会社
分析装置
1日前
日本電気株式会社
学習装置
1か月前
日本電気株式会社
学習装置
25日前
日本電気株式会社
原子発振器
27日前
日本電気株式会社
超伝導量子回路
21日前
日本電気株式会社
マルチバンドバラン
19日前
日本電気株式会社
検知装置および検知方法
1日前
日本電気株式会社
量子回路装置と制御方法
1日前
日本電気株式会社
量子回路装置と制御方法
1日前
日本電気株式会社
端末装置および無線通信方法
12日前
日本電気株式会社
機器冷却装置及びその冷却方法
13日前
日本電気株式会社
ケージ、光伝送装置及び挿抜方法
1か月前
日本電気株式会社
プログラム、算出装置、及び方法
13日前
日本電気株式会社
TS合成装置および放送システム
28日前
日本電気株式会社
処理装置、方法、及びプログラム
25日前
日本電気株式会社
推定装置、推定方法及びプログラム
4日前
日本電気株式会社
システム及びマイグレーション方法
1日前
日本電気株式会社
リング共振器、およびその製造方法
26日前
日本電気株式会社
推定装置、推定方法及びプログラム
4日前
日本電気株式会社
ピーク抑圧装置及びピーク抑圧方法
11日前
日本電気株式会社
リング共振器、およびその製造方法
27日前
日本電気株式会社
処理装置、処理方法、及びプログラム
1か月前
日本電気株式会社
処理装置、処理方法、及びプログラム
1日前
日本電気株式会社
通信システム及びパケット順序補正方法
12日前
日本電気株式会社
管理システム、管理方法及びプログラム
11日前
日本電気株式会社
予測システム、予測方法及びプログラム
4日前
日本電気株式会社
判定装置、判定方法、及び、プログラム
21日前
日本電気株式会社
映像伝送装置、映像伝送方法、プログラム
1日前
日本電気株式会社
処理システム、処理方法およびプログラム
4日前
日本電気株式会社
映像処理装置、映像処理方法、プログラム
1日前
日本電気株式会社
情報処理システム、処理方法、プログラム
1日前
日本電気株式会社
マルチコアファイバ増幅器及び光増幅方法
19日前
日本電気株式会社
画像検索装置、画像検索方法及び記憶媒体
22日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
28日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
25日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
25日前
続きを見る
他の特許を見る