TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024165586
公報種別公開特許公報(A)
公開日2024-11-28
出願番号2023081892
出願日2023-05-17
発明の名称画像認識支援装置、画像認識支援方法、及び画像認識支援プログラム
出願人株式会社日立製作所
代理人青稜弁理士法人
主分類G06F 16/583 20190101AFI20241121BHJP(計算;計数)
要約【課題】精度の高い画像検索を行うことができる技術を提供する。
【解決手段】
画像認識支援装置100は、検索クエリおよび指示文の入力を受付けるテキスト入力部111と、検索対象画像を保持する検索対象画像DB121と、検索対象画像を画像特徴量に変換する画像特徴量変換部114と、検索対象画像に関連する画像付随テキスト情報を出力する画像認識部112と、画像付随テキスト情報から指示文に基づいて検索クエリに応じた要約後文章を出力するテキスト処理部113と、出力された要約後文章を要約後文章特徴量に変換する文章特徴量変換部115と、要約後文章、要約後文章特徴量、検索対象画像、及び画像特徴量を用いて画像を検索して検索結果を取得する画像検索部116と、を備える。
【選択図】図1
特許請求の範囲【請求項1】
検索クエリおよび指示文の入力を受付けるテキスト入力部と、
検索対象画像を保持する記憶部と、
前記検索対象画像を画像特徴量に変換する画像特徴量変換部と、
前記検索対象画像に関連する画像付随テキスト情報を出力する画像認識部と、
前記画像付随テキスト情報から前記指示文に基づいて前記検索クエリに応じた要約後文章を出力するテキスト処理部と、
前記出力された要約後文章を要約後文章特徴量に変換する文章特徴量変換部と、
前記要約後文章、前記要約後文章特徴量、前記検索対象画像、及び前記画像特徴量を用いて画像を検索して検索結果を取得する画像検索部と、
を備える画像認識支援装置。
続きを表示(約 1,400 文字)【請求項2】
請求項1記載の画像認識支援装置において、
前記記憶部は、前記画像特徴量変換部が変換した画像特徴量を保存し、
前記画像検索部は、前記記憶部に保存された画像特徴量を用いて画像を検索する画像認識支援装置。
【請求項3】
請求項1記載の画像認識支援装置において、
前記記憶部は、前記画像認識部が出力した前記画像付随テキスト情報を保存し、
前記テキスト処理部は、前記記憶部に保存された画像付随テキスト情報から前記要約後文章を出力する画像認識支援装置。
【請求項4】
請求項1記載の画像認識支援装置において、
表示部をさらに備え、
前記テキスト入力部は、前記検索結果に関する質問文の入力を受付け、
前記テキスト処理部は、前記質問文及び前記画像付随テキスト情報に基づいて前記質問文に対する応答文章を生成し、
前記表示部は、前記検索結果及び前記応答文章を表示する画像認識支援装置。
【請求項5】
請求項1記載の画像認識支援装置において、
前記検索結果及びあらかじめ用意された属性一覧テキストに基づいて前記検索結果の詳細情報を生成する詳細情報付与部と、
前記検索結果及び前記詳細情報を表示する表示部と、
をさらに備える画像認識支援装置。
【請求項6】
請求項1記載の画像認識支援装置において、
画像変換部をさらに備え、
前記テキスト入力部は、画像変換指示文章の入力を受付け、
前記画像変換部は、前記画像変換指示文章に基づいて前記検索結果を変換する画像認識支援装置。
【請求項7】
請求項1記載の画像認識支援装置において、
画像変換部をさらに備え、
前記テキスト入力部は、画像変換指示文章及び変換対象位置情報の入力を受付け、
前記画像変換部は、前記画像変換指示文章及び前記変換対象位置情報に基づいて前記検索結果の特定箇所を変換する画像認識支援装置。
【請求項8】
請求項1記載の画像認識支援装置において、
前記画像付随テキスト情報及び前記要約後文章を表示する表示部をさらに備える画像認識支援装置。
【請求項9】
請求項8記載の画像認識支援装置において、
前記テキスト入力部は、前記表示部により表示された要約後文章の編集を受付ける画像認識支援装置。
【請求項10】
検索対象画像を保持する記憶部を備える画像認識支援装置の画像認識支援方法において、
検索クエリおよび指示文の入力を受付けるテキスト入力ステップと、
前記検索対象画像を画像特徴量に変換する画像特徴量変換ステップと、
前記検索対象画像に関連する画像付随テキスト情報を出力する画像認識ステップと、
前記画像付随テキスト情報から前記指示文に基づいて前記検索クエリに応じた要約後文章を出力するテキスト処理ステップと、
前記出力された要約後文章を要約後文章特徴量に変換する文章特徴量変換ステップと、
前記要約後文章、前記要約後文章特徴量、前記検索対象画像、及び前記画像特徴量を用いて画像を検索して検索結果を取得する画像検索ステップと、
を有する画像認識支援方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、画像認識支援装置、画像認識支援方法、及び画像認識支援プログラムに関する。
続きを表示(約 1,400 文字)【背景技術】
【0002】
テキストを検索クエリとして与える画像検索システムにおいて、検索対象の画像特徴量だけではなく、検索対象画像に付随するテキストの言語的特徴量を検索の補助に用いるといった、マルチモーダル特徴量による検索システムが知られている。例えば、検索対象画像を商品画像とするような、商品画像検索システムを例とすると、この場合の検索対象画像に付随するテキストの例としては、商品説明の文章や、商品画像のExif情報に埋め込まれた文章、また商品画像からImage Captioning技術などによって抽出された文章などが挙げられる。これらの検索対象画像に付随するテキストを言語的特徴量に変換し、これを画像特徴量と併せて検索に用いる事で、画像特徴量のみを用いる場合よりも精度の良い検索を行う事が可能となる。
【0003】
ここで、画像特徴量は、CNNやTransformerなどのニューラルネットワークモデルに画像を入力して抽出した特徴ベクトルを表し、同様に、言語的特徴量はCNNやTransformerなどのニューラルネットワークモデルにテキストを入力して抽出した特徴ベクトルを表す。
【0004】
しかし、その検索対象画像に付随するテキストは、検索クエリの情報に無関係な場合もあり、その際は追加された言語的特徴量が検索の精度向上に繋がらない。そのため、言語的特徴量を検索の精度向上に繋げるためには、検索クエリに応じた言語的特徴量を生成する必要がある。
【0005】
検索対象画像の画像特徴量に加えて、検索対象画像に付随するテキストの言語的特徴量を検索の補助に用いる、マルチモーダル特徴量による検索システムに関する先行特許として、例えば特許文献1が知られている。
【0006】
また、非特許文献1,2において、画像上の様々な物体のラベルと座標情報等をテキストとして算出し、それをGPT-3等の言語モデルに指示文と共に入力し、画像を表すのにより適したキャプション文章を作成する技術が提案されている。
【先行技術文献】
【特許文献】
【0007】
特開2012-003357号公報
【非特許文献】
【0008】
Socratic Models: Composing Zero-Shot Multimodal Reasoning with Language, Arxiv, 2022.
Visual Clues: Bridging Vision and Language Foundations for Image Paragraph Captioning, NeurIPS, 2022.
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかし、特許文献1では事前に用意されたテキストの言語的特徴量を用いるため、検索クエリに応じた言語的特徴量を生成することができない。
【0010】
また、非特許文献1,2の技術では、従来のImage Captioning技術より豊富な情報を持ったキャプション文章を生成することができるため、生成されたテキストによる言語的特徴量が従来と比較して検索精度向上に繋がる可能性はあるが、検索クエリに応じた言語的特徴量を生成する方法は記載されていない。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

株式会社日立製作所
制御装置
14日前
株式会社日立製作所
推進装置
7日前
株式会社日立製作所
軌条車両
6日前
株式会社日立製作所
車両制御装置
7日前
株式会社日立製作所
推進システム
7日前
株式会社日立製作所
乗客コンベアー
7日前
株式会社日立製作所
超音波検査装置
8日前
株式会社日立製作所
塗料および被塗布物
1日前
株式会社日立製作所
製造装置及び製造方法
1日前
株式会社日立製作所
テキスト生成システム
7日前
株式会社日立製作所
推定システム及び方法
7日前
株式会社日立製作所
発電システム制御装置
7日前
株式会社日立製作所
データ管理装置及び方法
7日前
株式会社日立製作所
補強部材を備えた鉄道車両
8日前
株式会社日立製作所
パネル解体システムおよび方法
13日前
株式会社日立製作所
検査支援方法及び検査支援装置
13日前
株式会社日立製作所
環境認識装置及び環境認識方法
7日前
株式会社日立製作所
半導体装置およびその製造方法
6日前
株式会社日立製作所
異常検知装置及び異常検知方法
14日前
株式会社日立製作所
人物特性推定システム及び方法
7日前
株式会社日立製作所
製造評価装置および製造評価方法
8日前
株式会社日立製作所
需給計画装置および需給計画方法
6日前
株式会社日立製作所
昇降路での作業のための据付装置
14日前
株式会社日立製作所
情報処理装置並びに情報処理方法
14日前
株式会社日立製作所
受注支援装置および受注支援方法
1日前
株式会社日立製作所
超音波検査装置及び超音波検査方法
13日前
株式会社日立製作所
情報処理方法及び情報処理システム
8日前
株式会社日立製作所
データ解析装置及びデータ解析方法
7日前
株式会社日立製作所
情報処理システム及び情報処理方法
13日前
株式会社日立製作所
運転支援システムおよび運行支援方法
13日前
株式会社日立製作所
計画調整システム、及び計画調整方法
7日前
株式会社日立製作所
放射線モニタおよび放射線の測定方法
7日前
株式会社関東技研
放射性物質輸送容器
13日前
株式会社日立製作所
計算機システムとシミュレーション方法
14日前
株式会社日立製作所
輸送計画管理装置及び輸送計画管理方法
1日前
株式会社日立製作所
再生材評価方法及び再生材評価システム
1日前
続きを見る