TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025111698
公報種別公開特許公報(A)
公開日2025-07-30
出願番号2025074452,2021132919
出願日2025-04-28,2021-08-17
発明の名称学習装置、方法およびプログラム、並びに情報処理装置、方法およびプログラム
出願人富士フイルム株式会社
代理人弁理士法人太陽国際特許事務所
主分類G06V 10/82 20220101AFI20250723BHJP(計算;計数)
要約【課題】画像と文とを高精度に対応づけできるようにする学習装置、方法およびプログラム並びに情報処理装置方法およびプログラムを提供する。
【解決手段】医療情報システムにおいて、学習装置7は、第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出する第1導出部22と、画像に含まれるオブジェクトに関する記載を含む文を構造化することにより文についての構造化情報を導出する構造化情報導出部23と、第2ニューラルネットワークにより、構造化情報から文についての第2特徴量を導出する第2導出部24と、を備え、画像に含まれるオブジェクトと文に記載されたオブジェクトとが対応する場合には、第1特徴量及び第2特徴量が属する特徴空間において導出される第1特徴量と第2特徴量との距離が小さくなるように第1ニューラルネットワーク及び第2ニューラルネットワークを学習する。
【選択図】図4
特許請求の範囲【請求項1】
少なくとも1つのプロセッサを備え、
前記プロセッサは、
学習装置であって、
第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出し、
画像に含まれるオブジェクトに関する記載を含む文を構造化することにより、前記文についての構造化情報を導出し、
第2ニューラルネットワークにより、前記構造化情報から前記文についての第2特徴量を導出し、
前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応する場合には、前記第1特徴量および前記第2特徴量が属する特徴空間において、前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応しない場合よりも、導出される前記第1特徴量と前記第2特徴量との距離が小さくなるように前記第1ニューラルネットワークおよび前記第2ニューラルネットワークを学習することにより、画像に含まれるオブジェクトについての特徴量を導出する第1導出モデルおよびオブジェクトに関する記載を含む文についての特徴量を導出する第2導出モデルを構築する学習装置、
によって構築された第1導出モデルにより、対象画像に含まれる1以上のオブジェクトについての第1特徴量を導出し、
オブジェクトに関する記載を含む1以上の対象文を構造化することにより前記対象文についての構造化情報を導出し、
前記学習装置により構築された第2導出モデルにより、前記対象文についての構造化情報から前記対象文についての第2特徴量を導出し、
導出された前記第1特徴量および前記第2特徴量の特徴空間における距離に基づいて前記第2特徴量に対応する前記第1特徴量を特定し、
前記特定された第1特徴量を導出したオブジェクトを前記対象画像において他の領域と区別して表示する情報処理装置。
続きを表示(約 4,200 文字)【請求項2】
少なくとも1つのプロセッサを備え、
前記プロセッサは、
オブジェクトに関する記載を含む対象文の入力を受け付け、
前記対象文を構造化することにより前記対象文についての構造化情報を導出し、
学習装置であって、
第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出し、
画像に含まれるオブジェクトに関する記載を含む文を構造化することにより、前記文についての構造化情報を導出し、
第2ニューラルネットワークにより、前記構造化情報から前記文についての第2特徴量を導出し、
前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応する場合には、前記第1特徴量および前記第2特徴量が属する特徴空間において、前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応しない場合よりも、導出される前記第1特徴量と前記第2特徴量との距離が小さくなるように前記第1ニューラルネットワークおよび前記第2ニューラルネットワークを学習することにより、画像に含まれるオブジェクトについての特徴量を導出する第1導出モデルおよびオブジェクトに関する記載を含む文についての特徴量を導出する第2導出モデルを構築する学習装置、
によって構築された第2導出モデルにより、前記対象文についての構造化情報から前記入力された対象文についての第2の特徴量を導出し、
前記学習装置により構築された第1導出モデルにより導出された、複数の参照画像のそれぞれに含まれる1以上のオブジェクトについての第1特徴量が前記参照画像のそれぞれと対応づけられたデータベースを参照することにより、前記複数の参照画像についての前記第1特徴量と前記導出された第2特徴量との特徴空間における距離に基づいて前記第2特徴量に対応する少なくとも1つの前記第1特徴量を特定し、
前記特定された第1特徴量と対応づけられた参照画像を特定する情報処理装置。
【請求項3】
前記プロセッサは、前記第1特徴量との対応づけに寄与した固有表現を通知する請求項1または2に記載の情報処理装置。
【請求項4】
学習装置であって、
第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出し、
画像に含まれるオブジェクトに関する記載を含む文を構造化することにより、前記文についての構造化情報を導出し、
第2ニューラルネットワークにより、前記構造化情報から前記文についての第2特徴量を導出し、
前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応する場合には、前記第1特徴量および前記第2特徴量が属する特徴空間において、前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応しない場合よりも、導出される前記第1特徴量と前記第2特徴量との距離が小さくなるように前記第1ニューラルネットワークおよび前記第2ニューラルネットワークを学習することにより、画像に含まれるオブジェクトについての特徴量を導出する第1導出モデルおよびオブジェクトに関する記載を含む文についての特徴量を導出する第2導出モデルを構築する学習装置、
によって構築された第1導出モデルにより、対象画像に含まれる1以上のオブジェクトについての第1特徴量を導出し、
オブジェクトに関する記載を含む1以上の対象文を構造化することにより前記対象文についての構造化情報を導出し、
前記学習装置により構築された第2導出モデルにより、前記対象文についての構造化情報から前記対象文についての第2特徴量を導出し、
導出された前記第1特徴量および前記第2特徴量の特徴空間における距離に基づいて前記第2特徴量に対応する前記第1特徴量を特定し、
前記特定された第1特徴量を導出したオブジェクトを前記対象画像において他の領域と区別して表示する情報処理方法。
【請求項5】
オブジェクトに関する記載を含む対象文の入力を受け付け、
前記対象文を構造化することにより前記対象文についての構造化情報を導出し、
学習装置であって、
第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出し、
画像に含まれるオブジェクトに関する記載を含む文を構造化することにより、前記文についての構造化情報を導出し、
第2ニューラルネットワークにより、前記構造化情報から前記文についての第2特徴量を導出し、
前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応する場合には、前記第1特徴量および前記第2特徴量が属する特徴空間において、前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応しない場合よりも、導出される前記第1特徴量と前記第2特徴量との距離が小さくなるように前記第1ニューラルネットワークおよび前記第2ニューラルネットワークを学習することにより、画像に含まれるオブジェクトについての特徴量を導出する第1導出モデルおよびオブジェクトに関する記載を含む文についての特徴量を導出する第2導出モデルを構築する学習装置、
によって構築された第2導出モデルにより、前記対象文についての構造化情報から前記入力された対象文についての第2の特徴量を導出し、
前記学習装置により構築された第1導出モデルにより導出された、複数の参照画像のそれぞれに含まれる1以上のオブジェクトについての第1特徴量が前記参照画像のそれぞれと対応づけられたデータベースを参照することにより、前記複数の参照画像についての前記第1特徴量と前記導出された第2特徴量との特徴空間における距離に基づいて前記第2特徴量に対応する少なくとも1つの前記第1特徴量を特定し、
前記特定された第1特徴量と対応づけられた参照画像を特定する情報処理方法。
【請求項6】
学習装置であって、
第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出し、
画像に含まれるオブジェクトに関する記載を含む文を構造化することにより、前記文についての構造化情報を導出し、
第2ニューラルネットワークにより、前記構造化情報から前記文についての第2特徴量を導出し、
前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応する場合には、前記第1特徴量および前記第2特徴量が属する特徴空間において、前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応しない場合よりも、導出される前記第1特徴量と前記第2特徴量との距離が小さくなるように前記第1ニューラルネットワークおよび前記第2ニューラルネットワークを学習することにより、画像に含まれるオブジェクトについての特徴量を導出する第1導出モデルおよびオブジェクトに関する記載を含む文についての特徴量を導出する第2導出モデルを構築する学習装置、
によって構築された第1導出モデルにより、対象画像に含まれる1以上のオブジェクトについての第1特徴量を導出する手順と、
オブジェクトに関する記載を含む1以上の対象文を構造化することにより前記対象文についての構造化情報を導出する手順と、
前記学習装置により構築された第2導出モデルにより、前記対象文についての構造化情報から前記対象文についての第2特徴量を導出する手順と、
導出された前記第1特徴量および前記第2特徴量の特徴空間における距離に基づいて前記第2特徴量に対応する前記第1特徴量を特定する手順と、
前記特定された第1特徴量を導出したオブジェクトを前記対象画像において他の領域と区別して表示する手順とをコンピュータに実行させる情報処理プログラム。
【請求項7】
オブジェクトに関する記載を含む対象文の入力を受け付ける手順と、
前記対象文を構造化することにより前記対象文についての構造化情報を導出する手順と、
学習装置であって、
第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出し、
画像に含まれるオブジェクトに関する記載を含む文を構造化することにより、前記文についての構造化情報を導出し、
第2ニューラルネットワークにより、前記構造化情報から前記文についての第2特徴量を導出し、
前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応する場合には、前記第1特徴量および前記第2特徴量が属する特徴空間において、前記画像に含まれるオブジェクトと前記文に記載されたオブジェクトとが対応しない場合よりも、導出される前記第1特徴量と前記第2特徴量との距離が小さくなるように前記第1ニューラルネットワークおよび前記第2ニューラルネットワークを学習することにより、画像に含まれるオブジェクトについての特徴量を導出する第1導出モデルおよびオブジェクトに関する記載を含む文についての特徴量を導出する第2導出モデルを構築する学習装置、
によって構築された第2導出モデルにより、前記対象文についての構造化情報から前記入力された対象文についての第2の特徴量を導出する手順と、
前記学習装置により構築された第1導出モデルにより導出された、複数の参照画像のそれぞれに含まれる1以上のオブジェクトについての第1特徴量が前記参照画像のそれぞれと対応づけられたデータベースを参照することにより、前記複数の参照画像についての前記第1特徴量と前記導出された第2特徴量との特徴空間における距離に基づいて前記第2特徴量に対応する少なくとも1つの前記第1特徴量を特定する手順と、
前記特定された第1特徴量と対応づけられた参照画像を特定する手順とをコンピュータに実行させる情報処理プログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、学習装置、方法およびプログラム、並びに情報処理装置、方法およびプログラムに関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
ディープラーニング等により機械学習がなされた学習済みモデルを用いて画像から抽出した特徴ベクトルのような特徴量が属する特徴空間を構築する手法が提案されている。例えば非特許文献1には、画像およびテキストのそれぞれから特徴量を抽出し、特徴量に基づいて画像とテキストとの関係性を推定する手法が提案されている。
【0003】
また、テキストデータを解析して単語データを取得し、単語データに基づいて画像中の物体を特定する手法も提案されている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
特開2020-013594号公報
【非特許文献】
【0005】
Stacked Cross Attention for Image-Text Matching、Kuang-Huei Leeら、21 Mar 2018、arXiv:1803.08024
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、画像についてその内容を文として記載した場合、内容は同一であっても記載した人に応じて表現の仕方が異なる。このため、医用画像についての所見文は、同一の所見であっても医師に応じて表現の仕方が異なる。例えば、右肺の区域S6に充実型の結節があり、そのサイズが10mmであり、かつ境界が不明瞭である所見を呈する医用画像についての所見文は、それを記載する医師に応じて、「右肺S6に充実型結節を認める。サイズは10mm。境界はやや不明瞭である。」、「右肺S6に10mm大の充実型結節を認める。辺縁は比較的不明瞭である。」、および「右下葉S6にφ10mmの充実型結節。境界はやや不明瞭。」のように表現の仕方が異なるものとなる。このように、所見文等の文は内容が同一であっても、表現の仕方が異なることからばらつきが非常に多いものとなる。このように多様な表現を有する文から精度よく特徴量を導出できるモデルを構築するためには、大量の教師データが必要となる。
【0007】
しかしながら、文の数は限りがあるため、大量の教師データを用意することが困難である。このため、画像と文とを高精度に対応づけることができる学習済みモデルを構築することは困難である。
【0008】
本開示は上記事情に鑑みなされたものであり、画像と文とを高精度に対応づけできるようにすることを目的とする。
【課題を解決するための手段】
【0009】
本開示による学習装置は、少なくとも1つのプロセッサを備え、
プロセッサは、第1ニューラルネットワークにより、画像に含まれるオブジェクトについての第1特徴量を導出し、
画像に含まれるオブジェクトに関する記載を含む文を構造化することにより、文についての構造化情報を導出し、
第2ニューラルネットワークにより、構造化情報から文についての第2特徴量を導出し、
画像に含まれるオブジェクトと文に記載されたオブジェクトとが対応する場合には、第1特徴量および第2特徴量が属する特徴空間において、画像に含まれるオブジェクトと文に記載されたオブジェクトとが対応しない場合よりも、導出される第1特徴量と第2特徴量との距離が小さくなるように第1ニューラルネットワークおよび第2ニューラルネットワークを学習することにより、画像に含まれるオブジェクトについての特徴量を導出する第1導出モデルおよびオブジェクトに関する記載を含む文についての特徴量を導出する第2導出モデルを構築する。
【0010】
なお、本開示による学習装置においては、プロセッサは、画像に含まれるオブジェクトと文に記載されたオブジェクトとが対応しない場合には、特徴空間において、画像に含まれるオブジェクトと文に記載されたオブジェクトとが対応する場合よりも、導出される第1特徴量と第2特徴量との距離が大きくなるように、第1ニューラルネットワークおよび第2ニューラルネットワークを学習するものであってもよい。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士フイルム株式会社
消音器
2日前
富士フイルム株式会社
レンズ装置
5日前
富士フイルム株式会社
レンズ装置
5日前
富士フイルム株式会社
超音波プローブ
5日前
富士フイルム株式会社
消音器付き風路
2日前
富士フイルム株式会社
デジタルカメラ
3日前
富士フイルム株式会社
内視鏡の制御装置
4日前
富士フイルム株式会社
光源装置及びシステム
2日前
富士フイルム株式会社
ズームレンズおよび撮像装置
5日前
富士フイルム株式会社
PCCT装置とその制御方法
2日前
富士フイルム株式会社
PCCT装置とその制御方法
2日前
富士フイルム株式会社
粘着剤層付き偏光板、表示装置
2日前
富士フイルム株式会社
デジタルカメラ及びそのダイヤル
3日前
富士フイルム株式会社
医用画像撮像装置及びその制御方法
5日前
富士フイルム株式会社
X線CT装置、及び、画像処理のためのプロセッサ
3日前
富士フイルム株式会社
ペプチドの製造方法、化合物、及びペプチド合成試薬
4日前
富士フイルム株式会社
情報管理装置及び情報管理装置の作動方法並びに情報管理プログラム
2日前
富士フイルム株式会社
繊維板構造体製造方法、繊維板構造体製造システム、及び繊維板構造体
4日前
富士フイルム株式会社
レンズ鏡筒及び撮像装置
2日前
富士フイルム株式会社
学習モデル処理装置、リモート学習システム、及び学習モデル処理プログラム
5日前
富士フイルム株式会社
磁性粒子含有組成物、磁性粒子含有膜及び電子部品
4日前
富士フイルム株式会社
磁性粒子含有組成物、磁性粒子含有膜及び電子部品
4日前
富士フイルム株式会社
磁性粒子含有組成物、磁性粒子含有膜及び電子部品
4日前
富士フイルム株式会社
磁性粒子含有組成物、磁性粒子含有膜及び電子部品
4日前
富士フイルム株式会社
磁性粒子含有組成物、磁性粒子含有膜及び電子部品
4日前
富士フイルム株式会社
学習装置、方法およびプログラム、並びに情報処理装置、方法およびプログラム
4日前
個人
対話装置
1か月前
個人
裁判のAI化
17日前
個人
情報処理装置
1か月前
個人
情報処理システム
24日前
個人
情報処理装置
1か月前
個人
記入設定プラグイン
1か月前
個人
検査システム
26日前
個人
介護情報提供システム
3日前
個人
設計支援システム
9日前
個人
設計支援システム
9日前
続きを見る