TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2023078878
公報種別公開特許公報(A)
公開日2023-06-07
出願番号2021192190
出願日2021-11-26
発明の名称情報処理装置、情報処理方法およびプログラム
出願人キヤノン株式会社
代理人個人,個人
主分類G06T 1/00 20060101AFI20230531BHJP(計算;計数)
要約【課題】 対象物の領域を示す正解画像データを効率的かつ高精度に生成する。
【解決手段】 本発明の情報処理装100は、学習画像データにおける対象物の位置および大きさの情報を含む第一の情報と、該対象物の領域に関する制約の情報を含む第二の情報とを取得する取得部110と、前記学習画像データに対する正解画像データとして、前記第一の情報および前記第二の情報に基づいて、前記対象物らしさを示す尤度マップを生成する生成部120と、を備える。
【選択図】 図1
特許請求の範囲【請求項1】
学習画像データにおける対象物の位置および大きさの情報を含む第一の情報と、該対象物の領域に関する制約の情報を含む第二の情報とを取得する取得部と、
前記学習画像データに対する正解画像データとして、前記第一の情報および前記第二の情報に基づいて、前記対象物らしさを示す尤度マップを生成する生成部と、
を有することを特徴とする情報処理装置。
続きを表示(約 1,100 文字)【請求項2】
前記生成部は、前記第一の情報に基づいて前記対象物の領域に関する初期尤度マップを生成し、
前記第二の情報に基づいて、該初期尤度マップを補正することで前記対象物らしさを示す尤度マップを生成することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記生成部は、前記第一の情報に基づいて前記対象物の領域を示すマスク画像データを生成し、該マスク画像データを平滑化することで、前記初期尤度マップを生成することを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記生成部は、前記第一の情報に基づいて前記対象物の領域を示すマスク画像データを生成し、該マスク画像データを距離変換することで、前記初期尤度マップを生成することを特徴とする請求項2に記載の情報処理装置。
【請求項5】
前記生成部は、前記第二の情報に基づいて、前記学習画像データに対して、前記対象物らしさを示す尤度マップを生成するための部分領域を決定し、前記部分領域に対して、前記第一の情報に基づいて前記対象物の尤度を算出することで、前記対象物らしさを示す尤度マップを生成することを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記部分領域は、前記対象物が存在する可能性の高い領域であることを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記第一の情報は、確率分布関数のパラメータをさらに含み、前記生成部は前記確率分布関数と、前記対象物の位置および大きさの情報とを含む前記第一の情報および前記第二の情報に基づいて前記対象物らしさを示す尤度マップを生成することを特徴とする請求項1乃至6のいずれか一項に記載の情報処理装置。
【請求項8】
前記第一の情報は、前記対象物の概形を表現するパラメトリックな形状モデルのパラメータをさらに含み、前記生成部は前記パラメトリックな形状モデルと前記対象物の位置および大きさの情報とを含む前記第一の情報および前記第二の情報に基づいて前記対象物らしさを示す尤度マップを生成することを特徴とする請求項1乃至6のいずれか一項に記載の情報処理装置。
【請求項9】
前記第二の情報は画像データであることを特徴とする、請求項1乃至8のいずれか一項に記載の情報処理装置。
【請求項10】
前記第二の情報は前記対象物を内包する物体の領域を示す画像データであることを特徴とする請求項9に記載の情報処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本明細書の開示は、正解画像データを生成する情報処理装置、情報処理方法およびプログラムに関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
機械学習に基づくセグメンテーションの精度は、学習画像データと正解画像データから構成される教師データの数に依存するため、大量の教師データを準備することが望ましい。正解画像データの作成は労力を要する作業であるため、正解画像データを効率的に作成する技術が重要となる。例えば、非特許文献1には、対象物を囲む矩形の枠線を示すバウンディングボックスから、対象物らしさを示す正解画像データ(正解尤度マップ)を生成する技術が開示されている。
【先行技術文献】
【非特許文献】
【0003】
M. Najibi et al., Towards the Success Rate of One: Real-time Unconstrained Salient Object Detection, arXiv:1708.00079v2,2017.
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、非特許文献1に開示されている技術によって生成される正解画像データは、バウンディングボックスの幅や高さに応じて正解画像データを作成するため、正解画像データによっては対象物の実領域に対する近似精度が低くなる場合があった。
【0005】
本発明は、対象物の領域を示す正解画像データを効率的かつ高精度に生成することができる情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明に係る情報処理装置は、学習画像データにおける対象物の位置および大きさの情報を含む第一の情報と、該対象物の領域に関する制約の情報を含む第二の情報とを取得する取得部と、前記学習画像データに対する正解画像データとして、前記第一の情報および前記第二の情報に基づいて、前記対象物らしさを示す尤度マップを生成する生成部と、を備える。
【発明の効果】
【0007】
本明細書の開示によれば、対象物の領域を示す正解画像データを効率的かつ高精度に生成できる。
【図面の簡単な説明】
【0008】
第一の実施形態に係る情報処理装置の機能構成の一例を示す図。
第一の実施形態に係る情報処理装置のハードウェア構成の一例を示す図。
第一の実施形態に係る情報処理装置の処理手順の一例を示す図。
第一の実施形態に係る情報処理装置の処理手順の一例を示す図。
第一の実施形態に係る画像を説明する図。
第一の実施形態に係る情報処理装置の処理手順の一例を示す図。
第二の実施形態に係る情報処理装置の処理手順の一例を示す図。
【発明を実施するための形態】
【0009】
以下、図面を参照して本明細書に開示の情報処理装置の好ましい実施形態について説明する。各図面に示される同一または同等の構成要素、部材、処理には、同一の符号を付するものとし、適宜重複した説明は省略する。また、各図面では適宜、構成要素、部材、処理の一部は省略して表示する。
【0010】
以下では、X線コンピュータ断層撮像(X線CT)装置で撮影された腹部CT画像データ中に描出されている肝腫瘍を例に挙げて、本発明について説明する。しかしながら、本発明は、肝腫瘍のみならず、他の病変(例えば、肺結節、リンパ節、骨転移等)や、それ以外のあらゆる構造物に対して適用可能である。また、核磁気共鳴画像撮像(MRI)装置、ポジトロン断層撮像(PET)装置、超音波撮像装置で撮像された断層画像データや、カメラで撮影された一般的な画像データに対しても適用可能である。また、本発明は2次元画像データであっても、3次元画像データであっても適用可能である。さらに、本発明は一般物体を撮影した画像データに対しても適用可能である。なお、本発明の実施形態は以下の実施形態に限定されるものではない。
【実施例】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許