TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025096159
公報種別公開特許公報(A)
公開日2025-06-26
出願番号2024193479
出願日2024-11-05
発明の名称情報処理装置、情報処理方法およびプログラム
出願人キヤノン株式会社
代理人弁理士法人秀和特許事務所
主分類G06T 7/00 20170101AFI20250619BHJP(計算;計数)
要約【課題】解析対象の画像が入力される機械学習モデルにおいて、解析処理の精度低下を低減する。
【解決手段】本開示に係る画像処理装置は、情報処理装置は、解析対象の第1の画像を取得する画像取得手段と、前記第1の画像を第1の機械学習モデルに入力して、前記第1の画像に描出されていない前記第1の画像の周辺領域に画像が追加された第2の画像を取得する画像追加手段と、前記第2の画像を第2の機械学習モデルに入力して、前記第2の画像の解析結果を取得する解析手段と、を備える。
【選択図】図1
特許請求の範囲【請求項1】
解析対象の第1の画像を取得する画像取得手段と、
前記第1の画像を第1の機械学習モデルに入力して、前記第1の画像に描出されていない前記第1の画像の周辺領域に画像が追加された第2の画像を取得する画像追加手段と、
前記第2の画像を第2の機械学習モデルに入力して、前記第2の画像の解析結果を取得する解析手段と、
を備えることを特徴とする情報処理装置。
続きを表示(約 1,000 文字)【請求項2】
前記第1の機械学習モデルは、前記第1の画像の前記周辺領域の一部に画像を追加する、ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記第2の機械学習モデルは、前記第2の画像に含まれる解析対象物に関する特徴量を示す特徴量マップを生成し、前記特徴量マップの所定の辺縁領域を除去し、前記所定の辺縁領域が除去された前記特徴量マップを用いて前記解析結果を出力する、
ことを特徴とする請求項1または2に記載の情報処理装置。
【請求項4】
前記第2の機械学習モデルは、前記第2の画像に含まれる前記解析対象物に関する前記特徴量を示す前記特徴量マップを出力するネットワークモデルを有する、ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記第2の機械学習モデルは、前記所定の辺縁領域が除去された前記特徴量マップを全結合層または前記全結合層に対応するプーリング層に入力して前記解析結果を出力する、ことを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記第2の機械学習モデルは、前記解析結果を示す画像から、前記画像取得手段が取得する前記第1の画像に応じた所定の辺縁領域を除去する、ことを特徴とする請求項1または2に記載の情報処理装置。
【請求項7】
前記第2の機械学習モデルによって除去される前記所定の辺縁領域は、前記第2の画像において画像が追加された前記周辺領域と一致する、ことを特徴とする請求項6に記載の情報処理装置。
【請求項8】
前記解析結果が前記第2の画像の所定の辺縁領域に位置する物体を示す指標を含む場合に、前記第2の機械学習モデルは、前記指標を前記所定の辺縁領域と重ならないように修正して前記解析結果を出力する、ことを特徴とする請求項1または2に記載の情報処理装置。
【請求項9】
前記第2の画像の前記所定の辺縁領域は、前記第2の画像において画像が追加された前記周辺領域と一致する、ことを特徴とする請求項8に記載の情報処理装置。
【請求項10】
前記指標は、前記物体を囲むバウンディングボックスまたは前記物体の識別子または前記物体と重なるマスク画像である、ことを特徴とする請求項8に記載の情報処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法およびプログラムに関する。
続きを表示(約 2,900 文字)【背景技術】
【0002】
近年、画像分類、物体検出、セマンティックセグメンテーション等を行う画像処理分野のアプリケーションにおいて、畳み込みニューラルネットワーク(CNN;Convolutional Neural Network)が採用されている。CNNは、畳み込み処理を繰り返し実行する深層学習技術の一種であり、例えば、非特許文献1、2において画像処理を精度よく行うことができる。
【先行技術文献】
【非特許文献】
【0003】
Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun, "Deep Residual Learning for Image Recognition", <https://arxiv.org/abs/1512.03385>(2015年12月10日公開)
Jiahui Yu, Zhe Lin, Jimei Yang, et al., "Generative Image Inpainting with Contextual Attention", <https://arxiv.org/abs/1801.07892>(2018年1月24日公開)
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、多くのCNNに含まれるパディング処理(入力画像の周囲を所定の値で補うことで出力画像のサイズを調整する処理)に起因する課題が生じる。例えば、CNNにおいて、画像の中央に存在する分類対象や検出対象に対しては精度よく処理できるが、画像の辺縁に存在する分類対象や検出対象に対しては精度が低下するという課題がある。これは、パディング処理等において精度の向上に貢献しないデータが生成され、生成されたデータが畳み込み処理の結果に取り込まれることが原因である。
【0005】
本開示の技術は、上記に鑑みてなされたものであり、解析対象の画像が入力される機械学習モデルにおいて、解析処理の精度低下を低減することを目的とする。
【課題を解決するための手段】
【0006】
本開示に係る情報処理装置は、解析対象の第1の画像を取得する画像取得手段と、前記第1の画像を第1の機械学習モデルに入力して、前記第1の画像に描出されていない前記第1の画像の周辺領域に画像が追加された第2の画像を取得する画像追加手段と、前記第2の画像を第2の機械学習モデルに入力して、前記第2の画像の解析結果を取得する解析手段と、を備えることを特徴とする情報処理装置を含む。また、本開示に係る情報処理装置は、解析対象の画像を取得する画像取得手段と、前記画像を機械学習モデルに入力して、前記画像の解析結果を取得する解析手段と、を備え、前記機械学習モデルは、前記画像に含まれる解析対象物に関する特徴量を示す特徴量マップを生成し、前記特徴量マップの所定の辺縁領域を除去し、前記所定の辺縁領域が除去された前記特徴量マップを用いて前記解析結果を出力する、ことを特徴とする情報処理装置を含む。また、本開示に係る情報処理装置は、解析対象の第1の画像を取得する画像取得手段と、前記第1の画像に描出されていない前記第1の画像の周辺領域に画像が追加された第2の画像を取得する画像追加手段と、前記第2の画像を機械学習モデルに入力して、前記第2の画像の解析結果を取得
する解析手段と、を備え、前記機械学習モデルは、前記第2の画像に含まれる解析対象物に関する特徴量を示す特徴量マップを生成し、前記特徴量マップの所定の辺縁領域を除去し、前記所定の辺縁領域が除去された前記特徴量マップを用いて前記解析結果を出力する、ことを特徴とする情報処理装置を含む。
【0007】
また、本開示に係る情報処理方法は、解析対象の第1の画像を取得する画像取得ステップと、前記第1の画像を第1の機械学習モデルに入力して、前記第1の画像に描出されていない前記第1の画像の周辺領域に画像が追加された第2の画像を取得する画像追加ステップと、前記第2の画像を第2の機械学習モデルに入力して、前記第2の画像の解析結果を取得する解析ステップと、を有することを特徴とする情報処理方法を含む。また、本開示に係る情報処理方法は、解析対象の画像を取得する画像取得ステップと、前記画像を機械学習モデルに入力して、前記画像の解析結果を取得する解析ステップと、を有し、前記機械学習モデルは、前記画像に含まれる解析対象物に関する特徴量を示す特徴量マップを生成し、前記特徴量マップの所定の辺縁領域を除去し、前記所定の辺縁領域が除去された前記特徴量マップを用いて前記解析結果を出力する、ことを特徴とする情報処理方法を含む。また、本開示に係る情報処理方法は、解析対象の第1の画像を取得する画像取得ステップと、前記第1の画像に描出されていない前記第1の画像の周辺領域に画像が追加された第2の画像を取得する画像追加ステップと、前記第2の画像を機械学習モデルに入力して、前記第2の画像の解析結果を取得する解析ステップと、を有し、前記機械学習モデルは、前記第2の画像に含まれる解析対象物に関する特徴量を示す特徴量マップを生成し、前記特徴量マップの所定の辺縁領域を除去し、前記所定の辺縁領域が除去された前記特徴量マップを用いて前記解析結果を出力する、ことを特徴とする情報処理方法を含む。
【発明の効果】
【0008】
本開示の技術によれば、解析対象の画像が入力される機械学習モデルにおいて、解析処理の精度低下を低減することができる。
【図面の簡単な説明】
【0009】
一実施形態に係る情報処理装置の構成を示す図である。
一実施形態に係る情報処理装置が実行する処理のフローチャートである。
一実施形態における解析対象の画像と復元画像の関係を示す図である。
一実施形態における復元画像を示す図である。
一実施形態におけるパディング処理の一例を説明する図である。
一実施形態におけるパディング処理の別の例を説明する図である。
一実施形態における解析対象の画像と復元画像の関係を示す図である。
一実施形態におけるCNNの分類器による処理の一例を説明する図である。
一実施形態におけるCNNの分類器による処理の別の例を説明する図である。
一実施形態における復元画像のトリミング処理を説明する図である。
【発明を実施するための形態】
【0010】
以下、本開示の実施形態について図面を用いて説明する。なお、本開示は以下の実施形態に限定されるものではなく、その要旨を逸脱しない範囲において適宜変更可能である。また、以下で説明する図面において、同じ機能を有する構成には、同一の符号が付され、その説明は省略または簡略化される場合がある。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

キヤノン株式会社
画像形成装置
1日前
キヤノン株式会社
モータ制御装置
1日前
キヤノン株式会社
接合方法、接合システムおよび製造方法
1日前
キヤノン株式会社
位置管理システム、方法、及び情報処理装置
1日前
キヤノン株式会社
液体吐出ヘッド、液体吐出ヘッドの製造方法
1日前
キヤノン株式会社
情報処理装置、情報処理方法およびプログラム
1日前
キヤノン株式会社
除電装置、画像形成システム及び電荷調整装置
1日前
キヤノン株式会社
除電装置、画像形成システム及び電荷調整装置
1日前
キヤノン株式会社
除電装置、画像形成システム及び電荷調整装置
1日前
キヤノン株式会社
除電装置、画像形成システム及び電荷調整装置
1日前
キヤノン株式会社
記録装置、記録装置の吐出タイミングの調整方法
1日前
キヤノン株式会社
通信装置、通信装置の制御方法、及び、プログラム
1日前
キヤノン株式会社
通信装置、通信装置の制御方法、及び、プログラム
1日前
キヤノン株式会社
画像表示制御装置、画像表示制御方法及びプログラム
1日前
キヤノン株式会社
画像形成装置
1日前
キヤノン株式会社
画像処理装置
1日前
キヤノン株式会社
検査システム
1日前
キヤノン株式会社
ウエハがプリアライメント装置上にある間のエッジ偏心を計測する方法
1日前
キヤノン株式会社
定着装置及び画像形成装置
1日前
キヤノン株式会社
露光装置及び画像形成装置
1日前
キヤノン株式会社
画像読取装置及び画像形成装置
1日前
キヤノン株式会社
画像読取装置および画像形成装置
1日前
キヤノン株式会社
情報処理装置、およびアプリケーション
1日前
キヤノン株式会社
素子基板、液体吐出ヘッド及び記録装置
1日前
キヤノン株式会社
画像処理装置及び画像処理装置の制御方法
1日前
キヤノン株式会社
原稿読取装置及びその制御方法、プログラム
1日前
キヤノン株式会社
画像処理装置、画像処理方法、およびプログラム
1日前
キヤノン株式会社
レンズ装置、撮像システム、レンズ装置の制御方法、およびプログラム
1日前
個人
対話装置
15日前
個人
政治のAI化
1か月前
個人
物品給付年金
1か月前
個人
情報処理装置
15日前
個人
在宅介護システム
1か月前
個人
RFタグ読取装置
1か月前
個人
記入設定プラグイン
3日前
個人
情報処理装置
11日前
続きを見る