TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025115956
公報種別公開特許公報(A)
公開日2025-08-07
出願番号2025007096
出願日2025-01-17
発明の名称画像処理方法、プログラム、及び記憶媒体
出願人キヤノン株式会社
代理人個人,個人,個人
主分類G06T 5/60 20240101AFI20250731BHJP(計算;計数)
要約【課題】機械学習モデルを用いた画像処理において、偽構造の発生を抑制しつつ、高精度な画像処理方法を提供すること。
【解決手段】画像処理方法は、生成モデルと非生成モデルを含む複数の機械学習モデルを用いて、入力画像から推定画像を生成する工程を有し、工程において入力画像に関する情報に基づいて入力画像の複数の領域ごとに生成モデルの出力と非生成モデルの出力とのウエイトを異ならせて推定画像を生成する。
【選択図】図6
特許請求の範囲【請求項1】
生成モデルと非生成モデルを含む複数の機械学習モデルを用いて、入力画像から推定画像を生成する工程を有し、
前記工程において前記入力画像に関する情報に基づいて前記入力画像の複数の領域ごとに前記生成モデルの出力と前記非生成モデルの出力とのウエイトを異ならせて前記推定画像を生成することを特徴とする画像処理方法。
続きを表示(約 1,600 文字)【請求項2】
前記入力画像に関する情報は、前記入力画像の距離に関する情報、セグメンテーションマップ、飽和領域に関する情報、及び光学性能マップの少なくとも一つを含むことを特徴とする請求項1に記載の画像処理方法。
【請求項3】
前記入力画像の距離に関する情報は、デフォーカスマップまたはデプスマップであることを特徴とする請求項2に記載の画像処理方法。
【請求項4】
前記入力画像に関する情報は、前記入力画像の距離に関する情報を含み、
前記推定画像は、
前記入力画像の距離に関する情報に基づいて前記複数の領域のうち合焦領域であると判定された領域について前記非生成モデルの出力のウエイトが前記生成モデルの出力のウエイトよりも大きくして生成され、
前記入力画像の距離に関する情報に基づいて前記複数の領域のうち非合焦領域であると判定された領域について前記生成モデルの出力のウエイトが前記非生成モデルの出力のウエイトよりも大きくして生成されることを特徴とする請求項1に記載の画像処理方法。
【請求項5】
前記入力画像に関する情報は、セグメンテーションマップを含み、
前記推定画像は、
前記セグメンテーションマップに基づいて前記複数の領域のうち人物を含む領域であると判定された領域について前記非生成モデルの出力のウエイトが前記生成モデルの出力のウエイトよりも大きくして生成され、
前記セグメンテーションマップに基づいて前記複数の領域のうち人物を含まない領域であると判定された領域について前記生成モデルの出力のウエイトが前記非生成モデルの出力のウエイトよりも大きくして生成されることを特徴とする請求項1に記載の画像処理方法。
【請求項6】
前記推定画像は、
前記入力画像に関する情報に基づいて前記複数の領域のうち第1領域であると判定された領域について前記非生成モデルの出力を用いて生成され、
前記入力画像に関する情報に基づいて前記複数の領域のうち第2領域であると判定された領域について前記生成モデルの出力を用いて生成されることを特徴とする請求項1乃至5の何れか一項に記載の画像処理方法。
【請求項7】
前記工程において、前記入力画像を前記生成モデルに入力することで生成された第1画像と、前記入力画像を前記非生成モデルに入力することで生成された第2画像とを前記入力画像に関する情報に基づいて加重平均することで、前記推定画像を生成することを特徴とする請求項1乃至5の何れか一項に記載の画像処理方法。
【請求項8】
前記工程において、
前記入力画像と前記入力画像に関する情報とを前記生成モデルと非生成モデルの一方に入力することで、第1画像を生成し、
前記第1画像と前記入力画像に関する情報とを前記生成モデルと前記非生成モデルの他方に入力することで前記推定画像を生成することを特徴とする請求項1乃至5の何れか一項に記載の画像処理方法。
【請求項9】
前記推定画像は、前記入力画像のデフォーカスぼけの形状と異なるデフォーカスぼけの形状を有する画像であることを特徴とする請求項1乃至5の何れか一項に記載の画像処理方法。
【請求項10】
第1の機械学習モデルを用いて、入力画像に基づき、第1の画像を生成する工程と、
第2の機械学習モデルを用いて、前記入力画像または前記第1の画像に基づき、第1の付与成分を生成する工程と、
前記第1の付与成分に関する調整パラメータを取得する工程と、
前記第1の付与成分と前記調整パラメータとに基づいて第2の付与成分を生成する工程と、
前記第1の画像と前記第2の付与成分とに基づいて推定画像を生成する工程とを有することを特徴とする画像処理方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、機械学習モデルを用いた画像処理方法に関する。
続きを表示(約 2,500 文字)【背景技術】
【0002】
機械学習モデルには、ネットワーク構造や学習方法の違いにより、複数のモデルが存在する。様々な所望のデータを生成するための確率分布を学習により獲得し、推定時はその分布に基づいて出力するモデルを生成モデルと呼ぶ。生成モデルは、画像のぼけ補正やデプス推定、アップサンプリング等の回帰タスクにおいても、従来のCNN(Convolutional Neural Network)ベースの機械学習モデルよりも高い性能を発揮することが知られている。非特許文献1には、生成モデルの1つである拡散モデル(Diffusion model)を用いて画像のぼけを先鋭化する方法が開示されている。
【先行技術文献】
【特許文献】
【0003】
Jay Whang,Mauricio Delbracio,Hossein Talebi,Chitwan Saharia,Alexandros G. Dimakis,Peyman Milanfar,“Deblurring via Stochastic Refinement“,https://arxiv.org/abs/2112.02475
【発明の概要】
【発明が解決しようとする課題】
【0004】
本発明は、機械学習モデルを用いた画像処理において、偽構造の発生を抑制しつつ、高精度な画像処理方法を提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明の一側面としての画像処理方法は、生成モデルと非生成モデルを含む複数の機械学習モデルを用いて、入力画像から推定画像を生成する工程を有し、前記工程において前記入力画像に関する情報に基づいて前記入力画像の複数の領域ごとに前記生成モデルの出力と前記非生成モデルの出力とのウエイトを異ならせて前記推定画像を生成することを特徴とする。
【発明の効果】
【0006】
本発明によれば、機械学習モデルを用いた画像処理において、偽構造の発生を抑制しつつ、高精度な画像処理方法を提供することができる。
【図面の簡単な説明】
【0007】
各実施例のデフォーカス距離での点像強度分布を示す図である。
実施例1及び実施例4の画像処理システムのブロック図である。
実施例1及び実施例4の画像処理システムの外観図である。
実施例1乃至3の非生成モデルの訓練のフローチャートである。
実施例1乃至3の生成モデルの訓練のフローチャートである。
実施例1のモデル出力の生成を示すフローチャートである。
実施例1の撮像画像とデフォーカスマップを表す図である。
実施例1の撮像画像の領域分割を示す図である。
実施例1の非生成モデルの説明図である。
実施例1の生成モデルの説明図である。
実施例2の画像処理システムのブロック図である。
実施例2の画像処理システムの外観図である。
実施例2のモデル出力の生成を示すフローチャートである。
実施例2の撮像画像と合焦被写体情報の説明図である。
実施例2のデプスマップの説明図である。
実施例2の機械学習モデルの説明図である。
実施例3の画像処理システムのブロック図である。
実施例3の画像処理システムの外観図である。
実施例3の機械学習モデルの説明図である。
実施例3のモデル出力の生成を示すフローチャートである。
第1機械学習モデルの概念図である。
第1機械学習モデルのフローチャートである。
第2機械学習モデルの概念図である。
第2機械学習モデルのフローチャートである。
実施例4の画像処理の概念図である。
実施例4の画像処理のフローチャートである。
実施例5の画像処理システムブロック図である。
実施例6の画像処理の概念図である。
実施例6の画像処理のフローチャートである。
【発明を実施するための形態】
【0008】
以下、本発明の実施例について、図面を参照しながら詳細に説明する。各図において、同一の部材については同一の参照番号を付し、重複する説明は省略する。
【0009】
機械学習モデルには、ネットワーク構造や学習方法の違いにより、複数のモデルが存在する。例えば、様々な所望のデータを生成するための確率分布を学習により獲得し、推定時はその分布に基づいて出力するモデルを本実施例において生成モデルと呼ぶ。生成モデルは、生成データの分布と学習データの分布が一致するように学習(訓練)される。代表的な生成モデルとして、VAE(Variational auto encoder)、GAN(Generative Adversarial Networks)、フローベース生成モデル、自己回帰型生成モデル、及び拡散モデル等がある。各生成モデルについて説明する。
【0010】
VAEは、エンコーダ部とデコーダ部の2つの主要な部分から構成される。エンコーダは平均μと分散σの2つを出力し、その値から潜在変数Zをサンプリングする。潜在変数は、デコーダで潜在変数Zから元の次元に復元される。VAEでは、生成データと学習データの分布間の距離を明示的に測り最小化していく。分布間距離を最小化するようにモデルを学習するには、学習データにおいて対数尤度を最大化すればよい。しかし、複雑なニューラルネットワークでは、データに対して対数尤度を直接求めるのは困難である。そこで、VAEでは、計算容易である対数尤度の下限を最大化するようにモデルを学習することで目的のデータ分布を獲得する。このようにして学習したモデルを用いることで、目的のデータ分布に沿うデータを生成することができる。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

キヤノン株式会社
現像装置
6日前
キヤノン株式会社
電源装置
11日前
キヤノン株式会社
乳酸センサ
2日前
キヤノン株式会社
プログラム
12日前
キヤノン株式会社
レンズ装置
9日前
キヤノン株式会社
画像形成装置
10日前
キヤノン株式会社
画像形成装置
10日前
キヤノン株式会社
画像形成装置
4日前
キヤノン株式会社
画像形成装置
10日前
キヤノン株式会社
記録素子基板
11日前
キヤノン株式会社
画像形成装置
3日前
キヤノン株式会社
画像形成装置
3日前
キヤノン株式会社
電子写真装置
3日前
キヤノン株式会社
画像形成装置
10日前
キヤノン株式会社
液体収容容器
11日前
キヤノン株式会社
画像形成装置
6日前
キヤノン株式会社
画像形成装置
4日前
キヤノン株式会社
画像形成装置
3日前
キヤノン株式会社
画像形成装置
9日前
キヤノン株式会社
画像形成装置
6日前
キヤノン株式会社
画像形成装置
2日前
キヤノン株式会社
放射線撮像装置
11日前
キヤノン株式会社
光学装置及び撮像装置
5日前
キヤノン株式会社
半導体装置および機器
12日前
キヤノン株式会社
レンズ装置及び撮像装置
11日前
キヤノン株式会社
プログラム及び制御方法
12日前
キヤノン株式会社
固定装置、及び駆動装置
12日前
キヤノン株式会社
検出装置及び検出システム
10日前
キヤノン株式会社
電子機器及びその製造方法
9日前
キヤノン株式会社
記録装置、及び、記録方法
5日前
キヤノン株式会社
液体吐出ヘッド及び記録装置
9日前
キヤノン株式会社
ズームレンズおよび撮像装置
12日前
キヤノン株式会社
レンズ鏡筒、および撮像装置
6日前
キヤノン株式会社
定着用摺動部材及び定着装置
11日前
キヤノン株式会社
レンズ装置およびその制御方法
12日前
キヤノン株式会社
制御装置、制御方法、システム
2日前
続きを見る