TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025043933
公報種別
公開特許公報(A)
公開日
2025-04-01
出願番号
2023151542
出願日
2023-09-19
発明の名称
画像処理装置、画像処理方法、コンピュータプログラム
出願人
キヤノン株式会社
代理人
弁理士法人大塚国際特許事務所
主分類
G06T
7/00 20170101AFI20250325BHJP(計算;計数)
要約
【課題】 より少ない処理ソースでもって、画像における境界領域の検出性能を向上させるための技術を提供すること。
【解決手段】 学習画像を入力した学習モデルの演算結果と、該学習画像に対応する教師画像と、の誤差を求める誤差演算を行い、該誤差に基づいて該学習モデルの学習を行う。該教師画像における物体の境界領域に対応する誤差を他の領域より大きくして該誤差演算を行う。
【選択図】 図2
特許請求の範囲
【請求項1】
学習画像を入力した学習モデルの演算結果と、該学習画像に対応する教師画像と、の誤差を求める誤差演算を行う演算手段と、
前記誤差に基づいて前記学習モデルの学習を行う学習手段と
を備え、
前記演算手段は、前記教師画像における物体の境界領域に対応する誤差を他の領域より大きくして前記誤差演算を行う
ことを特徴とする画像処理装置。
続きを表示(約 1,100 文字)
【請求項2】
前記演算手段は、前記演算結果と前記教師画像との画素ごとの誤差を重み付けした総和を前記演算結果と前記教師画像との誤差として求め、前記教師画像において境界領域に属する画素と前記演算結果における対応画素との誤差に対する重みは、前記教師画像において境界領域に属していない画素と前記演算結果における対応画素との誤差に対する重みよりも大きいことを特徴とする請求項1に記載の画像処理装置。
【請求項3】
前記演算手段は、前記教師画像において境界領域に属する画素と前記演算結果における対応画素との誤差に対する重みとして、前記教師画像における境界領域と非境界領域の面積比に応じた値を設定することを特徴とする請求項2に記載の画像処理装置。
【請求項4】
前記学習手段は、前記演算結果と前記教師画像との誤差をより小さくするように前記学習モデルのパラメータを更新することで該学習モデルの学習を行うことを特徴とする請求項1に記載の画像処理装置。
【請求項5】
前記教師画像における境界領域は、割り当てられたラベルが異なる領域間の境界線の領域であることを特徴とする請求項1に記載の画像処理装置。
【請求項6】
前記教師画像における境界領域は、割り当てられたラベルが異なる領域間の境界線および該境界線の周辺領域を含む領域であることを特徴とする請求項1に記載の画像処理装置。
【請求項7】
前記学習手段は、前記境界領域の幅を動的に変更することを特徴とする請求項1に記載の画像処理装置。
【請求項8】
前記演算手段は、前記教師画像を二値化した二値化教師画像における境界領域に対応する誤差を強調して前記誤差演算を行うことを特徴とする請求項1に記載の画像処理装置。
【請求項9】
画像を入力する入力手段と、
画像に含まれる物体の境界領域に対応する誤差を他の領域より大きくして学習された学習モデルのパラメータを用いて、前記入力された画像から前記物体を検出する検出手段と、
を備えることを特徴とする画像処理装置。
【請求項10】
画像処理装置が行う画像処理方法であって、
前記画像処理装置の演算手段が、学習画像を入力した学習モデルの演算結果と、該学習画像に対応する教師画像と、の誤差を求める誤差演算を行う演算工程と、
前記画像処理装置の学習手段が、前記誤差に基づいて前記学習モデルの学習を行う学習工程と
を備え、
前記演算工程では、前記教師画像における物体の境界領域に対応する誤差を他の領域より大きくして前記誤差演算を行う
ことを特徴とする画像処理方法。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明は、学習モデルの学習技術に関する。
続きを表示(約 1,900 文字)
【背景技術】
【0002】
コンピュータ等の機械が画像や音声などのデータの内容を学習して認識を行う技術が存在する。認識処理の目的を、ここでは認識タスクと呼び、認識タスクを学習・実行するための数理モデルを認識モデルと呼ぶ。
【0003】
認識タスクには、例えば、画像中から特定の物体(顔、瞳、頭部、動物、乗物等)を検出する物体検出タスクがある。また、認識タスクには、意味的領域分割と呼ばれる画像の画素単位での物体検出を行う領域検出タスクが存在する。他にも、画像中にある物体(被写体)のカテゴリ(人間、動物、乗り物等)を判別する物体カテゴリ認識タスクや、特定の被写体を探索して追尾する追尾タスク、シーンの種別(都市、山間、海岸等)を判別するシーン種別認識タスク等の多様な認識タスクがある。以下、認識タスクをタスクと呼ぶ場合がある。
【0004】
上記のようなタスクを学習・実行する技術としては、ニューラルネットワークが知られている。特に、深い(層の数が多い)多層ニューラルネットワークは、ディープニューラルネットワーク(DNN)とも称される。DNNは、Deep Neural Networkの略である。特に、深い畳み込みニューラルネットワークは、ディープコンボリューショナルニューラルネットワーク(DCNN)と称される。DCNNは、Deep Convolutional Neural Networkの略である。DCNNは性能(認識精度、認識性能)が高いことで近年注目されている。
【先行技術文献】
【特許文献】
【0005】
特許第6872502号
【非特許文献】
【0006】
Yin,H.(2021)“Improved semantic segmentation method using edge features for winter wheat spatial distribution extraction from Gaofen-2 images”
【発明の概要】
【発明が解決しようとする課題】
【0007】
例えば、画像内の人物の肌の領域を検出するタスクである人物肌領域検出タスクにおいて、眼や口の輪郭、あるいは、髪の生え際などの、肌と非肌の境界領域の検出性能が上がらない場合がある。これは、肌らしい肌あるいは明らかに肌ではない領域と比較して、肌と非肌の境界に相当する領域が学習データ内で占める割合が低いことなどに起因する。推論した人物肌領域情報を、画像内の人物肌の色味を補正することに利用する場合、上記のように境界領域の検出性能が不十分であることは問題となる。誤って眼や髪を肌領域と誤検出すれば、眼や髪も色味補正演算の対象領域となり、本来の肌領域が誤った色へと補正される可能性があるからである。この問題は、顔の面積が小さい場合など、画像内に占める境界領域の割合が非境界領域よりも多いほど、深刻な問題となる。
【0008】
また、画像内の人物顔の中心点を検出する物体検出タスクにおいて、人物顔の中心だけでなく、その周辺領域に対しても高スコアで誤検出をする場合がある。人物顔の中心位置を顔の器官点検出などに利用する場合、上記のように検出結果が正解定義領域よりも大きな領域に広がれば、中心位置の推定に誤差を生じさせ、後段の顔器官点検出に影響を及ぼす。
【0009】
したがって、認識タスクにおいて、正解定義領域と非正解定義領域の境界領域における検出性能を向上させることが重要である。特許文献1や非特許文献1に開示されている手法は、領域検出タスクにおいて、境界領域の検出性能を向上させる手法である。しかし、原画像のエッジ情報を抽出する専用のニューラルネットワークが必要であり、ニューラルネットワークのモデルパラメータ量が増大する、という課題がある。本発明は、より少ない処理ソースでもって、画像における境界領域の検出性能を向上させるための技術を提供する。
【課題を解決するための手段】
【0010】
本発明の一様態は、学習画像を入力した学習モデルの演算結果と、該学習画像に対応する教師画像と、の誤差を求める誤差演算を行う演算手段と、前記誤差に基づいて前記学習モデルの学習を行う学習手段とを備え、前記演算手段は、前記教師画像における物体の境界領域に対応する誤差を他の領域より大きくして前記誤差演算を行うことを特徴とする。
【発明の効果】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
HMS株式会社
マーカ設置方法
3日前
株式会社半導体エネルギー研究所
操作装置
2日前
日清食品ホールディングス株式会社
システム
3日前
ENEOS株式会社
情報処理システム
2日前
株式会社半導体エネルギー研究所
半導体装置
3日前
株式会社半導体エネルギー研究所
検索システム
3日前
株式会社半導体エネルギー研究所
タッチパネル
3日前
株式会社半導体エネルギー研究所
液晶表示装置
3日前
株式会社半導体エネルギー研究所
情報処理装置
3日前
株式会社ユピテル
システムおよびプログラム等
3日前
株式会社ワコム
集積回路
3日前
株式会社半導体エネルギー研究所
携帯情報端末機器
3日前
株式会社三菱総合研究所
仮想通貨システム
2日前
株式会社ニコン
情報処理装置
2日前
株式会社エイシング
汎用学習済モデルの生成方法
3日前
東京海上日動火災保険株式会社
情報処理装置、情報処理方法、及びプログラム
2日前
日本電気株式会社
端末、端末の制御方法及びプログラム
3日前
ブラザー工業株式会社
サポートプログラムおよび印刷システム
3日前
株式会社MIXI
情報処理装置、情報処理方法、及びプログラム
2日前
株式会社エフェクチュアル
集計装置及びプログラム
2日前
株式会社ユピテル
装置及びプログラム等
3日前
株式会社STUDIO55
画像生成装置及びプログラム
2日前
株式会社ワイティーエム
駐車場管理システムおよびプログラム
3日前
旭精工株式会社
自動動作機器管理装置および自動動作機器管理システム
2日前
日清食品ホールディングス株式会社
デリバリーにおける麺類の提供方法
3日前
株式会社パークランド
貸出し車両管理システムおよびプログラム
2日前
国立研究開発法人科学技術振興機構
電子回路
3日前
キヤノン電子株式会社
情報処理システム
3日前
パイオニア株式会社
制御装置、制御方法、プログラム及び記憶媒体
2日前
個人
電子商取引システム、方法及びプログラム
3日前
株式会社ゆめいど
情報処理システム、情報処理サーバ及び情報処理方法
2日前
日本電気株式会社
売価管理装置、制御方法及びプログラム
2日前
エンゼルグループ株式会社
ケージシステム及びチップ管理システム
3日前
Miletos株式会社
経費検査装置、経費検査方法、およびプログラム
3日前
株式会社リコー
プログラム、操作端末、方法及びシステム
3日前
Miletos株式会社
情報処理装置、情報処理方法、およびプログラム
3日前
続きを見る
他の特許を見る