TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2024126912
公報種別
公開特許公報(A)
公開日
2024-09-20
出願番号
2023035664
出願日
2023-03-08
発明の名称
画像処理装置、画像処理方法、及びプログラム
出願人
日本電気株式会社
代理人
弁理士法人ブライタス
主分類
G06V
10/82 20220101AFI20240912BHJP(計算;計数)
要約
【課題】 ニューラルネットワークの計算量を削減することにある。
【解決手段】 画像処理装置は、第一のフレーム画像と第二のフレーム画像との差分、又は、第一のフレーム画像を処理する第一の畳み込みニューラルネットワークの第一層目の畳み込み層から出力された第一の出力特徴マップと第二のフレーム画像を処理する第二の畳み込みニューラルネットワークの第一層目の畳み込み層から出力された第二の出力特徴マップとの差分、に基づいて第一のマスクを生成する第一のマスク生成部と、第一のマスクと、第二の畳み込みニューラルネットワークの畳み込み層で利用する解像度それぞれとに基づいて、解像度ごとに第二のマスクを生成する第二のマスク生成部と、第二のマスクを、第二の畳み込みニューラルネットワークの畳み込み層で利用する解像度に基づいて、第二の畳み込みニューラルネットワークの畳み込み層に分配する第二のマスク分配部と、を有する。
【選択図】図1
特許請求の範囲
【請求項1】
第一のフレーム画像と第二のフレーム画像との差分、又は、前記第一のフレーム画像を処理する第一の畳み込みニューラルネットワークの第一層目の畳み込み層から出力された第一の出力特徴マップと前記第二のフレーム画像を処理する第二の畳み込みニューラルネットワークの第一層目の畳み込み層から出力された第二の出力特徴マップとの差分、に基づいて第一のマスクを生成する第一のマスク生成手段と、
前記第一のマスクと、前記第二の畳み込みニューラルネットワークの畳み込み層で利用する解像度それぞれとに基づいて、前記解像度ごとに第二のマスクを生成する第二のマスク生成手段と、
前記第二のマスクを、前記第二の畳み込みニューラルネットワークの畳み込み層で利用する前記解像度に基づいて、前記第二の畳み込みニューラルネットワークの畳み込み層に分配する第二のマスク分配手段と、
を有する画像処理装置。
続きを表示(約 1,400 文字)
【請求項2】
前記第二のマスク生成手段は、前記第一のマスクに対してプーリング処理を実行し、前記第二のマスクを生成する、
請求項1に記載の画像処理装置。
【請求項3】
前記第二のマスク生成手段は、前記畳み込み層の解像度が変化するごとに、変化した解像度に基づいて前記第二のマスクを生成する、
請求項1に記載の画像処理装置。
【請求項4】
さらに、前記第一のフレーム画像と前記第二のフレーム画像、又は、前記第一の出力特徴マップと前記第二の出力特徴マップに対して、ぼかし処理を実行して、ノイズ除去をする前処理部手段を有する、
請求項1に記載の画像処理装置。
【請求項5】
コンピュータが、
第一のフレーム画像と第二のフレーム画像との差分、又は、前記第一のフレーム画像を処理する第一の畳み込みニューラルネットワークの第一層目の畳み込み層から出力された第一の出力特徴マップと前記第二のフレーム画像を処理する第二の畳み込みニューラルネットワークの第一層目の畳み込み層から出力された第二の出力特徴マップとの差分、に基づいて第一のマスクを生成する第一のマスク生成ステップと、
前記第一のマスクと、前記第二の畳み込みニューラルネットワークの畳み込み層で利用する解像度それぞれとに基づいて、前記解像度ごとに第二のマスクを生成する第二のマスク生成ステップと、
前記第二のマスクを、前記第二の畳み込みニューラルネットワークの畳み込み層で利用する前記解像度に基づいて、前記第二の畳み込みニューラルネットワークの畳み込み層に分配する第二のマスク分配ステップと、
を実行する画像処理方法。
【請求項6】
コンピュータに、
第一のフレーム画像と第二のフレーム画像との差分、又は、前記第一のフレーム画像を処理する第一の畳み込みニューラルネットワークの第一層目の畳み込み層から出力された第一の出力特徴マップと前記第二のフレーム画像を処理する第二の畳み込みニューラルネットワークの第一層目の畳み込み層から出力された第二の出力特徴マップとの差分、に基づいて第一のマスクを生成する第一のマスク生成ステップと、
前記第一のマスクと、前記第二の畳み込みニューラルネットワークの畳み込み層で利用する解像度それぞれとに基づいて、前記解像度ごとに第二のマスクを生成する第二のマスク生成ステップと、
前記第二のマスクを、前記第二の畳み込みニューラルネットワークの畳み込み層で利用する前記解像度に基づいて、前記第二の畳み込みニューラルネットワークの畳み込み層に分配する第二のマスク分配ステップと、
を実行させるプログラム。
【請求項7】
前記第二のマスク生成ステップは、前記第一のマスクに対してプーリング処理を実行し、前記第二のマスクを生成する、
請求項6に記載のプログラム。
【請求項8】
前記第二のマスク生成ステップは、前記畳み込み層の解像度が変化するごとに、変化した解像度に基づいて前記第二のマスクを生成する、
請求項6に記載のプログラム。
【請求項9】
前記コンピュータに、
さらに、前記第一のフレーム画像と前記第二のフレーム画像、又は、前記第一の出力特徴マップと前記第二の出力特徴マップに対して、ぼかし処理を実行して、ノイズ除去をする前処理ステップを実行させる、
請求項6に記載のプログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、ニューラルネットワークを用いた画像処理装置、画像処理方法、及びプログラムに関する。
続きを表示(約 2,800 文字)
【背景技術】
【0002】
動画から対象物の行動を認識するモデルには、例えば、物体認識、姿勢推定などの処理をするためにニューラルネットワーク(NN:Neural Network)が利用されている。ところがニューラルネットワークは膨大な計算を必要とするので、フレーム画像ごとに物体認識、姿勢推定などの処理を実行するのは非効率である。
【0003】
そこで、ニューラルネットワークの計算量を削減する方法として、スパースニューラルネットワーク(Sparse Neural Networks)が提案されている。スパースニューラルネットワークでは、連続する二つのフレーム間の差分(差のある領域:重要領域)のみを対象として計算することで、畳み込み層の計算量を削減する。具体的には、スパースニューラルネットワークでは、畳み込み層において計算をするたびに、重要領域以外の領域(フレーム間に差がない領域:非重要領域)を隠すためのマスクを生成し、生成したマスクを用いて重要領域のみの計算をすることで計算量を削減している。
【0004】
関連する技術して非特許文献1、2には、差分を利用したアクティベーションスパースニューラルネットワークが開示されている。非特許文献1には、入力特徴マップにマスクをするDeltaCNN(Convolutional Neural Networks)が開示されている。また、非特許文献2には、出力特徴マップにマスクをするSkip―Convolutionsが開示されている。
【先行技術文献】
【非特許文献】
【0005】
Mathias Parger, Chengcheng Tang, Christopher D. Twigg, Cem Keskin, Robert Wang, Markus Steinberger, “DeltaCNN: End-to-End CNN Inference of Sparse Frame Differences in Videos”, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022, [online], Submitted on 8 Mar 2022, arXiv Computer Science > Computer Vision and Pattern Recognition, [2023年02月06日検索], インターネット<URL:https://arxiv.org/abs/2203.03996>
Amirhossein Habibian Davide Abati Taco S. Cohen Babak Ehteshami Bejnordi, “Skip-Convolutions for Efficient Video Processing”, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2021, [online], Submitted on 23 Apr 2021, arXiv Computer Science > Computer Vision and Pattern Recognition, [2023年02月06日検索], インターネット<URL:https://arxiv.org/abs/2104.11487>
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上述した技術では、畳み込み層ごとにマスクを生成するので、マスクの生成によるオーバーヘッドが生じる。すなわちマスクを再生成する場合、差分処理、閾値処理などを実行するので、実行速度が低下する。また、マスクを再生成するたびに、インデックス計算などが必要となる。さらに、畳み込み層ごとにマスクが異なるので、重要領域を集め直す処理が必要になる。
【0007】
また、非特許文献1のDeltaCNNでは、層を重ねるごとに重要領域の影響が拡大するので、畳み込み処理の後に重要領域の再生成が必要となる。また、非特許文献2のSkip―Convolutionsでは、重要領域が単調増加しないが、マスクを再生成するので、オーバーヘッドが生じる。
【0008】
本開示の目的の一例は、ニューラルネットワークの計算量を削減することにある。
【課題を解決するための手段】
【0009】
上記目的を達成するため、本開示の一側面における画像処理装置は、
第一のフレーム画像と第二のフレーム画像との差分、又は、前記第一のフレーム画像を処理する第一の畳み込みニューラルネットワークの第一層目の畳み込み層から出力された第一の出力特徴マップと前記第二のフレーム画像を処理する第二の畳み込みニューラルネットワークの第一層目の畳み込み層から出力された第二の出力特徴マップとの差分、に基づいて第一のマスクを生成する第一のマスク生成部と、
前記第一のマスクと、前記第二の畳み込みニューラルネットワークの畳み込み層で利用する解像度それぞれとに基づいて、前記解像度ごとに第二のマスクを生成する第二のマスク生成部と、
前記第二のマスクを、前記第二の畳み込みニューラルネットワークの畳み込み層で利用する前記解像度に基づいて、前記第二の畳み込みニューラルネットワークの畳み込み層に分配する第二のマスク分配部と、
を有することを特徴とする。
【0010】
また、上記目的を達成するため、本開示の一側面における画像処理方法は、
コンピュータが、
第一のフレーム画像と第二のフレーム画像との差分、又は、前記第一のフレーム画像を処理する第一の畳み込みニューラルネットワークの第一層目の畳み込み層から出力された第一の出力特徴マップと前記第二のフレーム画像を処理する第二の畳み込みニューラルネットワークの第一層目の畳み込み層から出力された第二の出力特徴マップとの差分、に基づいて第一のマスクを生成し、
前記第一のマスクと、前記第二の畳み込みニューラルネットワークの畳み込み層で利用する解像度それぞれとに基づいて、前記解像度ごとに第二のマスクを生成し、
前記第二のマスクを、前記第二の畳み込みニューラルネットワークの畳み込み層で利用する前記解像度に基づいて、前記第二の畳み込みニューラルネットワークの畳み込み層に分配する、
ことを特徴とする。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
日本電気株式会社
情報処理方法および装置
4日前
日本電気株式会社
情報処理方法および装置
4日前
日本電気株式会社
素子、ボロメータ及び素子製造方法
18日前
日本電気株式会社
ボロメータ、及びボロメータ製造方法
4日前
日本電気株式会社
RF測定器、補正方法、及びプログラム
25日前
日本電気株式会社
試着室システム、試着方法、プログラム
27日前
日本電気株式会社
監視システム、監視装置、及び監視方法
5日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
12日前
日本電気株式会社
救急支援装置、救急支援方法、及びプログラム
5日前
日本電気株式会社
受付支援装置、受付支援方法、及びプログラム
19日前
日本電気株式会社
動画処理の方法、装置、電子デバイス及び媒体
20日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
12日前
日本電気株式会社
移行システム、移行方法、及び移行プログラム
4日前
日本電気株式会社
情報取得装置、情報取得方法、及びプログラム
18日前
日本電気株式会社
処理装置、処理方法、プログラム、および認証装置
28日前
日本電気株式会社
考査支援装置、考査支援方法及び考査支援プログラム
1か月前
日本電気株式会社
制御装置、制御方法、及び、コンピュータプログラム
18日前
日本電気株式会社
処理装置、処理システム、処理方法、及びプログラム
4日前
日本電気株式会社
処理装置、処理システム、処理方法、及びプログラム
4日前
日本電気株式会社
波長可変光源装置、光トランシーバ及び波長制御方法
1か月前
日本電気株式会社
映像伝送システム、映像伝送装置、及び映像伝送方法
1か月前
日本電気株式会社
制御装置、制御方法、プログラム、及び、通信システム
19日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム、及びシステム
26日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム、及びシステム
28日前
日本電気株式会社
旅行計画提案装置、旅行計画提案方法、およびプログラム
19日前
日本電気株式会社
運航管理装置、運航管理方法およびコンピュータプログラム
28日前
日本電気株式会社
監視システム、分析装置の制御方法、及び、制御プログラム
12日前
日本電気株式会社
運航支援装置、運航支援方法およびコンピュータプログラム
28日前
日本電気株式会社
サーバ装置、システム、サーバ装置の制御方法及びプログラム
14日前
日本電気株式会社
配置及び収納システム、配置及び収納方法、並びにプログラム
5日前
日本電気株式会社
着座率向上装置、着座率向上方法および着座率向上プログラム
19日前
日本電気株式会社
通信システム
20日前
日本電気株式会社
サーバ装置、システム、サーバ装置の制御方法及びプログラム
27日前
日本電気株式会社
情報処理装置、情報処理システム、情報処理方法及びプログラム
18日前
日本電気株式会社
混雑状況予測装置
12日前
日本電気株式会社
食品管理装置、食品管理システム、食品管理方法、およびプログラム
4日前
続きを見る
他の特許を見る