TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024165300
公報種別
公開特許公報(A)
公開日
2024-11-28
出願番号
2023081386
出願日
2023-05-17
発明の名称
スパイキングニューラルネットワークの生成方法、画像認識装置、および計算機システム
出願人
株式会社日立製作所
代理人
藤央弁理士法人
主分類
G06N
3/049 20230101AFI20241121BHJP(計算;計数)
要約
【課題】DNN(ディープニューラルネットワーク)から認識精度が高いSNN(スパイキングニューラルネットワーク)を生成する。
【解決手段】処理装置は、連結された複数の畳み込み層を含むDNNを定義する第1定義情報と、最後の畳み込み層のニューロンの活性化率が満たすべき条件とを受け付け、少なくとも一つの畳み込み層の出力と、DNNへの入力とが合成されるように、DNNの構造を変更し、構造が変更されたDNNを用いて、前記条件を満たすように学習処理を実行し、学習されたDNNを変換してSNNを定義する第2定義情報を生成する。
【選択図】 図4
特許請求の範囲
【請求項1】
処理装置および前記処理装置に接続されるメモリを有する計算機が実行するスパイキングニューラルネットワークの生成方法であって、
前記処理装置が、連結された複数の畳み込み層を含む、ディープニューラルネットワークを定義する第1定義情報を受け付け、前記メモリに格納する第1のステップと、
前記処理装置が、最後の前記畳み込み層のニューロンの活性化率が満たすべき条件を受け付け、前記メモリに格納する第2のステップと、
前記処理装置が、少なくとも一つの前記畳み込み層の出力と、前記ディープニューラルネットワークへの入力とが合成されるように、前記ディープニューラルネットワークの構造を変更する第3のステップと、
前記処理装置が、構造が変更された前記ディープニューラルネットワークを用いて、前記条件を満たすように学習処理を実行する第4のステップと、
前記処理装置が、学習された前記ディープニューラルネットワークを変換して、スパイキングニューラルネットワークを定義する第2定義情報を生成し、前記メモリに格納する第5のステップと、
を含むことを特徴とするスパイキングニューラルネットワークの生成方法。
続きを表示(約 930 文字)
【請求項2】
請求項1に記載のスパイキングニューラルネットワークの生成方法であって、
前記第1定義情報によって定義される前記ディープニューラルネットワークは、最後の前記畳み込み層の出力を処理する全結合層を少なくとも一つ含み、
前記第3のステップは、前記処理装置が、最後の前記畳み込み層以外の少なくとも一つの前記畳み込み層の出力と、前記ディープニューラルネットワークへの入力とが合成され、かつ、最後の前記畳み込み層の出力と、前記ディープニューラルネットワークへの入力とが合成されるように、前記ディープニューラルネットワークの構造を変更するステップを含むことを特徴とするスパイキングニューラルネットワークの生成方法。
【請求項3】
請求項1に記載のスパイキングニューラルネットワークの生成方法であって、
前記第1定義情報によって定義される前記ディープニューラルネットワークは、最後の前記畳み込み層の出力を処理する全結合層を少なくとも一つ含み、
前記第3のステップは、前記処理装置が、最後の前記畳み込み層以外の少なくとも一つの前記畳み込み層の出力と、前記ディープニューラルネットワークへの入力とが合成されるように、前記ディープニューラルネットワークの構造を変更するステップを含むことを特徴とするスパイキングニューラルネットワークの生成方法。
【請求項4】
画像を格納する記憶装置および画像認識処理を実行する脳型デバイスを備える画像認識装置であって、
前記脳型デバイスは、前記画像に対して、請求項1に記載の前記スパイキングニューラルネットワークを用いた前記画像認識処理を実行することを特徴とする画像認識装置。
【請求項5】
計算機システムであって、
画像を取得し、前記画像を用いた画像認識処理を実行するエッジ装置と、
前記エッジ装置の画像認識処理の結果を取得する管理計算機と、を備え、
前記エッジ装置は、前記画像に対して、請求項1に記載のスパイキングニューラルネットワークを用いた前記画像認識処理を実行することを特徴とする計算機システム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、脳処理を模倣したスパイキングニューラルネットワークの生成方法に関する。
続きを表示(約 2,500 文字)
【背景技術】
【0002】
近年、画像認識および音声認識を始めとする様々なアプリケーションにおいて、AIとりわけ深層学習の活用が進展し、映像監視およびチャットボット等において社会実装が進んでいる。深層学習の適用例として映像監視、例えば、駅、空港、通り等の公共の場での不審者および不明者等、特定の人物の発見および追跡、作業現場における作業者の特定の行動、例えば危険な行動の発見等の例がある。
【0003】
画像の学習/推論には、複雑な画像の認識精度を向上できるという点から、畳み込みニューラルネットワーク(CNN)の一種であるVGGnet(例えば、非特許文献1を参照)およびResNet(Residual Network)(例えば、非特許文献2を参照)が用いられる。画像に映っている識別対象物の種類が数十以上と多い場合に高い識別精度を得るため、これらのニューラルネットワークは畳み込み層を数十から100層以上連結して構成される。これらのCNNを用いて画像認識を行う場合、計算処理負荷が大きいためGPU(Graphics Processing Unit)サーバで処理を行う必要があり消費電力が大きいという課題がある。
【0004】
消費電力を削減するため、CNNを、脳処理を模倣するスパイキングニューラルネットワーク(SNN)に変換し、消費電力の低い脳型デバイスで推論を行う手法が研究されている(例えば、非特許文献3を参照)。
【先行技術文献】
【非特許文献】
【0005】
“Very deep convolutional networks for large-scale image recognition”, K. Simonyan and A. Zisserman, in ICLR, 2015.
”Deep Residual Learning for Image Recognition”, Kaiming He, et. Al., CVPR, 2016, Volume 1, pp 770-78
”Benchmarking Keyword Spotting Efficiency on Neuromorphic Hardware”, P. Blouw, et al., in NICE '19, March 2019.
【発明の概要】
【発明が解決しようとする課題】
【0006】
CNNをSNNに変換する方法は、画像認識などアプリケーションで実績のあるCNNを活用できるという点でメリットがあり、主要なSNN構築方法である。アプリケーションで実績のある従来技術のCNNは、ネットワークの畳み込み層の数が数十から100層以上と多い。しかし、畳み込み層数の多いCNNをSNNに変換すると、SNNでの認識精度はCNNの認識精度に対し大きく劣化するという課題がある。認識精度が劣化する理由は、CNNを構成する畳み込み層で入力が減衰するためである。多数の畳み込み層を重ねると各畳み込み層での入力の減衰によって、最終段では元の画像(入力)の情報が失われてしまうため、認識精度が劣化する。このように多層のCNNを変換したSNNでは認識精度が劣化するため、アプリケーションにおいて実績のある多層のCNNをSNNで活用できなかった。
【0007】
そこで、本発明の目的は、多層のCNNをSNNに変換する場合に、CNNの認識精度に対して認識精度が劣化しないSNNを生成することである。
【課題を解決するための手段】
【0008】
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、処理装置および前記処理装置に接続されるメモリを有する計算機が実行するスパイキングニューラルネットワークの生成方法であって、前記処理装置が、連結された複数の畳み込み層を含む、ディープニューラルネットワークを定義する第1定義情報を受け付け、前記メモリに格納する第1のステップと、前記処理装置が、最後の前記畳み込み層のニューロンの活性化率が満たすべき条件を受け付け、前記メモリに格納する第2のステップと、前記処理装置が、少なくとも一つの前記畳み込み層の出力と、前記ディープニューラルネットワークへの入力とが合成されるように、前記ディープニューラルネットワークの構造を変更する第3のステップと、前記処理装置が、構造が変更された前記ディープニューラルネットワークを用いて、前記条件を満たすように学習処理を実行する第4のステップと、前記処理装置が、学習された前記ディープニューラルネットワークを変換して、スパイキングニューラルネットワークを定義する第2定義情報を生成し、前記メモリに格納する第5のステップと、を含む。
【発明の効果】
【0009】
本発明によれば、認識精度の劣化を抑えたSNNを生成できる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
【図面の簡単な説明】
【0010】
実施例1のSNNの構造の特徴を示す図である。
実施例1のSNNの構造の一例を示す図である。
実施例1のSNNの構造の一例を示す図である。
実施例1のSNNの生成方法の一例を説明するフローチャートである。
実施例1の脳型計算機の一例を示す図である。
実施例1のSNNを実装した脳型計算機の活用の一例を示す図である。
実施例1のSNNを実装した脳型計算機が実行する画像認識処理の一例を説明するフローチャートである。
実施例1の監視カメラシステムの一例を示す図である。
実施例1の監視カメラシステムの別例を示す図である。
【発明を実施するための形態】
【実施例】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
他の特許を見る