TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024041325
公報種別公開特許公報(A)
公開日2024-03-27
出願番号2022146070
出願日2022-09-14
発明の名称演算装置
出願人株式会社日立製作所
代理人青稜弁理士法人
主分類G06F 9/50 20060101AFI20240319BHJP(計算;計数)
要約【課題】好適にDNN(Deep Neural Network:深層学習)の演算を行うことができる、演算装置を提供すること。
【解決手段】演算領域を有する演算デバイスを少なくとも1つ備え、入力情報を取得すると、入力情報から複数の入力の特徴マップを生成し、生成した複数の入力の特徴に対して、チャンネル分割を含む少なくとも1つのDNNの分割方式で、DNNの演算を並列で行い、チャンネル分割は、特徴マップを分割することなく、特徴マップをまとめた組に分けて、分けた特徴マップをまとめた組それぞれを、演算領域それぞれに割り当てて、層の演算を行う。
【選択図】図3
特許請求の範囲【請求項1】
演算を行う少なくとも1つの演算領域を有する演算デバイスを少なくとも1つ備え、DNN(Deep Neural Network:深層学習)の演算を、前記演算デバイスを用いて行う演算装置であって、
前記演算デバイスは、中間メモリ領域を有し、
前記演算装置は、
複数の前記演算領域と、
入力情報を取得すると、前記入力情報から複数の入力の特徴マップを生成し、生成した前記複数の入力の特徴マップを、前記演算デバイスのうちで演算に使用する演算デバイスに送信し、前記複数の前記演算領域を用いて、前記複数の入力の特徴マップに対する前記DNNの演算を並列で行うDNN演算実行部と、を備え、
前記DNN演算実行部は、少なくとも1つのDNNの分割方式で、前記複数の入力の特徴マップに対する前記DNNの演算を並列で行い、
前記DNNの演算を並列で行う際の前記DNNの分割方式には、
前記DNNの演算の過程で、層の演算に用いる複数の特徴マップそれぞれを分割することなく、前記層の演算に用いる複数の特徴マップを、特徴マップをまとめた組に分けて、分けた前記特徴マップをまとめた組それぞれに対して前記層の演算を行う、チャンネル分割を少なくとも含み、
少なくともチャンネル分割を行う際には、少なくとも1つの前記演算領域が有する前記中間メモリ領域に少なくとも他の1つの前記演算領域が有する特徴マップもしくは特徴マップに演算を行った結果を格納して演算を行う、
演算装置。
続きを表示(約 2,000 文字)【請求項2】
請求項1に記載の演算装置であって、
前記DNN演算実行部は、前記複数の演算デバイスのうちで演算に使用する複数の演算デバイスそれぞれが生成した、畳み込みマップを、前記畳み込みマップを集約する演算デバイスの前記中間メモリ領域に格納させ、前記畳み込みマップを集約する演算デバイスに、前記中間メモリ領域に格納させたすべての畳み込みマップの各要素の和を取って、出力の特徴マップを生成させる、
演算装置。
【請求項3】
請求項2に記載の演算装置であって、
前記演算デバイスは、前記演算領域の数の前記中間メモリ領域を有する、
演算装置。
【請求項4】
請求項1に記載の演算装置であって、
前記DNN演算実行部は、前記複数の演算デバイスのうちで演算に使用する複数の演算デバイスそれぞれに、生成した畳み込みマップの和をとった部分和マップを生成させ、前記部分和マップを集約する演算デバイスの中間メモリ領域に、部分和マップを格納させ、
さらに、前記部分和マップを集約する演算デバイスに、前記中間メモリ領域に格納させたすべての部分和マップの和をとって、出力の特徴マップを生成させる、
演算装置。
【請求項5】
請求項4に記載の演算装置であって、
前記演算デバイスは、前記演算領域の数の前記中間メモリ領域を有する、
演算装置。
【請求項6】
演算を行う少なくとも1つの演算領域を有する演算デバイスを少なくとも1つ備え、DNN(Deep Neural Network:深層学習)の演算を、前記演算デバイスを用いて行う演算装置であって、
前記演算装置は、
複数の前記演算領域と、
入力情報を取得すると、前記入力情報から複数の入力の特徴マップを生成し、生成した前記複数の入力の特徴マップを、前記演算デバイスのうちで演算に使用する演算デバイスに送信し、前記複数の前記演算領域を用いて、前記複数の入力の特徴マップに対する前記DNNの演算を並列で行うDNN演算実行部と、を備え、
前記DNN演算実行部は、前記DNNの演算の過程で、
特徴マップを面内で複数に分割し、分割した特徴マップそれぞれを、前記複数の前記演算領域それぞれに割り当てて、層の演算を行う空間分割と、
層の演算に用いる複数の特徴マップそれぞれを分割することなく、前記層の演算に用いる複数の特徴マップを、特徴マップをまとめた組に分けて、分けた前記特徴マップをまとめた組それぞれを、前記複数の前記演算領域のうちで演算に使用する演算領域それぞれに割り当てて、前記層の演算を行うチャンネル分割と、の分割方式を切り替える、
演算装置。
【請求項7】
請求項6に記載の演算装置であって、
前記複数の演算デバイスそれぞれは、さらに演算に使用する演算用メモリ領域を有し、
前記DNN演算実行部は、前記複数の演算デバイスの処理速度と、前記複数の演算デバイスのうちの前記演算デバイスの数と、前記演算領域の数と、前記複数の演算デバイスの演算メモリの容量と、の少なくとも1つに基づいて、前記DNNの演算の有する前記層から選択された層の前で分割方式を前記空間分割から前記チャンネル分割に切り替える、
演算装置。
【請求項8】
請求項6に記載の演算装置であって、
さらに、前記演算デバイスは、中間メモリ領域を有し、
前記DNN演算実行部は、前記複数の演算デバイスのうちで演算に使用する複数の演算デバイスそれぞれが生成した、畳み込みマップを、前記畳み込みマップを集約する演算デバイスの中間メモリ領域に格納させ、前記畳み込みマップを集約する演算デバイスに、前記中間メモリ領域に格納させたすべての畳み込みマップの各要素の和を取って、出力の特徴マップを生成させる、
演算装置。
【請求項9】
請求項8に記載の演算装置であって、
前記演算デバイスは、前記演算領域の数の前記中間メモリ領域を有する、
演算装置。
【請求項10】
請求項6に記載の演算装置であって、
前記DNN演算実行部は、前記複数の演算デバイスのうちで演算に使用する複数の演算デバイスそれぞれに、生成した畳み込みマップの和をとった部分和マップを生成させ、前記部分和マップを集約する演算デバイスの中間メモリ領域に、部分和マップを格納させ、
さらに、前記部分和マップを集約する演算デバイスに、前記中間メモリ領域に格納させたすべての部分和マップの和をとって、出力の特徴マップを生成させる、
演算装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、DNN(Deep Neural Network:深層学習)の演算を行う演算装置に関する。
続きを表示(約 2,800 文字)【背景技術】
【0002】
労働人口や熟練作業者の減少が進んでいるため、物流分野や生産分野において、ロボットやAGV(Automatic Guided Vehicle)にAI(Artificial Intelligence)を用いて、様々な業務を自動化することが促進されている。
【0003】
この様な自動化では、ロボットやAGVが搭載可能なエッジデバイスにより高精度な画像認識AIを動作させることが重要である。ここで、ロボットやAGVは迅速に動くこと可能なことが必須であり、そのために、ロボットやAGVに搭載するAIを高速に演算できることが求められる。
【0004】
高精度な画像認識AIとしてはDNN(Deep Neural Network:深層学習)が知られている。DNNでは、画像から生成した特徴マップに対して畳み込み演算等を繰り返して画像を解析する。この演算の単位を層とよび、層によって演算に用いる特徴マップのサイズや枚数(チャンネル数)が変化する。一般にDNNでは、演算のネットワークの前半では図1Aに例を示す特徴マップ1-1、1-2、1-3の様に、特徴マップはサイズが大きく、チャンネル数は少ない。一方、演算のネットワークの後半では、図1Bに例を示す、特徴マップ2-1、2-2、・・・、2-12の様に、特徴マップはサイズが小さく、チャンネル数は多い。
【0005】
高精度な画像解析には大規模なDNNが必要となる。一般的に、大規模なDNNでは、特徴マップのサイズが大きく、チャンネルの数は多い。これに対して、特に処理能力やメモリ量に制限のあるエッジデバイスで高精度な画像解析を行うために、特徴マップを複数の領域に分割して、それぞれの領域に個別のデバイスを割り当てる方式である分割DNNが知られている。例えば、非特許文献1には、この分割DNNにおいて、主に入力層近くの特徴マップサイズの大きさに注目して、図2Aに示す様な、2次元データである特徴マップそれぞれの面内を複数に分割する方式である空間分割を用いる技術が記載されている。ここで図2Aには、空間分割の例として、特徴マップ1-1、1-2、1-3それぞれを4つの領域に分割して、それぞれの領域を合計4つのエッジデバイス1、2、3、4に割り当てる場合を示している。
【先行技術文献】
【非特許文献】
【0006】
Li Zhou, Hao Wen, Radu Teodorescu and David H.C. Du, et al., "Distributing Deep Neural Networks with Containerized Partitions at the Edge",2nd USENIX Workshop on Hot Topics in Edge Computing, HotEdge(2019). https://www.usenix.org/system/files/hotedge19-paper-zhou.pdf
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかし、図1Bに示す様にDNN演算のネットワークの後半では特徴マップのサイズは縮小する。このため、空間分割では、DNN演算のネットワークの後半で演算効率が低下してしまうという問題がある。また、大規模なDNNの演算には大きなメモリ量が必要という問題がある。更には、この様な分割DNNでは複数のエッジの演算デバイスを動作させる必要があるため、消費電力が大きくなる場合があるという問題がある。このため、好適にDNNの演算を行うことができる演算装置が求められている。
【0008】
そこで、本発明の目的は、好適にDNNの演算を行うことができる、演算装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するため、本発明の演算装置の一態様は、演算を行う少なくとも1つの演算領域を有する演算デバイスを少なくとも1つ備え、DNN(Deep Neural Network:深層学習)の演算を、前記演算デバイスを用いて行う演算装置であって、前記演算デバイスは、中間メモリ領域を有し、前記演算装置は、複数の前記演算領域と、入力情報を取得すると、前記入力情報から複数の入力の特徴マップを生成し、生成した前記複数の入力の特徴マップを、前記演算デバイスのうちで演算に使用する演算デバイスに送信し、前記複数の前記演算領域を用いて、前記複数の入力の特徴マップに対する前記DNNの演算を並列で行うDNN演算実行部と、を備え、前記DNN演算実行部は、少なくとも1つのDNNの分割方式で、前記複数の入力の特徴マップに対する前記DNNの演算を並列で行い、前記DNNの演算を並列で行う際の前記DNNの分割方式には、前記DNNの演算の過程で、層の演算に用いる複数の特徴マップそれぞれを分割することなく、前記層の演算に用いる複数の特徴マップを、特徴マップをまとめた組に分けて、分けた前記特徴マップをまとめた組それぞれに対して前記層の演算を行う、チャンネル分割を少なくとも含み、少なくともチャンネル分割を行う際には、少なくとも1つの前記演算領域が有する前記中間メモリ領域に少なくとも他の1つの前記演算領域が有する特徴マップもしくは特徴マップに演算を行った結果を格納して演算を行う。
【0010】
上記目的を達成するため、本発明の演算装置の一態様は、演算を行う少なくとも1つの演算領域を有する演算デバイスを少なくとも1つ備え、DNN(Deep Neural Network:深層学習)の演算を、前記演算デバイスを用いて行う演算装置であって、前記演算装置は、複数の前記演算領域と、入力情報を取得すると、前記入力情報から複数の入力の特徴マップを生成し、生成した前記複数の入力の特徴マップを、前記演算デバイスのうちで演算に使用する演算デバイスに送信し、前記複数の前記演算領域を用いて、前記複数の入力の特徴マップに対する前記DNNの演算を並列で行うDNN演算実行部と、を備え、前記DNN演算実行部は、前記DNNの演算の過程で、特徴マップを面内で複数に分割し、分割した特徴マップそれぞれを、前記複数の前記演算領域それぞれに割り当てて、層の演算を行う空間分割と、層の演算に用いる複数の特徴マップそれぞれを分割することなく、前記層の演算に用いる複数の特徴マップを、特徴マップをまとめた組に分けて、分けた前記特徴マップをまとめた組それぞれを、前記複数の前記演算領域のうちで演算に使用する演算領域それぞれに割り当てて、前記層の演算を行うチャンネル分割と、の分割方式を切り替える。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
乗降調査装置
11日前
個人
自動販売機
18日前
個人
リユース統合システム
1か月前
日本精機株式会社
投影装置
11日前
日本精機株式会社
投影システム
12日前
個人
チラシ掲載位置表示システム
29日前
小林クリエイト株式会社
RFタグ
18日前
株式会社SUBARU
車両
19日前
17LIVE株式会社
サーバ
11日前
株式会社協同印刷
防災・災害マウス
24日前
太陽誘電株式会社
触覚生成装置
22日前
株式会社ゼロボード
価格決定システム
10日前
株式会社イトーキ
分析装置
22日前
株式会社カネカ
異常推定システム
1か月前
株式会社アジラ
姿勢推定システム
9日前
株式会社フォーバル
仕訳システム
1か月前
日本信号株式会社
自転車貸出システム
12日前
日本電気株式会社
勤務管理装置
17日前
個人
ブロックチェーンと既存網との接続方法
1か月前
株式会社小野測器
移動量計測システム
2日前
小林クリエイト株式会社
あて先表示システム
18日前
個人
言語翻訳システム及びプログラム
2日前
個人
防災訓練オフ会
19日前
株式会社日立製作所
演算装置
1か月前
NISSHA株式会社
指装着型コントローラー
17日前
日本電気株式会社
端末及び認証システム
12日前
NVデバイス株式会社
視線検出システム
1か月前
トヨタ自動車株式会社
サーバ装置
18日前
個人
集配システムと保管システム
12日前
富士通株式会社
プロセッサ
4日前
トヨタ自動車株式会社
燃料購入システム
9日前
トヨタ自動車株式会社
燃料購入システム
9日前
日本信号株式会社
所持物検査装置
16日前
日本信号株式会社
駐車場システム
25日前
大王製紙株式会社
情報読取システム
19日前
パイオニア株式会社
判定装置
25日前
続きを見る