TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025145578
公報種別公開特許公報(A)
公開日2025-10-03
出願番号2024045839
出願日2024-03-22
発明の名称シストリックアレイ型行列乗算器およびシストリックアレイ型行列乗算器の動作方法
出願人富士通株式会社
代理人個人,個人
主分類G06F 17/16 20060101AFI20250926BHJP(計算;計数)
要約【課題】回路規模の増加を抑えつつ、様々な大きさの行列乗算を実行する。
【解決手段】マトリックス状に配置された複数のプロセッシングエレメントを含み、行列乗算を実行するシストリックアレイ型行列乗算器であって、複数のプロセッシングエレメントの各々は、第1方向の一端側に設けられる第1入力端子から受ける第1行列の各要素を順次保持する第1保持部と、第1保持部の出力を第1方向の他端側に設けられる第1出力端子に出力する第1パスと、第1方向の他端側に設けられる第2入力端子から受ける第1行列の各要素を順次保持する第2保持部と、第2保持部の出力を第1方向の一端側に設けられる第2出力端子に出力する第2パスと、第1パスに接続される積和演算器と、第1パスまたは第1出力端子を第2パスに接続する第1選択部と、第2パスまたは第1保持部の出力を第1パスに接続する第2選択部と、を有する。
【選択図】図3
特許請求の範囲【請求項1】
マトリックス状に配置された複数のプロセッシングエレメントを含み、行列乗算を実行するシストリックアレイ型行列乗算器であって、
前記複数のプロセッシングエレメントの各々は、
第1方向の一端側に設けられる第1入力端子から受ける第1行列の各要素を順次保持する第1保持部と、
前記第1保持部の出力を前記第1方向の他端側に設けられる第1出力端子に出力する第1パスと、
前記第1方向の他端側に設けられる第2入力端子から受ける前記第1行列の各要素を順次保持する第2保持部と、
前記第2保持部の出力を前記第1方向の一端側に設けられる第2出力端子に出力する第2パスと、
前記第1パスに接続される積和演算器と、
前記第1パスまたは前記第2入力端子を前記第2パスに接続する第1選択部と、
前記第2パスまたは前記第1保持部の出力を前記第1パスに接続する第2選択部と、を有する
シストリックアレイ型行列乗算器。
続きを表示(約 3,000 文字)【請求項2】
前記複数のプロセッシングエレメントのうち、前記第1方向の一端に配置されるプロセッシングエレメントは、前記第2選択部により前記第2パスを前記第1パスに接続し、
前記複数のプロセッシングエレメントのうち、前記第1方向の他端に配置されるプロセッシングエレメントは、前記第1選択部により前記第1パスを前記第2パスに接続し、
前記複数のプロセッシングエレメントのうち、前記第1方向の一端および前記第1方向の他端以外に配置されるプロセッシングエレメントは、前記第2選択部により前記第1保持部の出力を前記第1パスに接続し、前記第1選択部により前記第2入力端子を前記第2保持部の入力に接続する
請求項1に記載のシストリックアレイ型行列乗算器。
【請求項3】
前記複数のプロセッシングエレメントをi行j列(i、jは2以上の整数)のi×j個の前記プロセッシングエレメントを含む複数のサブアレイに区画し、前記複数のサブアレイの各々で行列乗算を実行する場合、
前記複数のサブアレイの各々において、
前記複数のプロセッシングエレメントのうち、前記第1方向の一端に配置されるプロセッシングエレメントは、前記第2選択部により前記第2パスを前記第1パスに接続し、
前記複数のプロセッシングエレメントのうち、前記第1方向の他端に配置されるプロセッシングエレメントは、前記第1選択部により前記第1パスを前記第2パスに接続し、
前記複数のプロセッシングエレメントのうち、前記第1方向の一端および前記第1方向の他端以外に配置されるプロセッシングエレメントは、前記第2選択部により前記第1保持部の出力を前記第1パスに接続し、前記第1選択部により前記第2入力端子を前記第2保持部の入力に接続する
請求項1に記載のシストリックアレイ型行列乗算器。
【請求項4】
前記複数のプロセッシングエレメントの各々は、
前記第1方向と交差する第2方向の一端側に設けられる第3入力端子から受ける第2行列の各要素を前記積和演算器に出力する第3パスと、
前記積和演算器から出力される演算結果を順次保持し、前記第2方向の他端側に設けられる第3出力端子に出力する第3保持部と、
前記第2方向の他端側に設けられる第4入力端子から受ける前記第2行列の各要素を順次保持する第4保持部と、
前記第4保持部の出力を前記第2方向の一端側に設けられる第4出力端子に出力する第4パスと、
前記第3パスまたは前記第4入力端子を前記第4パスに接続する第3選択部と、
前記第4パスまたは前記第3入力端子を前記第3パスに接続する第4選択部と、を有する
請求項1に記載のシストリックアレイ型行列乗算器。
【請求項5】
前記複数のプロセッシングエレメントのうち、前記第2方向の一端に配置されるプロセッシングエレメントは、前記第4選択部により前記第4パスを前記第3パスに接続し、
前記複数のプロセッシングエレメントのうち、前記第2方向の他端に配置されるプロセッシングエレメントは、前記第3選択部により前記第3パスを前記第4パスに接続し、
前記複数のプロセッシングエレメントのうち、前記第2方向の一端および前記第2方向の他端以外に配置されるプロセッシングエレメントは、前記第4選択部により前記第3入力端子を前記第3パスに接続し、前記第3選択部により前記第4入力端子を前記第4パスに接続する
請求項4に記載のシストリックアレイ型行列乗算器。
【請求項6】
前記複数のプロセッシングエレメントをi行j列(i、jは2以上の整数)のi×j個の前記プロセッシングエレメントを含む複数のサブアレイに区画し、前記複数のサブアレイの各々で行列乗算を実行する場合、
前記複数のサブアレイの各々において、
前記複数のプロセッシングエレメントのうち、前記第2方向の一端に配置されるプロセッシングエレメントは、前記第4選択部により前記第4パスを前記第3パスに接続し、
前記複数のプロセッシングエレメントのうち、前記第2方向の他端に配置されるプロセッシングエレメントは、前記第3選択部により前記第3パスを前記第4パスに接続し、
前記複数のプロセッシングエレメントのうち、前記第2方向の一端および前記第2方向の他端以外に配置されるプロセッシングエレメントは、前記第4選択部により前記第3入力端子を前記第3パスに接続し、前記第3選択部により前記第4入力端子を前記第4パスに接続する
請求項4に記載のシストリックアレイ型行列乗算器。
【請求項7】
前記複数のプロセッシングエレメントの各々は、前記積和演算器の出力または前記第3パスを前記第3保持部に接続する第5選択部を有し、
前記第3保持部は、前記積和演算器から出力される演算結果または前記第2方向の一端側に配置される前記プロセッシングエレメントの前記積和演算器から出力される演算結果を保持し、
前記複数のサブアレイのうち、前記第2方向の一端に他のサブアレイが配置されるサブアレイに含まれる前記プロセッシングエレメントは、
前記他のサブアレイから行列乗算結果が転送されるとき、前記第4選択部および前記第5選択部により前記第3入力端子を前記第3保持部に接続する
請求項6に記載のシストリックアレイ型行列乗算器。
【請求項8】
マトリックス状に配置された複数のプロセッシングエレメントを含み、前記複数のプロセッシングエレメントの各々が、積和演算回路と、第1方向の一端側に設けられる第1入力端子から受ける第1行列の各要素を順次保持する第1保持部と、前記第1保持部の出力を前記第1方向の他端側に設けられる第1出力端子に出力する第1パスと、前記第1方向の他端側に設けられる第2入力端子から受ける前記第1行列の各要素を順次保持する第2保持部と、前記第2保持部の出力を前記第1方向の一端側に設けられる第2出力端子に出力する第2パスと、前記第1パスに接続される積和演算器と、前記第1パスまたは前記第1出力端子を前記第2パスに接続する第1選択部と、前記第2パスまたは前記第1保持部の出力を前記第1パスに接続する第2選択部と、を有し、行列乗算を実行するシストリックアレイ型行列乗算器の動作方法であって、
前記複数のプロセッシングエレメントのうち、前記第1方向の一端に配置されるプロセッシングエレメントは、前記第2選択部により前記第2パスを前記第1パスに接続し、
前記複数のプロセッシングエレメントのうち、前記第1方向の他端に配置されるプロセッシングエレメントは、前記第1選択部により前記第1パスを前記第2パスに接続し、
前記複数のプロセッシングエレメントのうち、前記第1方向の一端および前記第1方向の他端以外に配置されるプロセッシングエレメントは、前記第2選択部により前記第1保持部の出力を前記第1パスに接続し、前記第1選択部により前記第2入力端子を前記第2保持部の入力に接続する
シストリックアレイ型行列乗算器の動作方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、シストリックアレイ型行列乗算器およびシストリックアレイ型行列乗算器の動作方法に関する。
続きを表示(約 1,400 文字)【背景技術】
【0002】
科学技術計算または機械学習等で使用する演算は、行列演算が多用されることが多い。汎用CPUを用いた大規模な行列演算は、性能向上に限界があることが知られている。そこで、複数のプロセッシングエレメントを縦横に配置して大規模な行列乗算を高速に実行するシストリックアレイ型のアクセラレータが提案されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
米国特許出願公開第2018-0267936号明細書
【発明の概要】
【発明が解決しようとする課題】
【0004】
シストリックアレイの規模は、演算を実行する行列のサイズが大きいほど大きくなる。例えば、シストリックアレイで実行可能な最大サイズより小さい行列の演算をシストリックアレイで実行する場合、一部のプロセッシングエレメントは、行列の要素の転送のみに使用される。
【0005】
この際、プロセッシングエレメントに含まれる積和演算器は、上流から転送される積和演算結果Cが変更されないように、無駄な演算(0×0+C)を実行する。実質的な演算を実行するプロセッシングエレメントが少なくなるため、演算の処理効率は低下する。
【0006】
シストリックアレイ内のプロセッシングエレメントを分割可能にすることで、複数のサイズの行列の演算が実行可能になる。しかしながら、この場合、分割されるプロセッシングエレメントのグループ毎にメモリが必要になるため、回路規模が増大してしまう。
【0007】
さらに、演算に使用するデータのシストリックアレイへの入力と、シストリックアレイからの演算結果の出力を並列に行う場合、シストリックアレイに接続されるバスの帯域制限により、演算性能が低下するおそれがある。
【0008】
1つの側面では、本発明は、バスの帯域制限による演算性能の低下を抑制可能なシストリックアレイ型行列乗算器を提供することを目的とする。
【課題を解決するための手段】
【0009】
一つの観点によれば、シストリックアレイ型行列乗算器は、マトリックス状に配置された複数のプロセッシングエレメントを含み、行列乗算を実行するシストリックアレイ型行列乗算器であって、前記複数のプロセッシングエレメントの各々は、第1方向の一端側に設けられる第1入力端子から受ける第1行列の各要素を順次保持する第1保持部と、前記第1保持部の出力を前記第1方向の他端側に設けられる第1出力端子に出力する第1パスと、前記第1方向の他端側に設けられる第2入力端子から受ける前記第1行列の各要素を順次保持する第2保持部と、前記第2保持部の出力を前記第1方向の一端側に設けられる第2出力端子に出力する第2パスと、前記第1パスに接続される積和演算器と、前記第1パスまたは前記第1出力端子を前記第2パスに接続する第1選択部と、前記第2パスまたは前記第1保持部の出力を前記第1パスに接続する第2選択部と、を有する。
【発明の効果】
【0010】
バスの帯域制限による演算性能の低下を抑制可能なシストリックアレイ型行列乗算器を提供することができる。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

富士通株式会社
行列演算回路
4日前
富士通株式会社
周波数変換器
7日前
富士通株式会社
冷却装置及び電子機器
4日前
富士通株式会社
演算処理装置及び演算処理方法
15日前
富士通株式会社
通信制御装置及び移動中継装置
1日前
富士通株式会社
動的多次元メディアコンテンツ投影
14日前
富士通株式会社
異常予測方法および異常予測プログラム
14日前
富士通株式会社
生成人工知能を使用したデータセット符号化
25日前
富士通株式会社
演算システムおよび演算システムの制御方法
22日前
富士通株式会社
管理装置、管理方法、および管理プログラム
2日前
富士通株式会社
交通シミュレーションのための方法および装置
14日前
富士通株式会社
プログラム、情報処理方法および情報処理装置
今日
富士通株式会社
シストリック型の演算アレイ装置及び制御方法
16日前
富士通株式会社
予測プログラム、予測方法および情報処理装置
16日前
富士通株式会社
演算装置、情報処理装置及び演算装置の制御方法
16日前
富士通株式会社
制御プログラム、制御方法、および情報処理装置
2日前
富士通株式会社
異常検出プログラム、異常検出方法及び情報処理装置
14日前
富士通株式会社
レース内容再現方法およびレース内容再現プログラム
24日前
富士通株式会社
光送信機アナログ特性の監視装置と方法及び光送信機
25日前
富士通株式会社
情報処理プログラム、情報処理装置及び情報処理方法
22日前
富士通株式会社
施策特定プログラム、施策特定方法および情報処理装置
14日前
富士通株式会社
情報処理プログラム,情報処理方法および情報処理装置
23日前
富士通株式会社
施策特定プログラム、施策特定方法および情報処理装置
今日
富士通株式会社
機械学習プログラム、機械学習方法および情報処理装置
今日
富士通株式会社
予測制御プログラム、情報処理装置および予測制御方法
1か月前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
28日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
7日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
今日
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
7日前
富士通株式会社
データ生成プログラム、データ生成装置、及びデータ生成方法
2日前
富士通株式会社
量子回路軽量化プログラム、情報処理装置及び量子回路軽量化方法
15日前
富士通株式会社
量子計算制御プログラム、量子計算制御方法、および情報処理装置
25日前
富士通株式会社
量子計算支援プログラム、量子計算支援方法、および情報処理装置
1日前
富士通株式会社
情報処理装置、情報処理方法及びコンピュータ読み取り可能な記憶媒体
4日前
NTT株式会社
情報処理システム、情報処理装置および情報処理方法
1日前
富士通株式会社
シミュレーションプログラム、シミュレーション方法および情報処理装置
14日前
続きを見る