TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2023072763
公報種別公開特許公報(A)
公開日2023-05-25
出願番号2021185401
出願日2021-11-15
発明の名称演算処理装置および演算処理方法
出願人富士通株式会社,大学共同利用機関法人情報・システム研究機構
代理人個人,個人
主分類G06F 12/0846 20160101AFI20230518BHJP(計算;計数)
要約【課題】複数の読み出しアクセス要求の読み出し対象データが、バンクに保持される第1データに含まれる複数の第2データの各々である場合にも、複数の第2データの読み出しの遅延を抑制する。
【解決手段】演算処理装置は、複数の要求発行部と、記憶装置から読み出されるデータを分割した第1データを保持可能な複数のバンクを含むキャッシュと、スイッチ部と、データ分配部とを有し、スイッチ部は、複数の読み出しアクセス要求の読み出し対象データの各々が第1データに含まれる複数の第2データのいずれかである場合、読み出しアクセス要求の1つを読み出し対象のバンクに出力し、バンクから読み出される複数の第2データを含む第1データをデータ分配部に出力し、データ分配部は、スイッチ部から受ける第1データを分割した複数の第2データのそれぞれを、読み出しアクセス要求の発行元の要求発行部に並列に出力する。
【選択図】図2
特許請求の範囲【請求項1】
記憶装置に読み出しアクセス要求を発行する複数の要求発行部と、
前記記憶装置から読み出されるデータを分割した第1データをそれぞれ保持可能な複数のバンクを含むキャッシュと、
前記複数の要求発行部と前記複数のバンクとを相互に接続するスイッチ部と、
前記複数の要求発行部と前記スイッチ部との間に配置されるデータ分配部とを有し、
前記スイッチ部は、
前記複数の要求発行部がそれぞれ発行する複数の読み出しアクセス要求の読み出し対象データの各々が第1データに含まれる複数の第2データのいずれかである場合、読み出しアクセス要求の1つを読み出し対象のバンクに出力し、
バンクから読み出される複数の第2データを含む第1データを前記データ分配部に出力し、
前記データ分配部は、前記スイッチ部から受ける第1データを分割した複数の第2データのそれぞれを、読み出しアクセス要求の発行元の前記要求発行部に並列に出力する
演算処理装置。
続きを表示(約 1,600 文字)【請求項2】
前記データ分配部は、ビット拡張型の読み出しアクセス要求の読み出し対象データの各々が、第1データに含まれる複数の第2データのいずれかである場合、複数の第2データのそれぞれを下位側のデータ線を介して読み出しアクセス要求の発行元の前記要求発行部に出力する
請求項1に記載の演算処理装置。
【請求項3】
前記データ分配部は、複数の第2データが負値の場合、負値の第2データを出力する下位側のデータ線を除く上位側のデータ線に"1"を出力する
請求項2に記載の演算処理装置。
【請求項4】
前記データ分配部は、非ビット拡張型の読み出しアクセス要求に対応して前記複数のバンクのいずれかから読み出される第1データを分割することなく読み出しアクセス要求の発行元の前記要求発行部に出力する
請求項2または請求項3に記載の演算処理装置。
【請求項5】
前記データ分配部は、前記スイッチ部に接続される複数のデータ入力ポートと、前記複数の要求発行部にそれぞれに接続され、前記複数のデータ入力ポートにそれぞれ対応する複数のデータ出力ポートと、前記データ入力ポートで受ける第1データを分割した第2データの各々を、前記複数のデータ出力ポートのいずれに転送するかを選択する選択部と、を有し、
前記スイッチ部は、前記バンクから読み出される第1データを前記複数のデータ入力ポートのいずれかに出力する
請求項1ないし請求項4のいずれか1項に記載の演算処理装置。
【請求項6】
前記第2データは、第1データを2分した下位データおよび上位データであり、
前記選択部は、
前記データ入力ポートで受ける下位データまたは上位データを選択し、下位側のデータとして前記データ出力ポートから出力する下位セレクタと、
前記データ入力ポートで受ける上位データ、オール0データまたはオール1データを選択し、上位側のデータとして前記データ出力ポートから出力する上位セレクタを有する
請求項5に記載の演算処理装置。
【請求項7】
前記選択部は、ビット拡張型の読み出しアクセス要求の読み出し対象データが第1データに含まれる複数の第2データの各々である場合、前記データ入力ポートを介して前記スイッチ部から受ける第1データに含まれる下位データおよび上位データを、読み出しアクセス要求の発行元の要求発行部に対応するデータ出力ポートの下位側に出力させる
請求項6に記載の演算処理装置。
【請求項8】
前記複数の要求発行部から発行される前記読み出しアクセス要求を調停し、調停結果に応じて前記スイッチ部および前記データ分配部の動作を制御する調停部を有する
請求項1ないし請求項7のいずれか1項に記載の演算処理装置。
【請求項9】
記憶装置に読み出しアクセス要求を発行する複数の要求発行部と、前記記憶装置から読み出されるデータを分割した第1データをそれぞれ保持可能な複数のバンクを含むキャッシュと、前記複数の要求発行部と前記複数のバンクとを相互に接続するスイッチ部と、前記複数の要求発行部と前記スイッチ部との間に配置されるデータ分配部とを有する演算処理装置の演算処理方法であって、
前記スイッチ部が、前記複数の要求発行部がそれぞれ発行する複数の読み出しアクセス要求の読み出し対象データの各々が第1データに含まれる複数の第2データのいずれかである場合、読み出しアクセス要求の1つを読み出し対象のバンクに出力し、
前記スイッチ部が、バンクから読み出される複数の第2データを含む第1データを前記データ分配部に出力し、
前記データ分配部が、前記スイッチ部から受ける第1データを分割した複数の第2データのそれぞれを、読み出しアクセス要求の発行元の前記要求発行部に並列に出力する
演算処理方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、演算処理装置および演算処理方法に関する。
続きを表示(約 2,200 文字)【背景技術】
【0002】
CPU(Central Processing Unit)等の演算処理装置に搭載されるキャッシュは、外部メモリに記憶されたデータの一部を保持する。そして、キャッシュは、CPUから発行される読み出しアクセス要求の対象データを保持している場合(キャッシュヒット)、外部メモリに読み出しアクセス要求を発行することなく、キャッシュに保持しているデータをCPUコア等に転送する。これにより、データのアクセス効率が向上され、CPUの処理性能が向上する。
【0003】
例えば、CPUとともに半導体装置に搭載され、外部メモリを制御するメモリ制御部は、外部メモリに搭載される複数のバンクの各々に対応するバンクキャッシュを有する(例えば、特許文献1参照)。プロセッサに搭載されるレベル2キャッシュは、独立にアクセス可能な複数のストレージブロックを有する(例えば、特許文献2参照)。複数のノーマルバンクと複数のキャッシュバンクとを有するメモリは、ノーマルバンクに対する連続的なアクセスがある場合、選択されたノーマルバンクから出力するデータをキャッシュバンクに移動させる(例えば、特許文献3参照)。
【先行技術文献】
【特許文献】
【0004】
特開2005-339348号公報
特表2006-507602号公報
特開2004-55112号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
近時、ベクトル演算等を並列に実行するためにSIMD(Single Instruction Multiple Data)演算命令を実行可能な演算処理装置が開発されている。この種の演算処理装置は、様々なデータサイズのSIMD演算命令を実行できる。例えば、キャッシュバンクのデータ幅の半分のサイズのデータであって、アドレスが連続する複数のデータをSIMD演算に使用する場合、1つのバンクに対して複数の読み出しアクセス要求が競合する場合がある。このとき、読み出しアクセス要求は、バンクに順次供給され、アクセス対象のデータは、バンクから順次に読み出される。SIMD演算は、演算対象のデータが全て揃ってから実行されるため、演算の実行タイミングが遅れ、演算効率は低下する。
【0006】
1つの側面では、本発明は、複数の読み出しアクセス要求の読み出し対象データが、バンクに保持される第1データに含まれる複数の第2データの各々である場合にも、複数の第2データの読み出しの遅延を抑制することを目的とする。
【課題を解決するための手段】
【0007】
一つの観点によれば、演算処理装置は、記憶装置に読み出しアクセス要求を発行する複数の要求発行部と、前記記憶装置から読み出されるデータを分割した第1データをそれぞれ保持可能な複数のバンクを含むキャッシュと、前記複数の要求発行部と前記複数のバンクとを相互に接続するスイッチ部と、前記複数の要求発行部と前記スイッチ部との間に配置されるデータ分配部とを有し、前記スイッチ部は、前記複数の要求発行部がそれぞれ発行する複数の読み出しアクセス要求の読み出し対象データの各々が第1データに含まれる複数の第2データのいずれかである場合、読み出しアクセス要求の1つを読み出し対象のバンクに出力し、バンクから読み出される複数の第2データを含む第1データを前記データ分配部に出力し、前記データ分配部は、前記スイッチ部から受ける第1データを分割した複数の第2データのそれぞれを、読み出しアクセス要求の発行元の前記要求発行部に並列に出力する。
【発明の効果】
【0008】
複数の読み出しアクセス要求の読み出し対象データが、バンクに保持される第1データに含まれる複数の第2データの各々である場合にも、複数の第2データの読み出しの遅延を抑制することができる。
【図面の簡単な説明】
【0009】
一実施形態における演算処理装置の一例を示すブロック図である。
図1の演算処理装置のメモリアクセス動作の一例を示す説明図である。
別の実施形態における演算処理装置の一例を示すブロック図である。
図1のデータ分配部の一例を示すブロック図である。
図3のキャッシュまたは図1のキャッシュに配置するデータの例を示す説明図である。
図3のデータ分配部または図1のデータ分配部の通常ロードでの動作の例を示す説明図である。
図3のデータ分配部または図1のデータ分配部のビット拡張ロードでの動作の例を示す説明図である。
図3のデータ分配部または図1のデータ分配部のビット拡張ロードでの動作の別の例を示す説明図である。
疎行列ベクトル積の例を示す説明図である。
疎行列ベクトル積の演算の実行時の動作の一例を示す説明図である。
疎行列ベクトル積の演算の実行時の動作の別の例を示す説明図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して、実施形態が説明される。
(【0011】以降は省略されています)

特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
プロセッサ
2日前
富士通株式会社
プログラム,方法,及び情報処理装置
1日前
富士通株式会社
評価プログラム、評価方法、評価装置
2日前
富士通株式会社
検出プログラム,検出方法および検出装置
1日前
富士通株式会社
抽出プログラム、抽出方法および情報処理装置
1日前
富士通株式会社
判定プログラム、判定方法、および情報処理装置
2日前
富士通株式会社
機械学習プログラム,機械学習方法及び情報処理装置
2日前
富士通株式会社
機械学習プログラム、情報処理装置および機械学習方法
7日前
富士通株式会社
量子コンピュータを用いた浅い回路上での最適化問題の解法
今日
富士通株式会社
トレーニング方法,演算処理装置及びトレーニングプログラム
今日
富士通株式会社
サンプリングプログラム、サンプリング方法および情報処理装置
1日前
富士通株式会社
前方ラマン増幅器、双方向ラマン増幅システムおよび前方ラマン増幅システム
今日
富士通株式会社
情報処理プログラム,訓練プログラム,情報処理方法,訓練方法および情報処理装置
今日
個人
乗降調査装置
9日前
個人
自動販売機
16日前
個人
リユース統合システム
29日前
日本精機株式会社
投影装置
9日前
個人
コメント配信システム
1か月前
個人
広告提供方法
1か月前
日本精機株式会社
投影システム
10日前
個人
チラシ掲載位置表示システム
27日前
個人
情報処理装置及びプログラム
1か月前
個人
モノづくり知識情報システム
1か月前
小林クリエイト株式会社
RFタグ
16日前
株式会社SUBARU
車両
17日前
17LIVE株式会社
サーバ
9日前
株式会社協同印刷
防災・災害マウス
22日前
太陽誘電株式会社
触覚生成装置
20日前
株式会社ゼロボード
価格決定システム
8日前
中国電力株式会社
ゲームシステム
1か月前
株式会社カネカ
異常推定システム
28日前
株式会社イトーキ
分析装置
20日前
株式会社フォーバル
仕訳システム
28日前
株式会社アジラ
姿勢推定システム
7日前
個人
言語翻訳システム及びプログラム
今日
株式会社小野測器
移動量計測システム
今日
続きを見る