TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025133280
公報種別公開特許公報(A)
公開日2025-09-11
出願番号2024031135
出願日2024-03-01
発明の名称演算システムおよび演算システムの制御方法
出願人富士通株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06F 12/0897 20160101AFI20250904BHJP(計算;計数)
要約【課題】メモリ帯域幅を有効に利用する。
【解決手段】演算システム1はAI処理の実装に好適である。複数のアクセラレータ110は行列積演算を行う。LLC200は、複数のアクセラレータのそれぞれによる演算結果を保存する外部メモリ300のデータをキャッシュする。メモリコントローラ120は、LLC200に対するアクセスが混雑しているかどうかを判定し、混雑していると判定した場合にLLC200を制御する。この制御は、外部メモリ300で保存されている行列と他の行列との行列積演算を行うアクセラレータ110からのアクセスに応じて外部メモリ300より読み出された行列を、当該行列の各成分の値の精度を低下させる変換を行った上で転送させる制御である。
【選択図】 図2


特許請求の範囲【請求項1】
行列積演算を行う複数のアクセラレータと、
前記複数のアクセラレータのそれぞれによる演算結果を保存する外部メモリのデータをキャッシュするキャッシュメモリと、
前記キャッシュメモリに対するアクセスが混雑しているかどうかを判定し、混雑していると判定した場合に前記キャッシュメモリを制御して、前記複数のアクセラレータのうちの1のアクセラレータであって前記外部メモリで保存されている行列と他の行列との前記行列積演算を行う前記1のアクセラレータからのアクセスに応じて前記外部メモリより読み出された前記行列を、前記行列の各成分の値の精度を低下させる変換を行った上で転送させるコントローラと、
を備えることを特徴とする演算システム。
続きを表示(約 1,000 文字)【請求項2】
前記複数のアクセラレータのうちの、前記行列を前記演算結果として出力したアクセラレータは、浮動小数点数の表現形式で表されている前記行列の各成分の値における指数部が取る値の範囲を求めて前記コントローラに通知し、
前記コントローラは、前記変換後の前記精度を前記範囲に基づいて決定する、
ことを特徴とする請求項1に記載の演算システム。
【請求項3】
前記変換は、前記行列の各成分の値を、指数部として、前記範囲の最大値を表現可能なビット幅を有しており、且つ、前記値の表現に用いるビット数が減少する前記表現形式で表現させる変換であることを特徴とする請求項2に記載の演算システム。
【請求項4】
前記変換は、前記行列の各成分の値を、指数部として、前記範囲の最大値と最小値との両方を表現可能なビット幅を有しており、且つ、前記値の表現に用いるビット数が減少する前記表現形式で表現させる変換であることを特徴とする請求項2に記載の演算システム。
【請求項5】
前記コントローラは、前記変換後の前記行列の各成分の値についての前記表現形式を、前記表現形式の選択肢のうちから選択することを特徴とする請求項2又は3に記載の演算システム。
【請求項6】
前記1のアクセラレータは、前記行列と前記他の行列との前記行列積演算として行う前記行列の成分と前記他の行列の成分との積和演算を行うために実行する、乗算と前記乗算の結果の順次加算とのうちの前記順次加算を、前記変換前の精度により実行することを特徴とする請求項1に記載の演算システム。
【請求項7】
行列積演算を行う複数のアクセラレータと、前記複数のアクセラレータのそれぞれによる演算結果を保存する外部メモリのデータをキャッシュするキャッシュメモリとを備える演算システムの制御方法であって、
前記キャッシュメモリに対するアクセスが混雑しているかどうかを判定し、
混雑していると判定した場合に前記キャッシュメモリを制御して、前記複数のアクセラレータのうちの1のアクセラレータであって前記外部メモリで保存されている行列と他の行列との前記行列積演算を行う前記1のアクセラレータからのアクセスに応じて前記外部メモリより読み出された前記行列を、前記行列の各成分の値の精度を低下させる変換を行った上で転送させる、
ことを特徴とする演算システムの制御方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、演算システムおよび演算方法に関する。
続きを表示(約 1,500 文字)【背景技術】
【0002】
AI(人工知能:Artificial Intelligence)を実現する演算処理(以下、「AI処理」と称することとする)の高速化が求められており、そのための技術が幾つか提案されている(例えば特許文献1~特許文献5参照)。
【先行技術文献】
【特許文献】
【0003】
特表2022-523912号公報
特開2023-77818号公報
米国特許出願公開第2019/0354846号明細書
米国特許出願公開第2020/0258263号明細書
米国特許出願公開第2022/0044114号明細書
【発明の概要】
【発明が解決しようとする課題】
【0004】
AI処理の多くは、その処理の大部分を行列積演算が占めている。例えば、ディープニューラルネットワークモデルの実装によるAI処理では、前段の行列積演算による演算結果の行列を用いて次段の行列積演算を行うという処理が繰り返される。
【0005】
行列積演算に適した演算装置(アクセラレータ)を用いて高速なAI処理を実現する演算システムが広く知られている。集積度の向上などによるアクセラレータの高性能化によって行列積演算自体は高速化が進展している一方で、その演算結果を保存するメモリとの間でのデータ転送におけるメモリ帯域幅は性能向上が追いついていない。このことは、AI処理の高速化を妨げる要因のひとつとなっている。
【0006】
1つの側面では、本発明は、メモリ帯域幅を有効に利用することを目的とする。
【課題を解決するための手段】
【0007】
1つの実施形態では、演算システムが、複数のアクセラレータと、キャッシュメモリと、コントローラとを備える。複数のアクセラレータは行列積演算を行う。キャッシュメモリは、複数のアクセラレータのそれぞれによる演算結果を保存する外部メモリのデータをキャッシュする。コントローラは、キャッシュメモリに対するアクセスが混雑しているかどうかを判定し、混雑していると判定した場合にキャッシュメモリを制御する。この制御は、外部メモリで保存されている行列と他の行列との行列積演算を行うアクセラレータからのアクセスに応じて外部メモリより読み出された行列を、当該行列の各成分の値の精度を低下させる変換を行った上で転送させる制御である。
【発明の効果】
【0008】
1つの側面では、本発明は、メモリ帯域幅を有効に利用することが可能となる。
【図面の簡単な説明】
【0009】
AI処理における演算の流れを説明する図である。
演算システムの構成の一例を示す図である。
演算器の詳細構成の一例を説明する図である。
PEの内部構成の一例を示す図である。
指数部範囲テーブルの一例を示す図である。
アクセラレータが行う処理の第1の例の処理内容を示したフローチャートである。
アクセラレータが行う処理の第2の例の処理内容を示したフローチャートである。
メモリコントローラが行う処理の一例の処理内容を示したフローチャートである。
精度決定処理の一例の処理内容を示したフローチャートである。
読み出し処理の一例の処理内容を示したフローチャートである。
【発明を実施するための形態】
【0010】
以下、図面を参照しながら、実施形態を詳細に説明する。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

富士通株式会社
行列演算回路
10日前
富士通株式会社
周波数変換器
13日前
富士通株式会社
メッシュ微細化
1日前
富士通株式会社
医用画像処理方法
2か月前
富士通株式会社
演算器及び演算方法
1日前
富士通株式会社
転倒検出方法及び装置
1か月前
富士通株式会社
ハイブリッド光増幅器
1か月前
富士通株式会社
冷却装置及び電子機器
10日前
富士通株式会社
量子デバイスの製造方法
1か月前
富士通株式会社
アレイアンテナモジュール
2日前
富士通株式会社
制御装置及び基地局制御方法
2か月前
富士通株式会社
通信制御装置及び移動中継装置
7日前
富士通株式会社
量子ビットデバイスの製造方法
2か月前
富士通株式会社
演算処理装置及び演算処理方法
21日前
富士通株式会社
マーキング方法及びプログラム
2か月前
富士通株式会社
基板及びこれを備えた電子装置
2日前
富士通株式会社
動的多次元メディアコンテンツ投影
20日前
富士通株式会社
ポイントクラウドレジストレーション
1か月前
富士通株式会社
データ転送制御装置および情報処理装置
1か月前
富士通株式会社
異常予測方法および異常予測プログラム
20日前
富士通株式会社
視線誘導方法および視線誘導プログラム
1か月前
富士通株式会社
データ転送制御装置および情報処理装置
1か月前
富士通株式会社
管理装置、管理方法、および管理プログラム
8日前
富士通株式会社
生成人工知能を使用したデータセット符号化
1か月前
富士通株式会社
演算システムおよび演算システムの制御方法
28日前
富士通株式会社
推定プログラム、推定方法および情報処理装置
1か月前
富士通株式会社
交通シミュレーションのための方法および装置
20日前
富士通株式会社
描画プログラム、描画方法および情報処理装置
2か月前
富士通株式会社
学習プログラム、学習方法、及び情報処理装置
1か月前
富士通株式会社
推定プログラム、推定方法および情報処理装置
1か月前
富士通株式会社
学習プログラム、学習方法および情報処理装置
2か月前
富士通株式会社
プログラム、情報処理方法および情報処理装置
6日前
富士通株式会社
予測プログラム、予測方法および情報処理装置
22日前
富士通株式会社
シストリック型の演算アレイ装置及び制御方法
22日前
富士通株式会社
画像を記述する構造化テキストを生成する方法
1か月前
富士通株式会社
演算装置、情報処理装置及び演算装置の制御方法
22日前
続きを見る