TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025133280
公報種別公開特許公報(A)
公開日2025-09-11
出願番号2024031135
出願日2024-03-01
発明の名称演算システムおよび演算システムの制御方法
出願人富士通株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06F 12/0897 20160101AFI20250904BHJP(計算;計数)
要約【課題】メモリ帯域幅を有効に利用する。
【解決手段】演算システム1はAI処理の実装に好適である。複数のアクセラレータ110は行列積演算を行う。LLC200は、複数のアクセラレータのそれぞれによる演算結果を保存する外部メモリ300のデータをキャッシュする。メモリコントローラ120は、LLC200に対するアクセスが混雑しているかどうかを判定し、混雑していると判定した場合にLLC200を制御する。この制御は、外部メモリ300で保存されている行列と他の行列との行列積演算を行うアクセラレータ110からのアクセスに応じて外部メモリ300より読み出された行列を、当該行列の各成分の値の精度を低下させる変換を行った上で転送させる制御である。
【選択図】 図2


特許請求の範囲【請求項1】
行列積演算を行う複数のアクセラレータと、
前記複数のアクセラレータのそれぞれによる演算結果を保存する外部メモリのデータをキャッシュするキャッシュメモリと、
前記キャッシュメモリに対するアクセスが混雑しているかどうかを判定し、混雑していると判定した場合に前記キャッシュメモリを制御して、前記複数のアクセラレータのうちの1のアクセラレータであって前記外部メモリで保存されている行列と他の行列との前記行列積演算を行う前記1のアクセラレータからのアクセスに応じて前記外部メモリより読み出された前記行列を、前記行列の各成分の値の精度を低下させる変換を行った上で転送させるコントローラと、
を備えることを特徴とする演算システム。
続きを表示(約 1,000 文字)【請求項2】
前記複数のアクセラレータのうちの、前記行列を前記演算結果として出力したアクセラレータは、浮動小数点数の表現形式で表されている前記行列の各成分の値における指数部が取る値の範囲を求めて前記コントローラに通知し、
前記コントローラは、前記変換後の前記精度を前記範囲に基づいて決定する、
ことを特徴とする請求項1に記載の演算システム。
【請求項3】
前記変換は、前記行列の各成分の値を、指数部として、前記範囲の最大値を表現可能なビット幅を有しており、且つ、前記値の表現に用いるビット数が減少する前記表現形式で表現させる変換であることを特徴とする請求項2に記載の演算システム。
【請求項4】
前記変換は、前記行列の各成分の値を、指数部として、前記範囲の最大値と最小値との両方を表現可能なビット幅を有しており、且つ、前記値の表現に用いるビット数が減少する前記表現形式で表現させる変換であることを特徴とする請求項2に記載の演算システム。
【請求項5】
前記コントローラは、前記変換後の前記行列の各成分の値についての前記表現形式を、前記表現形式の選択肢のうちから選択することを特徴とする請求項2又は3に記載の演算システム。
【請求項6】
前記1のアクセラレータは、前記行列と前記他の行列との前記行列積演算として行う前記行列の成分と前記他の行列の成分との積和演算を行うために実行する、乗算と前記乗算の結果の順次加算とのうちの前記順次加算を、前記変換前の精度により実行することを特徴とする請求項1に記載の演算システム。
【請求項7】
行列積演算を行う複数のアクセラレータと、前記複数のアクセラレータのそれぞれによる演算結果を保存する外部メモリのデータをキャッシュするキャッシュメモリとを備える演算システムの制御方法であって、
前記キャッシュメモリに対するアクセスが混雑しているかどうかを判定し、
混雑していると判定した場合に前記キャッシュメモリを制御して、前記複数のアクセラレータのうちの1のアクセラレータであって前記外部メモリで保存されている行列と他の行列との前記行列積演算を行う前記1のアクセラレータからのアクセスに応じて前記外部メモリより読み出された前記行列を、前記行列の各成分の値の精度を低下させる変換を行った上で転送させる、
ことを特徴とする演算システムの制御方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、演算システムおよび演算方法に関する。
続きを表示(約 1,500 文字)【背景技術】
【0002】
AI(人工知能:Artificial Intelligence)を実現する演算処理(以下、「AI処理」と称することとする)の高速化が求められており、そのための技術が幾つか提案されている(例えば特許文献1~特許文献5参照)。
【先行技術文献】
【特許文献】
【0003】
特表2022-523912号公報
特開2023-77818号公報
米国特許出願公開第2019/0354846号明細書
米国特許出願公開第2020/0258263号明細書
米国特許出願公開第2022/0044114号明細書
【発明の概要】
【発明が解決しようとする課題】
【0004】
AI処理の多くは、その処理の大部分を行列積演算が占めている。例えば、ディープニューラルネットワークモデルの実装によるAI処理では、前段の行列積演算による演算結果の行列を用いて次段の行列積演算を行うという処理が繰り返される。
【0005】
行列積演算に適した演算装置(アクセラレータ)を用いて高速なAI処理を実現する演算システムが広く知られている。集積度の向上などによるアクセラレータの高性能化によって行列積演算自体は高速化が進展している一方で、その演算結果を保存するメモリとの間でのデータ転送におけるメモリ帯域幅は性能向上が追いついていない。このことは、AI処理の高速化を妨げる要因のひとつとなっている。
【0006】
1つの側面では、本発明は、メモリ帯域幅を有効に利用することを目的とする。
【課題を解決するための手段】
【0007】
1つの実施形態では、演算システムが、複数のアクセラレータと、キャッシュメモリと、コントローラとを備える。複数のアクセラレータは行列積演算を行う。キャッシュメモリは、複数のアクセラレータのそれぞれによる演算結果を保存する外部メモリのデータをキャッシュする。コントローラは、キャッシュメモリに対するアクセスが混雑しているかどうかを判定し、混雑していると判定した場合にキャッシュメモリを制御する。この制御は、外部メモリで保存されている行列と他の行列との行列積演算を行うアクセラレータからのアクセスに応じて外部メモリより読み出された行列を、当該行列の各成分の値の精度を低下させる変換を行った上で転送させる制御である。
【発明の効果】
【0008】
1つの側面では、本発明は、メモリ帯域幅を有効に利用することが可能となる。
【図面の簡単な説明】
【0009】
AI処理における演算の流れを説明する図である。
演算システムの構成の一例を示す図である。
演算器の詳細構成の一例を説明する図である。
PEの内部構成の一例を示す図である。
指数部範囲テーブルの一例を示す図である。
アクセラレータが行う処理の第1の例の処理内容を示したフローチャートである。
アクセラレータが行う処理の第2の例の処理内容を示したフローチャートである。
メモリコントローラが行う処理の一例の処理内容を示したフローチャートである。
精度決定処理の一例の処理内容を示したフローチャートである。
読み出し処理の一例の処理内容を示したフローチャートである。
【発明を実施するための形態】
【0010】
以下、図面を参照しながら、実施形態を詳細に説明する。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

富士通株式会社
医用画像処理方法
1か月前
富士通株式会社
ハイブリッド光増幅器
12日前
富士通株式会社
転倒検出方法及び装置
1か月前
富士通株式会社
量子デバイスの製造方法
24日前
富士通株式会社
制御装置及び基地局制御方法
1か月前
富士通株式会社
マーキング方法及びプログラム
1か月前
富士通株式会社
量子ビットデバイスの製造方法
1か月前
富士通株式会社
ポイントクラウドレジストレーション
24日前
富士通株式会社
データ転送制御装置および情報処理装置
1か月前
富士通株式会社
視線誘導方法および視線誘導プログラム
19日前
富士通株式会社
データ転送制御装置および情報処理装置
1か月前
富士通株式会社
量子デバイス及び量子デバイスの制御方法
1か月前
富士通株式会社
演算システムおよび演算システムの制御方法
2日前
富士通株式会社
生成人工知能を使用したデータセット符号化
5日前
富士通株式会社
学習プログラム、学習方法、及び情報処理装置
29日前
富士通株式会社
推定プログラム、推定方法および情報処理装置
17日前
富士通株式会社
画像を記述する構造化テキストを生成する方法
18日前
富士通株式会社
推定プログラム、推定方法および情報処理装置
23日前
富士通株式会社
学習プログラム、学習方法および情報処理装置
1か月前
富士通株式会社
描画プログラム、描画方法および情報処理装置
1か月前
富士通株式会社
データ処理装置、プログラム及びデータ処理方法
1か月前
富士通株式会社
電源制御回路,情報処理装置および電源制御方法
26日前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
1か月前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
1か月前
富士通株式会社
レース内容再現方法およびレース内容再現プログラム
4日前
富士通株式会社
表示制御プログラム、表示制御方法及び情報処理装置
1か月前
富士通株式会社
情報処理プログラム、情報処理装置及び情報処理方法
2日前
富士通株式会社
光送信機アナログ特性の監視装置と方法及び光送信機
5日前
富士通株式会社
調達管理プログラム,調達管理方法,及び情報処理装置
1か月前
富士通株式会社
行動予測プログラム、行動予測装置および行動予測方法
24日前
富士通株式会社
情報処理プログラム,情報処理方法および情報処理装置
3日前
富士通株式会社
予測制御プログラム、情報処理装置および予測制御方法
11日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
1か月前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
1か月前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
1か月前
富士通株式会社
競争位置表示処理プログラムおよび競争位置表示処理方法
1か月前
続きを見る