TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025133280
公報種別公開特許公報(A)
公開日2025-09-11
出願番号2024031135
出願日2024-03-01
発明の名称演算システムおよび演算システムの制御方法
出願人富士通株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06F 12/0897 20160101AFI20250904BHJP(計算;計数)
要約【課題】メモリ帯域幅を有効に利用する。
【解決手段】演算システム1はAI処理の実装に好適である。複数のアクセラレータ110は行列積演算を行う。LLC200は、複数のアクセラレータのそれぞれによる演算結果を保存する外部メモリ300のデータをキャッシュする。メモリコントローラ120は、LLC200に対するアクセスが混雑しているかどうかを判定し、混雑していると判定した場合にLLC200を制御する。この制御は、外部メモリ300で保存されている行列と他の行列との行列積演算を行うアクセラレータ110からのアクセスに応じて外部メモリ300より読み出された行列を、当該行列の各成分の値の精度を低下させる変換を行った上で転送させる制御である。
【選択図】 図2


特許請求の範囲【請求項1】
行列積演算を行う複数のアクセラレータと、
前記複数のアクセラレータのそれぞれによる演算結果を保存する外部メモリのデータをキャッシュするキャッシュメモリと、
前記キャッシュメモリに対するアクセスが混雑しているかどうかを判定し、混雑していると判定した場合に前記キャッシュメモリを制御して、前記複数のアクセラレータのうちの1のアクセラレータであって前記外部メモリで保存されている行列と他の行列との前記行列積演算を行う前記1のアクセラレータからのアクセスに応じて前記外部メモリより読み出された前記行列を、前記行列の各成分の値の精度を低下させる変換を行った上で転送させるコントローラと、
を備えることを特徴とする演算システム。
続きを表示(約 1,000 文字)【請求項2】
前記複数のアクセラレータのうちの、前記行列を前記演算結果として出力したアクセラレータは、浮動小数点数の表現形式で表されている前記行列の各成分の値における指数部が取る値の範囲を求めて前記コントローラに通知し、
前記コントローラは、前記変換後の前記精度を前記範囲に基づいて決定する、
ことを特徴とする請求項1に記載の演算システム。
【請求項3】
前記変換は、前記行列の各成分の値を、指数部として、前記範囲の最大値を表現可能なビット幅を有しており、且つ、前記値の表現に用いるビット数が減少する前記表現形式で表現させる変換であることを特徴とする請求項2に記載の演算システム。
【請求項4】
前記変換は、前記行列の各成分の値を、指数部として、前記範囲の最大値と最小値との両方を表現可能なビット幅を有しており、且つ、前記値の表現に用いるビット数が減少する前記表現形式で表現させる変換であることを特徴とする請求項2に記載の演算システム。
【請求項5】
前記コントローラは、前記変換後の前記行列の各成分の値についての前記表現形式を、前記表現形式の選択肢のうちから選択することを特徴とする請求項2又は3に記載の演算システム。
【請求項6】
前記1のアクセラレータは、前記行列と前記他の行列との前記行列積演算として行う前記行列の成分と前記他の行列の成分との積和演算を行うために実行する、乗算と前記乗算の結果の順次加算とのうちの前記順次加算を、前記変換前の精度により実行することを特徴とする請求項1に記載の演算システム。
【請求項7】
行列積演算を行う複数のアクセラレータと、前記複数のアクセラレータのそれぞれによる演算結果を保存する外部メモリのデータをキャッシュするキャッシュメモリとを備える演算システムの制御方法であって、
前記キャッシュメモリに対するアクセスが混雑しているかどうかを判定し、
混雑していると判定した場合に前記キャッシュメモリを制御して、前記複数のアクセラレータのうちの1のアクセラレータであって前記外部メモリで保存されている行列と他の行列との前記行列積演算を行う前記1のアクセラレータからのアクセスに応じて前記外部メモリより読み出された前記行列を、前記行列の各成分の値の精度を低下させる変換を行った上で転送させる、
ことを特徴とする演算システムの制御方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、演算システムおよび演算方法に関する。
続きを表示(約 1,500 文字)【背景技術】
【0002】
AI(人工知能:Artificial Intelligence)を実現する演算処理(以下、「AI処理」と称することとする)の高速化が求められており、そのための技術が幾つか提案されている(例えば特許文献1~特許文献5参照)。
【先行技術文献】
【特許文献】
【0003】
特表2022-523912号公報
特開2023-77818号公報
米国特許出願公開第2019/0354846号明細書
米国特許出願公開第2020/0258263号明細書
米国特許出願公開第2022/0044114号明細書
【発明の概要】
【発明が解決しようとする課題】
【0004】
AI処理の多くは、その処理の大部分を行列積演算が占めている。例えば、ディープニューラルネットワークモデルの実装によるAI処理では、前段の行列積演算による演算結果の行列を用いて次段の行列積演算を行うという処理が繰り返される。
【0005】
行列積演算に適した演算装置(アクセラレータ)を用いて高速なAI処理を実現する演算システムが広く知られている。集積度の向上などによるアクセラレータの高性能化によって行列積演算自体は高速化が進展している一方で、その演算結果を保存するメモリとの間でのデータ転送におけるメモリ帯域幅は性能向上が追いついていない。このことは、AI処理の高速化を妨げる要因のひとつとなっている。
【0006】
1つの側面では、本発明は、メモリ帯域幅を有効に利用することを目的とする。
【課題を解決するための手段】
【0007】
1つの実施形態では、演算システムが、複数のアクセラレータと、キャッシュメモリと、コントローラとを備える。複数のアクセラレータは行列積演算を行う。キャッシュメモリは、複数のアクセラレータのそれぞれによる演算結果を保存する外部メモリのデータをキャッシュする。コントローラは、キャッシュメモリに対するアクセスが混雑しているかどうかを判定し、混雑していると判定した場合にキャッシュメモリを制御する。この制御は、外部メモリで保存されている行列と他の行列との行列積演算を行うアクセラレータからのアクセスに応じて外部メモリより読み出された行列を、当該行列の各成分の値の精度を低下させる変換を行った上で転送させる制御である。
【発明の効果】
【0008】
1つの側面では、本発明は、メモリ帯域幅を有効に利用することが可能となる。
【図面の簡単な説明】
【0009】
AI処理における演算の流れを説明する図である。
演算システムの構成の一例を示す図である。
演算器の詳細構成の一例を説明する図である。
PEの内部構成の一例を示す図である。
指数部範囲テーブルの一例を示す図である。
アクセラレータが行う処理の第1の例の処理内容を示したフローチャートである。
アクセラレータが行う処理の第2の例の処理内容を示したフローチャートである。
メモリコントローラが行う処理の一例の処理内容を示したフローチャートである。
精度決定処理の一例の処理内容を示したフローチャートである。
読み出し処理の一例の処理内容を示したフローチャートである。
【発明を実施するための形態】
【0010】
以下、図面を参照しながら、実施形態を詳細に説明する。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

富士通株式会社
半導体装置
1か月前
富士通株式会社
半導体デバイス
1か月前
富士通株式会社
メッシュ微細化
1か月前
富士通株式会社
画像処理モデル
1か月前
富士通株式会社
演算器及び演算方法
1か月前
富士通株式会社
ポイントクラウド分類
1か月前
富士通株式会社
電子機器筐体及び電子機器
1か月前
富士通株式会社
OLT及びPONシステム
14日前
富士通株式会社
アレイアンテナモジュール
1か月前
富士通株式会社
光送信器及び光トランシーバ
1か月前
富士通株式会社
基板及びこれを備えた電子装置
1か月前
富士通株式会社
演算処理装置及び情報処理装置
24日前
富士通株式会社
プログラム及びデータ処理装置
8日前
富士通株式会社
テキスト案内される画像エディタ
1か月前
富士通株式会社
波長変換装置および波長変換方法
27日前
富士通株式会社
ラックマウント装置及びラック装置
27日前
富士通株式会社
メモリ管理装置及びメモリ管理方法
1か月前
富士通株式会社
受光デバイス及び受光デバイスの製造方法
13日前
富士通株式会社
通知プログラム、通知方法および通知装置
13日前
富士通株式会社
コンパイルプログラムおよびコンパイル方法
8日前
富士通株式会社
検出プログラム、検出方法および情報処理装置
27日前
富士通株式会社
生成プログラム、生成方法および情報処理装置
1か月前
富士通株式会社
プログラム、情報処理方法および情報処理装置
1か月前
富士通株式会社
ターゲット追跡のための方法、装置及び記憶媒体
24日前
富士通株式会社
プログラム、データ処理装置及びデータ処理方法
1か月前
富士通株式会社
半導体装置、半導体装置の製造方法及び電子装置
22日前
富士通株式会社
半導体装置、半導体装置の製造方法及び電子装置
6日前
富士通株式会社
探索プログラム、探索方法、および情報処理装置
1か月前
富士通株式会社
出張情報受付方法および出張情報受付プログラム
1か月前
富士通株式会社
キャッシュ装置およびキャッシュ装置の制御方法
1か月前
富士通株式会社
プログラム、データ処理方法およびデータ処理装置
1か月前
富士通株式会社
並列コンピューティング・カテゴリー分けプロセス
1か月前
富士通株式会社
データ処理装置、データ処理方法およびプログラム
21日前
富士通株式会社
光ネットワーク管理装置及び光ネットワーク管理方法
1か月前
富士通株式会社
情報出力プログラム、情報出力方法及び情報処理装置
28日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
13日前
続きを見る