TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025114507
公報種別
公開特許公報(A)
公開日
2025-08-05
出願番号
2025008120
出願日
2025-01-21
発明の名称
マシン学習アクセラレータ、マシン学習アクセラレータを含むコンピューティング装置、およびデータをマシン学習アクセラレータにロードする方法
出願人
三星電子株式会社
,
Samsung Electronics Co.,Ltd.
,
ネイバー コーポレーション
,
NAVER Corporation
代理人
弁理士法人ITOH
主分類
G06F
12/04 20060101AFI20250729BHJP(計算;計数)
要約
【課題】圧縮された重みデータをより短時間の間にロードするマシン学習アクセラレータを提供する。
【解決手段】コンピューティング装置10において、アクセラレータは、オリジナル長さ情報を記憶し、第1長さを有する第1データを圧縮解除する第1データコントローラ(CT)から、オリジナル長さを有する第2データを第1重みデータとして用いて、第1マシン学習ベース動作を遂行する第1アクセラレータコア(C)と、オリジナル長さ情報を記憶し、第1長さより短い第2長さを有する第3データを圧縮解除する第2データコントローラから、オリジナル長さを有する第4データを第2重みデータとして用いて、第2マシン学習ベース動作を遂行する第2アクセラレータコアと、を備え、第1、第2データコントローラのそれぞれは、オリジナル長さに基づいて圧縮解除が完了されるタイミングをモニタし、そして圧縮解除が完了されるタイミングに圧縮解除を終了する。
【選択図】図1
特許請求の範囲
【請求項1】
データのオリジナル長さを指すオリジナル長さ情報を記憶し、第1長さを有する第1データを受信し、前記第1長さを有する前記第1データを圧縮解除して前記オリジナル長さを有する第2データを生成し、前記オリジナル長さを有する前記第2データを出力するように構成される第1データコントローラと、
前記オリジナル長さ情報を記憶し、前記第1長さよりも短い第2長さを有する第3データを受信し、前記第2長さを有する前記第3データを圧縮解除して前記オリジナル長さを有する第4データを生成し、前記オリジナル長さを有する前記第4データを出力するように構成される第2データコントローラと、
前記オリジナル長さを有する前記第2データを受信し、前記第2データを第1重みデータとして用いて、第1マシン学習ベースの動作を遂行するように構成される第1アクセラレータコアと、
前記オリジナル長さを有する前記第4データを受信し、前記第4データを第2重みデータとして用いて、第2マシン学習ベースの動作を遂行するように構成される第2アクセラレータコアと、を備え、
前記第1データコントローラおよび前記第2データコントローラのそれぞれは、
前記オリジナル長さに基づいて圧縮解除が完了されるタイミングをモニタし、
前記圧縮解除が完了されるタイミングに前記圧縮解除を終了するように構成される、
マシン学習アクセラレータ。
続きを表示(約 2,600 文字)
【請求項2】
前記マシン学習アクセラレータは、前記第1データコントローラおよび前記第2データコントローラが、
前記第1データおよび前記第2データを並列に受信し、
前記第2データおよび前記第4データを並列に出力するように構成される、
請求項1に記載のマシン学習アクセラレータ。
【請求項3】
前記第1データコントローラおよび前記第2データコントローラのうちの少なくとも1つは、
前記第1データおよび前記第2データのうち対応するデータを受信するように構成され、対応するドレイン信号が非活性状態であるとき、前記対応するデータを出力するように構成されるドレイン回路と、
前記ドレイン回路から前記対応するデータを受信し、前記対応するデータを圧縮解除し、前記圧縮解除されたデータを出力するように構成される圧縮解除回路と、
前記オリジナル長さ情報が指すデータの圧縮解除が完了されたときに、前記対応するドレイン信号を活性化するように構成されるモニタ回路と、を含み、
前記対応するドレイン回路が活性状態となることに応答して、前記ドレイン回路は、前記対応するデータの出力を中止するように構成される、
請求項1に記載のマシン学習アクセラレータ。
【請求項4】
前記第1長さを有する前記第1データを読み取って、前記第1データコントローラの前記圧縮解除回路に前記第1データを伝達するように構成される第1DMAマスタと、
前記第2データを含み前記第1長さを有する第5データを読み取って、前記第2データコントローラの前記圧縮解除回路に前記第5データを伝達するように構成される第2DMAマスタと、をさらに備え、
前記第1DMAマスタおよび前記第2DMAマスタは、同じ開始アドレスおよび前記第1長さに基づいて同時にプログラムされる、
請求項3に記載のマシン学習アクセラレータ。
【請求項5】
前記第1データコントローラおよび前記第2データコントローラのそれぞれは、
前記第1データおよび前記第2データのうち対応するデータを受信するように構成され、前記対応するデータを圧縮解除し、前記圧縮解除されたデータを出力するように構成される圧縮解除回路と、
前記オリジナル長さ情報が指す前記対応するデータの前記圧縮解除が完了されたときに、リセット信号を活性化するように構成されるモニタ回路と、を含み、
前記リセット信号が活性化されるという判定に応答して、前記圧縮解除回路は、前記対応するデータの前記圧縮解除を中止するように構成される、
請求項4に記載のマシン学習アクセラレータ。
【請求項6】
前記モニタ回路は、前記リセット信号を外部の第1DMA(Direct Memory Access)マスタおよび外部の第2DMAマスタのうち対応するDMAマスタに伝送するように構成される、
請求項5に記載のマシン学習アクセラレータ。
【請求項7】
前記第1長さを有する前記第1データを読み取って、前記第1データコントローラの前記圧縮解除回路に前記第1データを伝達するように構成される第1DMAマスタと、
前記第2データを含み前記第1長さを有する第5データを読み取って、前記第2データコントローラの前記圧縮解除回路に前記第5データを伝達するように構成される第2DMAマスタと、をさらに含み、
前記第1データコントローラの前記モニタ回路により前記リセット信号が活性化されるという判定に応答して、前記第1DMAマスタは、前記第1データをリードすることを中止するように構成され、
前記第2データコントローラの前記モニタ回路により前記リセット信号が活性化されるという判定に応答して、前記第2DMAマスタは、前記第5データをリードすることを中止するように構成される、
請求項5に記載のマシン学習アクセラレータ。
【請求項8】
前記第1DMAマスタおよび前記第2DMAマスタは、同じ開始アドレスおよび前記第1長さに基づいて同時にプログラムされる、
請求項7に記載のマシン学習アクセラレータ。
【請求項9】
第1長さを有する第1データおよび前記第1長さよりも短い第2長さを有する第2データを記憶するメモリと、
前記メモリから前記第1データと、前記第1長さを有し、前記第2データを含む第3データとを受信するように構成されるマシン学習アクセラレータと、を備え、
前記マシン学習アクセラレータは、
前記第1長さを有する前記第1データを圧縮解除して第1重みデータを生成し、
前記第1長さを有する前記第3データを前記第2長さを有する前記第2データに変換し、
前記第2長さを有する前記第2データを圧縮解除して第2重みデータを生成し、
前記第1重みデータおよび前記第2重みデータに基づいてマシン学習ベースの動作を遂行するように構成される、
コンピューティング装置。
【請求項10】
プロセッサが、データをマシン学習アクセラレータにロードする方法であって、
前記プロセッサが、2つ以上のDMAマスタを第1開始アドレスおよび第1長さ情報を用いて同時にプログラムする段階と、
前記2つ以上のDMAマスタが、前記第1開始アドレスおよび前記第1長さ情報に基づいてメモリからデータを並列に読み取り、並列に読み取られたデータを前記マシン学習アクセラレータに伝送する段階と、を含み、
前記マシン学習アクセラレータは、
前記並列に読み取られたデータのうち、前記第1長さ情報に対応する第1データを圧縮解除して第1重みデータを生成し、
前記第1長さ情報に対応する第2データを変換して、前記第1長さ情報が指す第1長さより短い第2長さを有する第3データを生成し、
前記第2長さを有する前記第3データを圧縮解除して第2重みデータを生成し、
前記第1重みデータおよび前記第2重みデータに基づいてマシン学習ベースの動作を遂行するように構成される、
方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は電子装置に関し、より詳しくは、向上したデータローディング速度を有するマシン学習アクセラレータ、マシン学習アクセラレータを含むコンピューティング装置、およびデータをマシン学習アクセラレータにロードする方法に関する。
続きを表示(約 3,000 文字)
【背景技術】
【0002】
マシン学習アクセラレータは重みデータをロードして、マシン学習ベースの動作を遂行するように構成される。マシン学習と関連する技術が発展するにつれて、マシン学習アクセラレータにロードされるデータの容量が増加している。したがって、マシン学習アクセラレータに重みデータをロードする時間もまた増加している。
【0003】
マシン学習アクセラレータに重みデータをロードする時間を減らすために、重みデータは圧縮され得る。圧縮された重みデータはより短時間の間、マシン学習アクセラレータに伝達され得る。
【先行技術文献】
【特許文献】
【0004】
米国特許第10,546,393号明細書
米国特許第11,669,736号明細書
米国特許出願公開第2023/0059970号明細書
米国特許出願公開第2022/0398441号明細書
中国公開特許第111047020号公報
米国特許出願公開第2018/0082181号明細書
米国特許第11,632,129号明細書
米国特許出願公開第2021/0287074号明細書
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、上記従来技術に鑑みてなされたものであって、本発明の目的は、圧縮された重みデータをより短時間の間にロードできるマシン学習アクセラレータ、マシン学習アクセラレータを含むコンピューティング装置、およびデータをマシン学習アクセラレータにロードする方法を提供することにある。
【課題を解決するための手段】
【0006】
本発明の少なくとも1つの実施形態によれば、データのオリジナル長さを指すオリジナル長さ情報を記憶し、第1長さを有する第1データを受信し、第1長さを有する第1データを圧縮解除してオリジナル長さを有する第2データを生成し、オリジナル長さを有する第2データを出力するように構成される第1データコントローラと、オリジナル長さ情報を記憶し、第1長さよりも短い第2長さを有する第3データを受信し、第2長さを有する第3データを圧縮解除してオリジナル長さを有する第4データを生成し、オリジナル長さを有する第4データを出力するように構成される第2データコントローラと、オリジナル長さを有する第2データを受信し、第2データを第1重みデータとして用いて、第1マシン学習ベースの動作を遂行するように構成される第1アクセラレータコアと、オリジナル長さを有する第4データを受信し、第4データを第2重みデータとして用いて、第2マシン学習ベースの動作を遂行するように構成される第2アクセラレータコアと、を備え、第1データコントローラおよび第2データコントローラのそれぞれは、オリジナル長さに基づいて圧縮解除が完了されるタイミングをモニタし、圧縮解除が完了されるタイミングに圧縮解除を終了するように構成される、マシン学習アクセラレータである。
マシン学習アクセラレータ
【0007】
本発明の少なくとも1つの実施形態によれば、第1長さを有する第1データおよび第1長さよりも短い第2長さを有する第2データを記憶するメモリと、メモリから第1データと、第1長さを有し、第2データを含む第3データとを受信するように構成されるマシン学習アクセラレータと、を備え、マシン学習アクセラレータは、第1長さを有する第1データを圧縮解除して第1重みデータを生成し、第1長さを有する第3データを第2長さを有する第2データに変換し、第2長さを有する第2データを圧縮解除して第2重みデータを生成し、第1重みデータおよび第2重みデータに基づいてマシン学習ベースの動作を遂行するように構成される、コンピューティング装置である。
【0008】
本発明の少なくとも実施形態によれば、プロセッサが、データをマシン学習アクセラレータにロードする方法であって、プロセッサが、2つ以上のDMA(Direct Memory Access)マスタを第1開始アドレスおよび第1長さ情報を用いて同時にプログラムする段階と、2つ以上のDMAマスタが、第1開始アドレスおよび第1長さ情報に基づいてメモリからデータを並列に読み取り、並列に読み取られたデータをマシン学習アクセラレータに伝送する段階と、を含み、マシン学習アクセラレータは、並列に読み取られたデータのうち、第1長さ情報に対応する第1データを圧縮解除して第1重みデータを生成し、第1長さ情報に対応する第2データを変換して、第1長さ情報が指す第1長さより短い第2長さを有する第3データを生成し、第2長さを有する第3データを圧縮解除して第2重みデータを生成し、第1重みデータおよび第2重みデータに基づいてマシン学習ベースの動作を遂行するように構成される、方法である。。
【発明の効果】
【0009】
本発明の実施形態によれば、圧縮された重みデータをマシン学習アクセラレータにロードするDMA(Direct Memory Access)マスタは、同じ開始アドレスおよび同じ長さ情報を用いて同時にプログラムされ得る。したがって、圧縮された重みデータをローディングする時間が減少するマシン学習アクセラレータ、マシン学習アクセラレータを含むコンピューティング装置、およびデータをマシン学習アクセラレータにロードする方法が提供される。
【図面の簡単な説明】
【0010】
本発明の少なくとも1つの実施形態によるコンピューティング装置を示す。
アクセラレータにローディングされる重みデータの圧縮された実施形態の例を示す。
コンピューティング装置が、圧縮された重みデータをアクセラレータにロードする方法の例を示す。
コンピューティング装置が、圧縮された重みデータをストレージ装置からメモリにロードする方法の例を示す。
図4の方法により圧縮された重みデータをストレージ装置からメモリにロードする過程の例を示す。
コンピューティング装置が、アクセラレータに圧縮された重みデータをロードする方法の例を示す。
本発明の少なくとも1つの実施形態によるデータコントローラおよび関連する構成要素を示す。
ドレイン回路の動作方法の例を示す。
本発明の少なくとも1つの実施形態によるデータコントローラおよび関連する構成要素を示す。
本発明の少なくとも1つの実施形態によるデータコントローラおよび関連する構成要素を示す。
図10のデータコントローラのそれぞれの有効性モニタの動作方法の例を示す。
アクセラレータにローディングされる重みデータの圧縮された形態の別の例を示す。
図4の方法により圧縮された重みデータをストレージ装置からメモリにロードする過程の例を示す。
本発明の別の実施形態によるコンピューティング装置を示す。
【発明を実施するための形態】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
裁判のAI化
27日前
個人
情報処理システム
1か月前
個人
フラワーコートA
6日前
個人
検査システム
1か月前
個人
介護情報提供システム
13日前
個人
設計支援システム
19日前
個人
設計支援システム
19日前
株式会社サタケ
籾摺・調製設備
1か月前
個人
不動産売買システム
1か月前
キヤノン電子株式会社
携帯装置
1か月前
株式会社カクシン
支援装置
22日前
個人
備蓄品の管理方法
1か月前
個人
アンケート支援システム
8日前
キヤノン株式会社
情報処理装置
1か月前
個人
ジェスチャーパッドのガイド部材
12日前
サクサ株式会社
中継装置
1か月前
キヤノン株式会社
情報処理装置
1か月前
サクサ株式会社
中継装置
9日前
個人
リテールレボリューションAIタグ
5日前
キヤノン電子株式会社
名刺管理システム
1か月前
ホシデン株式会社
タッチ入力装置
1か月前
株式会社アジラ
移動方向推定装置
7日前
アスエネ株式会社
排水量管理方法
1か月前
株式会社寺岡精工
システム
12日前
株式会社ワコム
電子消去具
1か月前
東洋電装株式会社
操作装置
1か月前
東洋電装株式会社
操作装置
1か月前
株式会社東芝
電子機器
1か月前
株式会社JVCケンウッド
管理装置
1か月前
個人
パターン抽出方法及び通信多重化方法
1か月前
日本電気株式会社
システム及び方法
21日前
株式会社アザース
企業連携システム
13日前
飛鳥興産株式会社
物品買取システム
1日前
株式会社CBE-A
情報処理システム
1か月前
大王製紙株式会社
RFIDタグ
1か月前
ブラザー工業株式会社
プリンタ
今日
続きを見る
他の特許を見る