TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025054266
公報種別公開特許公報(A)
公開日2025-04-07
出願番号2024164700
出願日2024-09-24
発明の名称浮動小数点型のデータに対する累積演算を遂行するように構成されたアクセラレータおよびその動作方法
出願人三星電子株式会社,Samsung Electronics Co.,Ltd.,ネイバー コーポレーション,NAVER Corporation
代理人弁理士法人ITOH
主分類G06F 17/10 20060101AFI20250328BHJP(計算;計数)
要約【課題】浮動小数点型データに対する累積演算を遂行するアクセラレータおよび動作方法を提供する。
【解決手段】方法は、2以上の第1データをロードし、2以上の第1データの指数のうち最大値である第1指数を探索し、第1指数に基づいて、第1データの第1仮数に対するビットシフトを遂行して整列された第1仮数を生成し、整列された第1仮数に対する累積演算を遂行して第1累積値を生成する。2以上の第2データをロードし、2以上の第2データの指数のうち最大値である第2指数を探索し、第2指数は第1指数よりも大きく、第2指数と第1指数との差に基づいて第1累積値に対するビットシフトを遂行して第1整列された累積値を生成し、第2指数に基づいて、第2データの第2仮数に対するビットシフトを遂行して整列された第2仮数を生成し、整列された第2仮数および第1整列された累積値に対する累積演算を遂行して第2累積値を生成する。
【選択図】図8
特許請求の範囲【請求項1】
複数のデータに対する累積演算を遂行するように構成されたアクセラレータの動作方法であって、
前記複数のデータのうち少なくとも2つの第1データをロードする段階と、
前記少なくとも2つの第1データの指数のうち最大値である第1指数を探索する段階と、
前記第1指数に基づいて、前記少なくとも2つの第1データの第1仮数に対するビットシフトを遂行して整列された第1仮数を生成し、前記整列された第1仮数に対する累積演算を遂行して第1累積値を生成する段階と、
前記複数のデータのうち少なくとも2つの第2データをロードする段階と、
前記少なくとも2つの第2データの指数のうち最大値である第2指数を探索し、前記第2指数は前記第1指数よりも大きい段階と、
前記第2指数と前記第1指数との差に基づいて前記第1累積値に対するビットシフトを遂行して第1整列された累積値を生成し、前記第2指数に基づいて前記少なくとも2つの第2データの第2仮数に対するビットシフトを遂行して整列された第2仮数を生成し、前記整列された第2仮数および前記第1整列された累積値に対する累積演算を遂行して第2累積値を生成する段階と、を備え、
前記複数のデータのそれぞれは、浮動小数点型を有する、動作方法。
続きを表示(約 1,000 文字)【請求項2】
前記第1指数に関する情報を最大指数として記憶する段階と、をさらに備える、請求項1に記載の動作方法。
【請求項3】
前記第2指数が前記第1指数よりも大きい場合、前記最大指数を前記第2指数に更新する段階と、をさらに備える、請求項2に記載の動作方法。
【請求項4】
前記複数のデータのうち少なくとも2つの第3データをロードする段階と、
前記少なくとも2つの第3データの指数のうち最大値である第3指数を探索し、前記第3指数は前記第2指数よりも大きくない段階と、
前記第3指数に基づいて、前記少なくとも2つの第3データの第3仮数に対するビットシフトを遂行して整列された第2仮数を生成し、前記整列された第2仮数および前記第2累積値に対する累積演算を遂行して第3累積値を生成する段階と、をさらに備える、請求項1~3のいずれか一項に記載の動作方法。
【請求項5】
前記第3累積値および前記第2指数に基づいて正規化を遂行して出力値を生成する段階と、をさらに備え、
前記出力値は、前記浮動小数点型を有する、請求項4に記載の動作方法。
【請求項6】
前記整列された第1仮数に対する累積演算、並びに前記整列された第2仮数および前記第1整列された累積値に対する累積演算は、整数型加算によって遂行される、請求項1~3のいずれか一項に記載の動作方法。
【請求項7】
前記第1累積値に対するビットシフトは、クロック信号の周期に同期して1ビットずつ遂行される、請求項1~3のいずれか一項に記載の動作方法。
【請求項8】
前記第1累積値に対するビットシフトが遂行されているうち、前記整列された第2仮数の入力が停止される、請求項7に記載の動作方法。
【請求項9】
前記アクセラレータは、N個のデータに対する累積演算を並列に遂行するように構成され、
前記少なくとも2つの第1データの個数および前記少なくとも2つの第2データの個数のそれぞれは、前記Nより小さい、請求項1~3のいずれか一項に記載の動作方法。
【請求項10】
前記複数のデータの個数は前記Nより大きく、前記複数のデータに対する累積演算が全て完了した後、前記アクセラレータは、前記累積演算の結果に対する正規化を遂行する、請求項9に記載の動作方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、人工知能システムに関し、より詳しくは、浮動小数点型のデータに対する累積演算を遂行するように構成されたアクセラレータおよびその動作方法に関する。
続きを表示(約 2,500 文字)【背景技術】
【0002】
人工知能(AI:Artificial Intelligence)は、人間の学習、推論、知覚のような多様な能力を人工的に実現するコンピュータサイエンスの一分野である。最近、人工知能は、自然言語の理解、自然言語の翻訳、ロボティクス、人工視覚、問題解決、学習、知識の獲得、認知科学のような多様な分野で広く活用される。
【0003】
人工知能は、多様なアルゴリズムに基づいて実現されている。一例として、ニューラルネットワーク(neural network)は、ノード(node)およびシナプス(synapse)が繰り返し連結された複雑なネットワークから構成される。現在のノードから次のノードにデータが移動する過程で、対応するシナプスに応じて多様な信号処理が発生することができ、このような信号処理過程はレイヤと呼ばれる。すなわち、ニューラルネットワークは、複雑に相互連結された多様なレイヤを含み得る。ニューラルネットワークに含まれる多様なレイヤは大量の演算を必要とすることから、これを最適化するための多様な方法が研究されている。
【先行技術文献】
【特許文献】
【0004】
米国特許出願公開第2021/0182024号明細書
米国特許第5,021,986号明細書
米国特許出願公開第2023/0008856号明細書
公開特許第2001-043067号明細書
米国特許出願公開第2021/0312012号明細書
米国特許第6,363,476号明細書
米国特許第9,274,750号明細書
【非特許文献】
【0005】
「WINNING BOTH THE ACCURACY OF FLOATING POINT ACTIVATION AND THE SIMPLICITY OF INTEGER ARITHMETIC」Yulhwa Kim Et al., Published as a conference paper at ICLR 2023
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、上記従来技術に鑑みてなされたものであって、本発明の目的は、向上した信頼性および向上した性能を有する、浮動小数点型のデータに対する累積演算を遂行するように構成されたアクセラレータおよびその動作方法を提供することにある。
【課題を解決するための手段】
【0007】
本発明の一実施形態によれば、複数のデータに対する累積演算を遂行するように構成されたアクセラレータの動作方法は、前記複数のデータのうち少なくとも2つの第1データをロードする段階と、前記少なくとも2つの第1データの指数のうち最大値である第1指数を探索する段階と、前記第1指数に基づいて、前記少なくとも2つの第1データの第1仮数に対するビットシフトを遂行して整列された第1仮数を生成し、前記整列された第1仮数に対する累積演算を遂行して第1累積値を生成する段階と、前記複数のデータのうち少なくとも2つの第2データをロードする段階と、前記少なくとも2つの第2データの指数のうち最大値である第2指数を探索し、前記第2指数は前記第1指数よりも大きい段階と、前記第2指数と前記第1指数との差に基づいて前記第1累積値に対するビットシフトを遂行して第1整列された累積値を生成し、前記第2指数に基づいて前記少なくとも2つの第2データの第2仮数に対するビットシフトを遂行して整列された第2仮数を生成し、前記整列された第2仮数および前記第1整列された累積値に対する累積演算を遂行して第2累積値を生成する段階と、を備え、前記複数のデータのそれぞれは浮動小数点型を有する。
【0008】
本発明の一実施形態によれば、複数のデータに対する累積演算を遂行するように構成されたアクセラレータは、前記複数のデータを格納するように構成されたユニファイドバッファ部と、前記複数のデータのうち少なくとも2つの第1データをロードし、前記少なくとも2つの第1データの指数のうち最大値である第1最大指数を探索し、前記第1最大指数および前の最大指数に基づいて、前記少なくとも2つの第1データの仮数に対するビットシフトを遂行して、第1整列された仮数を生成するように構成された事前整列部と、前の最大指数および前記第1最大指数に基づいて、前の累積値に対するビットシフトを遂行して整列された累積値を生成し、前記整列された累積値および前記第1仮数に対する累積演算を遂行するように構成された複数の処理部と、前記第1最大指数に基づいて前記複数の処理部の演算結果に対する正規化を遂行して出力値を生成するように構成された正規化部と、を備え、前記複数のデータのそれぞれは、浮動小数点型である。
【0009】
本発明の一実施形態によれば、複数のデータに対する累積演算を遂行するように構成されたアクセラレータの動作方法は、複数のデータのうち少なくとも2つのデータに対する累積演算を遂行し、第0最大指数および第0累積値を生成する段階と、前記複数のデータのうち、第1データの第1指数が前記第0最大指数より大きい場合、前記第1指数および前記第0最大指数に基づいて前記第0累積値に対するビットシフトを遂行して第0整列された累積値を生成する段階と、前記第1データの第1仮数および前記第0整列された累積値に対する累積演算を遂行して第1累積値を生成する段階と、を備え、前記複数のデータのそれぞれは、浮動小数点型を有する。
【発明の効果】
【0010】
本発明によれば、向上した信頼性および向上した性能を有する、浮動小数点型のデータに対する累積演算を遂行するように構成されたアクセラレータおよびその動作方法が提供される。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
非正規コート
25日前
個人
RFタグ読取装置
7日前
個人
在宅介護システム
7日前
個人
人物再現システム
22日前
個人
AI飲食最適化プラグイン
15日前
個人
電話管理システム及び管理方法
16日前
有限会社ノア
データ読取装置
23日前
個人
広告提供システムおよびその方法
25日前
株式会社ザメディア
出席管理システム
1か月前
株式会社CROSLAN
支援装置
7日前
個人
日誌作成支援システム
22日前
ひびきの電子株式会社
認証システム
9日前
株式会社タクテック
商品取出集品システム
29日前
個人
ポイント還元付き配送システム
23日前
トヨタ自動車株式会社
作業判定方法
1か月前
長屋印刷株式会社
画像形成システム
7日前
ミサワホーム株式会社
情報処理装置
29日前
トヨタ自動車株式会社
工程計画装置
1か月前
オムロン株式会社
回転装置及びマウス
11日前
オベック実業株式会社
接続構造
22日前
トヨタ自動車株式会社
情報処理システム
1か月前
株式会社村田製作所
動き検知装置
29日前
個人
アルバム作成システム及びアルバム作成方法
9日前
株式会社実身美
ワーキングシェアリングシステム
23日前
株式会社ドクター中松創研
生成AIの適切使用法
22日前
トヨタ自動車株式会社
情報処理方法
1か月前
個人
コンテンツ配信システム
29日前
株式会社エスシーシー
置き配システム
23日前
ブラザー工業株式会社
ラベルプリンタ
1か月前
株式会社デンソー
電子制御装置
1日前
個人
プラットフォームシステム
29日前
株式会社半導体エネルギー研究所
情報処理システム
7日前
株式会社知財事業研究所
運行計画作成システム
29日前
アスエネ株式会社
温室効果ガス排出量管理方法
8日前
アスエネ株式会社
温室効果ガス排出量管理方法
8日前
アスエネ株式会社
温室効果ガス排出量管理方法
8日前
続きを見る