TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025065006
公報種別
公開特許公報(A)
公開日
2025-04-17
出願番号
2024165735
出願日
2024-09-25
発明の名称
演算装置および方法
出願人
三星電子株式会社
,
Samsung Electronics Co.,Ltd.
,
ネイバー コーポレーション
,
NAVER Corporation
代理人
弁理士法人ITOH
主分類
G06G
7/60 20060101AFI20250410BHJP(計算;計数)
要約
【課題】 一実施例は、異なるデータタイプを有する入力データに対する乗算演算を行うことができる演算装置および方法を提供する。
【解決手段】 一実施例に係る演算装置は、第1データタイプの第1入力データおよび前記第1データタイプと異なる第2データタイプの第2入力データを受信し、前記第1データタイプを示す第1信号、前記第2データタイプを示す第2信号、および前記第1入力データと前記第2入力データのビット(bit)数に基づいたクロック信号を出力する制御器と、前記第1信号、前記第2信号、および前記クロック信号に基づいて前記第1入力データおよび前記第2入力データに対する乗算演算を行って出力データを生成する演算回路と、を含み得る。
【選択図】図6
特許請求の範囲
【請求項1】
第1データタイプの第1入力データおよび前記第1データタイプと異なる第2データタイプの第2入力データを受信し、前記第1データタイプを示す第1信号、前記第2データタイプを示す第2信号、および前記第1入力データと前記第2入力データのビット(bit)数に基づいたクロック信号を出力する制御器と、
前記第1信号、前記第2信号、および前記クロック信号に基づいて前記第1入力データおよび前記第2入力データに対する乗算演算を行って出力データを生成する演算回路と、
を含む、演算装置。
続きを表示(約 1,500 文字)
【請求項2】
前記第1入力データは、符号データおよび整数データを含み、
前記第2入力データは、符号データ、指数データ、および仮数データを含む、請求項1に記載の演算装置。
【請求項3】
前記演算回路は、
前記出力データの符号データを、出力する第1回路と、
前記第1信号および前記第2信号に基づいて前記出力データの指数データを、出力する第2回路と、
前記クロック信号に基づいて前記出力データの仮数データを出力する第3回路と、を含む、請求項2に記載の演算装置。
【請求項4】
前記第1回路は、前記第1入力データの符号データと前記第2入力データの符号データを受信し、前記出力データの符号データを出力する排他的論理和(Exclusive OR、XOR)ゲートを含む、請求項3に記載の演算装置。
【請求項5】
前記第2回路は、
前記第2入力データの指数データを出力する、請求項3に記載の演算装置。
【請求項6】
前記第3回路は、
前記第1入力データの整数データに対応する第1データと前記第2入力データの仮数データに対応する第2データを受信し、前記第1データと前記第2データに対する乗算演算を行う、請求項3に記載の演算装置。
【請求項7】
第1ビット数の第1データと前記第1ビット数と異なる第2ビット数の第2データに対する乗算演算を行う演算装置であって、
前記第1ビット数に基づいてクロック信号のサイクル回数をカウンティングするカウンターの出力信号を受信する選択ノードおよび前記第1データのそれぞれのビット値を受信する複数の入力ノードを含む第1マルチプレクサーと、
前記第1マルチプレクサーの出力データを受信する選択ノード、第1値を受信する第1入力ノード、および前記第2データまたはシフタから前記第2データを1ビットずつシフトしたデータを受信する第2入力ノードを含む第2マルチプレクサーと、
前記クロック信号に基づいて前記第2マルチプレクサーの出力データを加算演算する第1加算器と、
を含む、演算装置。
【請求項8】
前記第1マルチプレクサーは、前記カウンターの出力信号に基づいて、前記第1データのビット値のうち、最下位ビット値から順次に1ビットずつ出力し、
前記第2マルチプレクサーは、前記第1マルチプレクサーの出力データが「0」であると、前記第1値を出力し、前記第1マルチプレクサーの出力データが「1」であると、前記第2データまたは前記シフタの出力データを出力する、請求項7に記載の演算装置。
【請求項9】
前記第1ビット数は、前記第2ビット数より少ない、請求項7に記載の演算装置。
【請求項10】
データを保存するメモリと、
前記メモリから入力データに対応する入力行列および重み行列を受信し、前記入力行列と前記重み行列に対する行列内積演算を行い、前記行列内積演算の実行結果を出力行列として出力するニューラルプロセッシングユニットと、
を含むニューラルプロセッシングシステムであって、
前記入力行列は、第1データタイプの要素(elements)を含み、前記重み行列は、前記第1データタイプと異なる第2データタイプの要素を含み、
前記ニューラルプロセッシングユニットは、前記第1データタイプおよび前記第2データタイプに基づいて、前記入力行列の要素の指数データまたは前記重み行列の要素の指数データを前記出力行列の要素の指数データとして出力する演算装置を含む、
ニューラルプロセッシングシステム。
発明の詳細な説明
【技術分野】
【0001】
開示内容は、演算装置および方法に関するものである。
続きを表示(約 2,400 文字)
【背景技術】
【0002】
人工知能(Artificial Intelligence)の一分野のディープラーニング(Deep Learning)は、複雑なデータのパターンを認識して精巧な予測を可能にする。一般に、ディープラーニングは、学習用データを活用してニューラルネットワークモデルを学習させる学習ステップ(training)と、学習済みのニューラルネットワークモデルに新たなデータを入力して出力を得る推論ステップ(inference)とから構成される。このようなディープラーニングは、ニューラルネットワークを深く構成するほどさらに精巧な予測が可能で性能を向上させることができる一方で、これは莫大な演算量によって、より多くの電力を必要とし、速度が低下するという問題がある。
【0003】
一方、ニューラルネットワークは、精巧な予測のために多くのレイヤーを含むことがあり、そのために演算の複雑度が増加することがある。したがって、演算の複雑度を減少させるために、浮動少数点データを整数にマッピングするなどのアルゴリズム軽量化技術が用いられている。
【発明の概要】
【発明が解決しようとする課題】
【0004】
一実施例は、異なるデータタイプを有する入力データに対する乗算および累積演算を行うことができる演算装置および方法を提供しようとする。
【0005】
一実施例は、異なる精度(precision)を有する入力データに対する乗算および累積演算を行うことができる演算装置および方法を提供しようとする。
【課題を解決するための手段】
【0006】
一実施例に係る演算装置は、第1データタイプの第1入力データおよび前記第1データタイプと異なる第2データタイプの第2入力データを受信し、前記第1データタイプを示す第1信号、前記第2データタイプを示す第2信号、および前記第1入力データと前記第2入力データのビット(bit)数に基づいたクロック信号を出力する制御器と、前記第1信号、前記第2信号、および前記クロック信号に基づいて前記第1入力データおよび前記第2入力データに対する乗算演算を行って出力データを生成する演算回路と、を含み得る。
【0007】
一実施例に係る演算装置は、第1ビット数の第1データと前記第1ビット数と異なる第2ビット数の第2データに対する乗算演算を行う演算装置であって、前記第1ビット数に基づいてクロック信号のサイクル回数をカウンティングするカウンターの出力信号を受信する選択ノードおよび前記第1データのそれぞれのビット値を受信する複数の入力ノードを含む第1マルチプレクサーと、前記第1マルチプレクサーの出力データを受信する選択ノード、第1値を受信する第1入力ノード、および前記第2データまたは前記第2データを1ビットずつシフトしたデータを受信する第2入力ノードを含む第2マルチプレクサーと、前記クロック信号に基づいて前記第2マルチプレクサーの出力データを加算演算する第1加算器と、を含み得る。
【0008】
一実施例に係るニューラルプロセッシングシステムは、データを保存するメモリと、前記メモリから入力データに対応する入力行列および重み行列を受信し、前記入力行列と前記重み行列に対する行列内積演算を行い、前記行列内積演算の実行結果を出力行列として出力するニューラルプロセッシングユニットを含むニューラルプロセッシングシステムであって、前記入力行列は、第1データタイプの要素(elements)を含み、前記重み行列は、前記第1データタイプと異なる第2データタイプの要素を含み、前記ニューラルプロセッシングユニットは、前記第1データタイプおよび前記第2データタイプに基づいて、前記入力行列の要素の指数データまたは前記重み行列の要素の指数データを前記出力行列の要素の指数データとして出力する演算装置を含み得る。
【図面の簡単な説明】
【0009】
図1は、一実施例に係るニューラルプロセッシングシステムを示すブロック図である。
図2は、一実施例に係るニューラルネットワーク演算を説明するための図である。
図3は、入力データフォーマットを説明するための図である。
図4は、比較例に係る演算回路を示す図である。
図5は、一実施例に係るニューラルプロセッシングユニットの動作方法を説明するためのフローチャートである。
図6は、一実施例に係る演算装置の概略的なブロック図である。
図7は、一実施例に係る演算回路の概略的なブロック図である。
図8は、一実施例に係る指数演算部を示す図である。
図9は、一実施例に係る仮数演算部を示す図である。
図10は、図9に係る仮数演算部の演算方法を説明するための図である。
図11は、一実施例に係る仮数演算部で行われる演算のタイミング図を示す。
図12は、他の実施例に係る仮数演算部で行われる演算のタイミング図を示す。
図13は、一実施例に係るマルチヘッドアテンションを説明するための例示的な図である。
図14は、図13のスケール化内積アテンションを説明するための例示的な図である。
【発明を実施するための形態】
【0010】
以下では、添付の図面を参考として、本発明の実施例に対して本発明の属する技術分野における通常の知識を有する者が容易に実施できるように詳しく説明する。しかし、本発明は、色々な異なる形態で具現することができ、ここで説明する実施例に限定されない。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
三星電子株式会社
表示装置
12日前
三星電子株式会社
半導体装置
1か月前
三星電子株式会社
半導体装置
3日前
三星電子株式会社
固体撮像素子
18日前
三星電子株式会社
集積回路素子
1か月前
三星電子株式会社
イメージセンサ
12日前
三星電子株式会社
半導体パッケージ
1か月前
三星電子株式会社
半導体メモリ素子
1か月前
三星電子株式会社
イメージセンサー
1か月前
三星電子株式会社
半導体パッケージ
3日前
三星電子株式会社
演算装置および方法
3日前
三星電子株式会社
もみ玉及びマッサージ装置
10日前
三星電子株式会社
ビットラインを含む半導体素子
13日前
三星電子株式会社
AD変換回路および固体撮像装置
3日前
三星電子株式会社
絶縁物質を含む半導体パッケージ
13日前
三星電子株式会社
キャパシタ構造物を含む半導体装置
26日前
三星電子株式会社
半導体パッケージ及びその製造方法
1か月前
三星電子株式会社
半導体素子及びこれを含む半導体パッケージ
1か月前
三星電子株式会社
メモリ動作モードを制御する電子装置及び方法
1か月前
三星電子株式会社
トランジスタおよびそれを含む半導体メモリ装置
1か月前
三星電子株式会社
アクセラレータ装置およびアクセラレータ装置を制御する方法
3日前
三星電子株式会社
イメージセンサー
1か月前
三星電子株式会社
ランプ信号生成器、及びそれを含むイメージセンサ、並びに電子装置
3日前
三星電子株式会社
量子ドット組成物、その製造方法、その硬化物、及びそれを含む表示装置
4日前
三星電子株式会社
超音波距離センサー及び該超音波距離センサーを利用した物体位置測定方法
3日前
三星電子株式会社
インク組成物およびその製造方法とこれから製造される複合体および電子素子
23日前
三星電子株式会社
カルコゲナイド基盤のメモリ物質、並びにそれを含むメモリ素子及び電子装置
20日前
三星電子株式会社
有機金属化合物、それを含むレジスト組成物、及びそれを利用したパターン形成方法
13日前
サムスン イーアンドエー カンパニー リミテッド
廃水処理方法及び廃水処理装置
1か月前
三星電子株式会社
浮動小数点型のデータに対する累積演算を遂行するように構成されたアクセラレータおよびその動作方法
13日前
個人
非正規コート
6日前
個人
人物再現システム
3日前
有限会社ノア
データ読取装置
4日前
個人
広告提供システムおよびその方法
6日前
株式会社ザメディア
出席管理システム
11日前
個人
日誌作成支援システム
3日前
続きを見る
他の特許を見る