TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025084650
公報種別公開特許公報(A)
公開日2025-06-03
出願番号2024006426
出願日2024-01-18
発明の名称ソフトマックス関数計算の近似法並びにこのソフトマックス関数計算の近似法を応用したニューラルネットワーク
出願人耐能智慧股ふん有限公司,Kneron (Taiwan) Co., Ltd.
代理人個人
主分類G06N 3/048 20230101AFI20250527BHJP(計算;計数)
要約【課題】計算時間を縮減でき、エネルギーの消耗を減少できるソフトマックス関数計算の近似法及びニューラルネットワークを提供する。
【解決手段】ソフトマックス関数計算の近似法は、k次元ベクトルの入力値をm次元ベクトルの出力値に変換させ、指数近似計算順序、加法計算順序及び除法計算順序と、を含む。指数近似計算順序は、k次元ベクトルの入力値を漏洩正規化線形ユニット(漏洩ReLU)計算を行うことによって正規化関数計算値を得た後、この正規化関数計算値に基づいて所定次数の多項式関数計算を行って指数近似値を得、さらにもう一つの入力値をその指数近似計算順序を繰り返すことによりもう一つの指数近似値を得る。加法計算順序は、指数近似値ともう一つの指数近似値を足した合計値を得る。除法計算順序は、指数近似計算順序で得られた指数近似値の中に少なくとも一つの指数近似値を合計値で割ってm次元ベクトルの出力値を得る。
【選択図】図7
特許請求の範囲【請求項1】
k次元ベクトルの入力値をm次元ベクトルの出力値に変換させるソフトマックス関数計算の近似法であって、
前記k次元ベクトルの入力値を漏洩正規化線形ユニット関数(LeakyReLU function)計算を行うことによって正規化関数計算値を得た後、前記正規化関数計算値に基づいて一定次数の多項式関数計算を行って指数近似値を得、さらにk次元ベクトルのもう一つの入力値を以上の順序を繰り返すことによりもう一つの指数近似値が得られる指数近似計算順序と、前記指数近似値と前記もう一つの指数近似値を足した合計値が得られる加法計算順序と、前記指数近似計算順序で得られた前記指数近似値の中に少なくとも一つの指数近似値を前記合計値で割ってm次元ベクトルの出力値が得られる除法計算順序と、を備えるソフトマックス関数計算の近似法。
続きを表示(約 1,300 文字)【請求項2】
前記指数近似計算順序において、入力値を先にクランプ関数計算を行った後、さらに前記漏洩正規化線形ユニット関数計算を行うことを特徴とする請求項1のソフトマックス関数計算の近似法。
【請求項3】
前記加法計算順序において、前記合計値はさらに保護値を足して、前記合計値の絶対値がゼロより大きいことを確保することを特徴とする請求項2のソフトマックス関数計算の近似法。
【請求項4】
一定次数の多項式関数計算は2次から5次の多項式計算であることを特徴とする請求項1のソフトマックス関数計算の近似法。
【請求項5】
前記指数近似計算順序は、各入力値が前記漏洩正規化線形ユニット関数計算を経て各正規化関数計算値を得た後、さらに前記各正規化関数計算値によって一定次数の多項式関数計算を行って前記各入力値に対応する指数近似値を得るまで繰り返され;加法計算順序は、すべての指数近似値を足した合計値が得られ;除法計算順序は、指数近似計算順序で得られた指数近似値のすべての指数近似値を前記合計値で割って複数のk次元ベクトルに対応するm次元ベクトルの出力値が得られることを特徴とする請求項1のソフトマックス関数計算の近似法。
【請求項6】
前記入力値は整数型の数値であることを特徴とする請求項1のソフトマックス関数計算の近似法。
【請求項7】
ニューラルネットワークであって、
前記ニューラルネットワークの分類マシンにk次元ベクトルの入力値をm次元ベクトルの出力値に変換させるソフトマックス関数計算モジュールを備え、
前記ソフトマックス関数計算モジュールは、
前記k次元ベクトルの入力値を漏洩正規化線形ユニット関数計算を行うことによって正規化関数計算値を得、そして前記正規化関数計算値に基づいて一定次数の多項式関数計算を行って指数近似値を得た後、さらにもう一つの入力値を前記漏洩正規化線形ユニット関数計算と前記一定次数の多項式関数計算を繰り返すことによりもう一つの指数近似値が得られる指数近似計算ユニットと、前記指数近似値ともう一つの指数近似値を足した合計値が得られる加法計算ユニットと、指数近似計算ユニットで得たそれらの指数近似値の少なくとも一つの指数近似値を合計値で割ってm次元ベクトルの出力値が得られる除法計算ユニットと、を備えることを特徴とするニューラルネットワーク。
【請求項8】
前記指数近似計算順序では先に入力値をクランプ関数計算を行った後、さらに前記漏洩正規化線形ユニット関数計算を行うことを特徴とする請求項7のニューラルネットワーク。
【請求項9】
前記合計値はさらに保護値を足して、前記合計値の絶対値がゼロより大きいことを確保することを特徴とする請求項8のニューラルネットワーク。
【請求項10】
前記一定次数の多項式計算は2次から5次の多項式計算であることを特徴とする請求項7のニューラルネットワーク。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明はソフトマックス関数計算の近似法並びにこのソフトマックス関数計算の近似法を応用したニューラルネットワークに関し、特に人工知能ディープラーニングモデルの分類マシンに使用されるソフトマックス関数計算の近似法並びにこのソフトマックス関数計算の近似法を応用したニューラルネットワークに関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
人工知能(AI)は通常、普通のコンピュータープログラムによって人間の知的能力を表す技術である。AIの最も主要な一環は、機械学習と認知科学領域において、生物のニューラルネットワークの構造と機能を模した数学モデルまたは計算モデルであり、さらに関数に対して推算する近似の人工ニューラルネットワークである。よく見られるニューラルネットワークモデルは例えば畳み込みニューラルネットワークと再帰型ニューラルネットワーク(CNNとRNN)があり、近年はTransformerモデルが開発され、Transformerモデルは徐々に畳み込みニューラルネットワークと再帰型ニューラルネットワーク(CNNとRNN)の代わりになる傾向が見受けられ、最も人気なディープラーニングモデルとなりつつある。
【0003】
図1に示すように、上記のニューラルモデルのいずれにしても、そのほとんどは少なくとも特徴学習マシン(feature learning)81と、分類マシン(classification)82とを含む。ニューラルモデルの分類マシン82において通常はソフトマックス関数(softmax function)821が採用され、0~1の間にある少なくとも一つの出力値を出力する。
【0004】
従来のソフトマックス関数の展開式は数式1である。
【0005】
TIFF
2025084650000002.tif
43
147
【0006】
一般的に、ソフトマックス関数(数式1)による計算はi次元ベクトルの入力値をj次元ベクトルの出力値に変換させられ、j次元ベクトルの各出力値は通常0~1の間にある数値であり、その数値の合計が1である。
【0007】
さらに、市販されるGPU(例えば、Nvidia社)に関わるソフトマックス関数計算のほとんどは数式1のsoftmax関数を採用し、入力値はfloat32形式によりソフトマックス関数の計算を実現させる。しかし、実際に指数関数の計算をする時に多項式の次数が多く、また入力値はfloat32形式を採用しているため、分類マシンの計算過程において大量な数値計算を処理する必要があり、時間とエネルギーが消耗される問題がある。そのため、簡単なsoftmax関数計算を提供するとともに、ニューラルネットワークの分類マシンの計算過程を時短に、省エネできるようにすることは実に重要な課題である。
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明の目的は、計算時間を削減できるとともに、エネルギー消費も削減できるソフトマックス関数計算の近似法を提供する。また、本発明におけるもう一つの目的は、計算時間を削減できるとともに、エネルギー消費も削減できるこのソフトマックス関数計算の近似法を応用したニューラルネットワークを提供する。
【課題を解決するための手段】
【0009】
上述の目的を達成するために、本発明のソフトマックス関数計算の近似法に基づき、k次元ベクトルの入力値をm次元ベクトルの出力値に変換させる。ソフトマックス関数計算の近似法は、k次元ベクトルの入力値を漏洩正規化線形ユニット計算(漏洩ReLU)を行うことによって正規化関数計算値を得、そしてこの正規化関数計算値に基づいて一定次数の多項式関数計算を行って指数近似値を得た後、さらにもう一つの入力値でその順序を繰り返すことによりもう一つの指数近似値が得られる指数近似計算順序と、その指数近似値ともう一つの指数近似値を足した合計値が得られる加法計算順序と、指数近似計算順序で得られた指数近似値の中に少なくとも一つの指数近似値を合計値で割ってm次元ベクトルの出力値が得られる除法計算順序と、を備える。
【0010】
一実施例において、指数近似計算順序において、入力値を先にクランプ関数(clamp function)計算を行った後、さらに漏洩ReLU計算を行う。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
物品給付年金
21日前
個人
政治のAI化
16日前
個人
非正規コート
1か月前
個人
人物再現システム
1か月前
個人
RFタグ読取装置
1か月前
個人
在宅介護システム
1か月前
個人
プラグインホームページ
7日前
個人
AI飲食最適化プラグイン
1か月前
キヤノン株式会社
通信装置
22日前
有限会社ノア
データ読取装置
1か月前
個人
電話管理システム及び管理方法
1か月前
株式会社ザメディア
出席管理システム
1か月前
キヤノン株式会社
画像処理装置
14日前
個人
広告提供システムおよびその方法
1か月前
個人
全アルゴリズム対応型プログラム
17日前
個人
日誌作成支援システム
1か月前
株式会社CROSLAN
支援装置
1か月前
シャープ株式会社
電子機器
16日前
大同特殊鋼株式会社
輝線検出方法
16日前
ミサワホーム株式会社
宅配ロッカー
13日前
長屋印刷株式会社
画像形成システム
1か月前
ミサワホーム株式会社
情報処理装置
21日前
個人
ポイント還元付き配送システム
1か月前
トヨタ自動車株式会社
工程計画装置
1か月前
トヨタ自動車株式会社
作業判定方法
1か月前
パテントフレア株式会社
交差型バーコード
9日前
株式会社アジラ
データ転送システム
16日前
トヨタ自動車株式会社
欠け検査装置
16日前
ミサワホーム株式会社
情報処理装置
1か月前
ひびきの電子株式会社
認証システム
1か月前
株式会社タクテック
商品取出集品システム
1か月前
オムロン株式会社
回転装置及びマウス
1か月前
Sansan株式会社
組織図生成装置
2日前
オベック実業株式会社
端末用スタンド
17日前
株式会社ユピテル
電子機器及びプログラム等
24日前
トヨタ自動車株式会社
管理装置
13日前
続きを見る