TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025014032
公報種別
公開特許公報(A)
公開日
2025-01-28
出願番号
2024190377,2022562943
出願日
2024-10-30,2021-04-13
発明の名称
ニューラルネットワークパラメーターの表現の改良された概念
出願人
フラウンホーファー‐ゲゼルシャフト ツア フェルデルング デア アンゲヴァンテン フォルシュング アインゲトラーゲナー フェライン
代理人
個人
,
個人
主分類
G06N
3/0495 20230101AFI20250121BHJP(計算;計数)
要約
【課題】ニューラルネットワークパラメーターの効率的な符号化及び/又は復号化をサポートする。
【解決手段】量子化パラメーター142から乗数144及びビットシフト数146が導出可能であるように、NNパラメーターの量子化パラメーター及び量子化値152を決定することによって、NNパラメーターを量子化された値に量子化するNN表現を生成する装置100であって、NNパラメーターの量子化パラメーター及び量子化値の決定は、NNパラメーターの量子化された値が、量子化値と乗数に依存する因数148との積であり、ビットシフト数に依存するビット数だけビットシフトされた積に対応するように実行される。
【選択図】図2
特許請求の範囲
【請求項1】
NN表現(110)を生成する装置(100)であって、前記装置(100)は、
量子化パラメーター(142)から、
前記量子化パラメーター(142)によって導出された被除数と精度パラメーター(145)によって導出された除数との間の除算の剰余に基づく乗数(144)と、
前記除算の商の丸めに基づくビットシフト数(146)と、
が導出可能であるように、NNパラメーター(120)の前記量子化パラメーター(142)及び量子化値(152)を決定(140)することによって、前記NNパラメーター(120)を量子化された値(130)に量子化するように構成され、
それにより、前記NNパラメーター(120)の前記量子化された値(130)は、前記量子化値(152)と前記乗数(144)に依存する因数(148)との間の積であって、前記ビットシフト数(146)に依存するビット数だけビットシフトされた積に対応する、装置。
続きを表示(約 3,500 文字)
【請求項2】
請求項1に記載の装置(100)であって、前記精度パラメーター(145)を前記NN表現(110)に符号化するように更に構成されている、装置。
【請求項3】
請求項1又は2に記載の装置(100)であって、前記NNパラメーター(120)は、
一対のニューロン(10)間のニューロン間活性化フィードフォワード(12)に重み付けする重みパラメーター、
ニューラルネットワーク層のアフィン変換をパラメーター化するバッチノルムパラメーター、及び
所定のニューラルネットワークニューロン(10)のインバウンドニューロン間活性化フィードフォワード(12)の和にバイアスをかけるバイアス、
のうちの1つである、装置。
【請求項4】
請求項1~3のいずれか一項に記載の装置(100)であって、
前記NNパラメーター(120)は、NN(20)の複数のニューロン間活性化フィードフォワード(122)のうちの単一のニューロン間活性化フィードフォワード(12)に関して前記NN(20)をパラメーター化し、前記複数のニューロン間活性化フィードフォワード(122)の各々について、対応するNNパラメーター(120)が、前記NN表現(110)に含まれ、
前記装置(100)は、前記複数のニューロン間活性化フィードフォワード(122)の各々について、
前記それぞれのニューロン間活性化フィードフォワード(12)に関連付けられた関連量子化パラメーター(142)と、前記それぞれのニューロン間活性化フィードフォワード(12)に関連付けられた関連量子化値(152)と、を決定することによって、
前記対応するNNパラメーター(120)を対応する量子化された値(130)に量子化するように構成され、
それにより、前記関連量子化パラメーター(142)から、
前記関連量子化パラメーター(142)によって導出された被除数と、前記それぞれのニューロン間活性化フィードフォワード(12)に関連付けられた関連精度パラメーター(145)によって導出された除数との間の除算の剰余に基づいて、前記それぞれのニューロン間活性化フィードフォワード(12)に関連付けられた関連乗数(144)と、
前記除算の商の丸めに基づいて、前記それぞれのニューロン間活性化フィードフォワード(12)に関連付けられた関連ビットシフト数(146)と、が導出可能であり、
それにより、前記それぞれのニューロン間活性化フィードフォワード(12)の前記対応するNNパラメーター(120)の前記対応する量子化された値(130)は、前記関連量子化値(152)と前記関連乗数(144)に依存する因数(148)との間の積であって、前記関連ビットシフト数(146)に依存するビット数だけビットシフトされた積に対応する、装置。
【請求項5】
請求項1~3のいずれか一項に記載の装置(100)であって、
前記装置(100)は、NNの複数のニューロン間活性化フィードフォワード(122)をニューロン間活性化フィードフォワードのサブグループ(122a、122b)に細分するように構成され、それにより、各サブグループ(122a、122b)が、前記NN(20)の関連する一対のNN層に関連付けられ、前記関連する一対のNN層の間のニューロン間活性化フィードフォワード(12)を含み、前記関連する一対の層以外の更なる一対のNN層の間のニューロン間活性化フィードフォワード(12)を除外し、2つ以上のサブグループ(122a、122b)が、所定のNN層に関連付けられ、
前記NNパラメーター(120)は、前記NNの前記複数のニューロン間活性化フィードフォワード(122)のうちの単一のニューロン間活性化フィードフォワード(12)に関して前記NN(20)をパラメーター化し、前記複数のニューロン間活性化フィードフォワード(122)の各々について、対応するNNパラメーター(120)が、前記NN表現(110)に含まれ、前記装置(100)は、
ニューロン間活性化フィードフォワードの各サブグループ(122a、122b)について、
前記NN表現(110)から前記それぞれのサブグループ(122a、122b)に関連付けられた関連量子化パラメーター(142)を決定することであって、それにより、
前記関連量子化パラメーター(142)から、
前記関連量子化パラメーター(142)によって導出された被除数と、前記それぞれのサブグループ(122a、122b)に関連付けられた関連精度パラメーター(145)によって導出された除数との間の除算の剰余に基づいて、前記それぞれのサブグループ(122a、122b)に関連付けられた関連乗数(144)と、
前記除算の商の丸めに基づいて、前記それぞれのサブグループ(122a、122b)に関連付けられた関連ビットシフト数(146)と、が導出可能であることと、
前記複数のニューロン間活性化フィードフォワード(122)の各々について、
前記NN表現(110)から前記それぞれのニューロン間活性化フィードフォワード(12)に関連付けられた関連量子化値(152)を決定すること
によって、前記対応するNNパラメーター(120)を対応する量子化された値(130)に量子化することと、を行うように構成され、
前記それぞれのニューロン間活性化フィードフォワード(12)の前記対応するNNパラメーター(120)は、前記それぞれのニューロン間活性化フィードフォワード(12)が含まれる前記サブグループ(122a、122b)に関連付けられた、前記関連量子化値(152)と前記関連乗数(144)に依存する因数(148)との間の積であって、前記それぞれのニューロン間活性化フィードフォワード(12)が含まれる前記サブグループ(122a、122b)の前記関連ビットシフト数(146)に依存するビット数だけビットシフトされた積に対応する、装置。
【請求項6】
請求項4又は5に記載の装置(100)であって、前記関連精度パラメーター(145)は、前記NN(20)にわたって又は各NN層(114、116)内でグローバルに等しく評価される、装置。
【請求項7】
請求項4~6のいずれか一項に記載の装置(100)であって、前記関連精度パラメーター(145)を前記NN表現(110)に符号化するように構成されている、装置。
【請求項8】
請求項4~7のいずれか一項に記載の装置(100)であって、前記関連量子化パラメーター(142)を、基準量子化パラメーターとの差分の形態で前記NN表現(110)に符号化するように構成されている、装置。
【請求項9】
請求項1~8のいずれか一項に記載の装置(100)であって、
前記乗数(144)及び前記ビットシフト数(146)は、前記量子化パラメーター(142)から、
mul=k+QP%k
TIFF
2025014032000077.tif
10
40
に従って導出可能であり、式中、mulは、前記乗数(144)であり、shiftは、前記ビットシフト数(146)であり、QPは、前記量子化パラメーター(142)であり、kは、前記精度パラメーター(145)であり、
TIFF
2025014032000078.tif
10
21
は、そのオペランド以下の最大の整数を生成するフロア演算子であり、%は、x%yに対して
TIFF
2025014032000079.tif
10
31
を生成するモジュロ演算子であり、それにより、前記NNパラメーター(130)は、
(mul/k)・2
shift
・P
であり、式中、Pは、前記量子化値(152)である、装置。
【請求項10】
請求項1~9のいずれか一項に記載の装置(100)であって、前記精度パラメーター(145)は、2の累乗である、装置。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明による実施形態は、ニューラルネットワークパラメーターの表現の改善された概念を使用して、ニューラルネットワークパラメーターを符号化又は復号化する装置及び方法に関する。推論及び/又は記憶ビットレート最適化に関する改善を達成することができる。
続きを表示(約 2,000 文字)
【背景技術】
【0002】
ニューラルネットワークは、その最も基本的な形態において、一連のアフィン変換とそれに続く要素ごとの非線形関数とを構成する。図1に示すように、それらは有向非巡回グラフとして表すことができる。各ノードは、エッジのそれぞれの重み値との乗算によって次のノードに順方向伝搬される特定の値を伴う。次に、全ての入力値が単純に集約される。
【0003】
図1は、フィードフォワードニューラルネットワークのグラフ表現の例を示している。具体的には、この2層ニューラルネットワークは、4次元入力ベクトルを実線に写像する非線形関数である。
【0004】
数学的には、図1のニューラルネットワークは次の方法で出力を算出する。
output=L
2
(L
1
(input))
ここで、
L
i
(X)=N
i
(B
i
(X))
であり、式中、B
i
は層iのアフィン変換であり、N
i
は層iの何らかの非線形関数である。
【0005】
バイアス層
いわゆる「バイアス層」の場合、B
i
は、層iに関連する重みパラメーター(エッジ重み)W
i
と層iの入力X
i
との行列乗算と、それに続くバイアスb
i
との和である。
B
i
(X)=W
i
*X
i
+b
i
W
i
は、次元n
i
×k
i
を有する重み行列であり、X
i
は、次元k
i
×m
i
を有する入力行列である。バイアスb
i
は、長さn
i
の転置ベクトルである。演算子*は、行列乗算を示すものとする。バイアスb
i
との和は、行列の列に対する要素ごとの演算である。より正確には、W
i
*X
i
+b
i
は、b
i
がW
i
*X
i
の各列に追加されることを意味する。
【0006】
いわゆる畳み込み層は、非特許文献1に記載されているように、それらを行列-行列積としてキャストすることによって使用することもできる。
【0007】
以降、所与の入力から出力を算出する手順を推論と称する。また、中間結果を、隠れ層又は隠れ活性化値と称し、これは、例えば上記の第1の内積+非線形性の算出等、線形変換+要素ごとの非線形性を構成する。
【0008】
通常、ニューラルネットワークは、数百万のパラメーターを含むため、その表現のために数百メガバイトを必要とし得る。したがって、その推論手順には、大きな行列間の多くの内積演算の計算が含まれるため、その実行には高い計算リソースが必要となる。したがって、これらの内積を実行する複雑性を低減することが非常に重要である。
【0009】
バッチノルム層
ニューラルネットワーク層のアフィン変換のより洗練された変形例として、以下のような、いわゆるバイアス及びバッチノルム演算が挙げられる。
式1:
TIFF
2025014032000002.tif
25
103
ここで、μ、σ
2
、γ、及びβは、バッチノルムパラメーターを示す。なお、層インデックスiはここでは無視する。Wは、次元n×kを有する重み行列であり、Xは、次元k×mを有する入力行列である。バイアスb及びバッチノルムパラメーターμ、σ
2
、γ、及びβは、長さnの転置ベクトルである。演算子*は、行列乗算を示す。ベクトルを有する行列に対する他の全ての演算(加算、乗算、除算)は、行列の列に対する要素ごとの演算であることに留意されたい。例えば、X・γは、Xの各列がγと要素ごとに乗算されることを意味する。εは、0による除算を避けるために必要な小さなスカラー数(0.001等)である。ただし、0であってもよい。
【0010】
bの全てのベクトル要素が0に等しい場合、式1はバッチノルム層を指す。
対照的に、ε並びにμ及びβの全てのベクトル要素が0に設定され、γ及びσ
2
の全ての要素が1に設定される場合、バッチノルムのない層(バイアスのみ)が処理される。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
情報提示方法
1か月前
個人
プログラム
25日前
個人
自動精算システム
1か月前
個人
アカウントマップ
26日前
個人
プログラム
1か月前
個人
発想支援方法及びシステム
1か月前
個人
市場受発注システム
1か月前
個人
学習装置及び推論装置
25日前
個人
案件管理装置および端末装置
12日前
個人
分類処理プログラム及び方法
1か月前
井関農機株式会社
ロボット作業車両
1か月前
富士通株式会社
金融システム
1か月前
株式会社発明屋
電池指向の構造設計
19日前
トヨタ自動車株式会社
管理装置
20日前
富士通株式会社
プロセッサ
18日前
株式会社イズミ
総合代行システム
8日前
個人
ダブルオークションシステム
8日前
株式会社プレニーズ
仲介システム
26日前
トヨタ自動車株式会社
電気自動車
4日前
個人
販売支援システム
1か月前
村田機械株式会社
人員配置システム
1か月前
ブラザー工業株式会社
無線通信装置
1か月前
トヨタ自動車株式会社
情報通知方法
1か月前
トヨタ自動車株式会社
作業管理装置
1か月前
富士通株式会社
予測
11日前
NISSHA株式会社
入力装置
1か月前
AICRO株式会社
情報処理システム
1か月前
合同会社IPマネジメント
料金収受システム
11日前
株式会社SUBARU
車両用操作装置
4日前
トヨタ自動車株式会社
生成装置
1か月前
西日本電信電話株式会社
分析装置
11日前
斎久工業株式会社
衛生設備管理システム
1か月前
中国電力株式会社
業務依頼支援システム
1か月前
株式会社アジラ
行動体存在推定システム
18日前
トヨタ自動車株式会社
電池性能推定方法
11日前
マクセル株式会社
リーダライタ用ホルダ
11日前
続きを見る
他の特許を見る