TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024095236
公報種別公開特許公報(A)
公開日2024-07-10
出願番号2022212372
出願日2022-12-28
発明の名称機械学習プログラム、機械学習方法、及び、情報処理装置
出願人富士通株式会社
代理人弁理士法人真田特許事務所,個人
主分類G06N 3/082 20230101AFI20240703BHJP(計算;計数)
要約【課題】アテンション構造を含むニューラルネットワークの軽量化を実現する。
【解決手段】機械学習プログラムは、アテンション構造160を備えるニューラルネットワーク180の訓練済機械学習モデルにおける、前記アテンション構造の入力テンソルに対する演算処理結果としてQueryを出力するQ層161及びKeyを出力するK層162の各々の要素について、第1削減割合に基づく要素の削減後のQ層からのテンソルQTに含まれる1以上の要素と、第2削減割合に基づく要素の削減後のK層からのテンソルKTに含まれる1以上の要素とのうち、同一のインデックスを持つ要素どうしのみを前記テンソルQT及びKTに残すように、前記テンソルQT及びKTのうちの少なくとも一方に含まれる要素を削除する、処理をコンピュータに実行させる。
【選択図】図19
特許請求の範囲【請求項1】
アテンション構造を備えるニューラルネットワークの訓練済機械学習モデルにおける、前記アテンション構造の入力テンソルに対する演算処理結果としてQueryを出力するQ層及びKeyを出力するK層の各々の要素について、
第1削減割合に基づく要素の削減後のQ層からのテンソルQTに含まれる1以上の要素と、第2削減割合に基づく要素の削減後のK層からのテンソルKTに含まれる1以上の要素と、のうち、同一のインデックスを持つ要素どうしのみを前記テンソルQT及び前記テンソルKTに残すように、前記テンソルQT及び前記テンソルKTのうちの少なくとも一方に含まれる要素を削除する、
処理をコンピュータに実行させる、機械学習プログラム。
続きを表示(約 1,500 文字)【請求項2】
前記削除する処理は、
前記テンソルQTに含まれるゼロ以外の要素の第1インデックスと、前記テンソルKTに含まれるゼロ以外の要素の第2インデックスとの論理積を算出し、
前記論理積に含まれないインデックスの要素を、前記テンソルQT又は前記テンソルKTから削除する、処理を含む、
請求項1に記載の機械学習プログラム。
【請求項3】
前記アテンション構造がマルチヘッドアテンション構造であって、前記Q層と、前記K層と、前記アテンション構造において前記入力テンソルに対する演算処理結果としてValueを出力するV層と、の各々が複数のヘッドのそれぞれのテンソルを出力する場合、前記V層の後段に、テンソルの1以上の要素のパディングを行なうパディング層を挿入し、
第3削減割合に基づく要素の削減後のV層からのテンソルVTのヘッド間で要素数が同一の数となるように、前記パディング層によるパディングを行なう、
処理を前記コンピュータに実行させる、請求項1又は請求項2に記載の機械学習プログラム。
【請求項4】
前記テンソルQTと、前記テンソルKTと、前記テンソルVTと、のそれぞれのヘッドのうち、全ての要素がゼロであるヘッドと同一のヘッドインデックスを持つヘッドを、前記テンソルQT、前記テンソルKT及び前記テンソルVTから削除する、
処理を前記コンピュータに実行させる、請求項3に記載の機械学習プログラム。
【請求項5】
前記アテンション構造は、前記要素の削除及び前記ヘッドの削除後のテンソルQTと前記要素の削除及び前記ヘッドの削除後のテンソルKTとの行列積を正規化して得た行列積と、前記ヘッドの削除及び前記パディング後のテンソルVTと、に基づく行列積を出力する、
請求項4に記載の機械学習プログラム。
【請求項6】
前記ニューラルネットワークは、前記アテンション構造から出力される前記行列積の要素を結合した結果を出力する、
請求項5に記載の機械学習プログラム。
【請求項7】
アテンション構造を備えるニューラルネットワークの訓練済機械学習モデルにおける、前記アテンション構造の入力テンソルに対する演算処理結果としてQueryを出力するQ層及びKeyを出力するK層の各々の要素について、
第1削減割合に基づく要素の削減後のQ層からのテンソルQTに含まれる1以上の要素と、第2削減割合に基づく要素の削減後のK層からのテンソルKTに含まれる1以上の要素とのうち、同一のインデックスを持つ要素どうしのみを前記テンソルQT及び前記テンソルKTに残すように、前記テンソルQT及び前記テンソルKTのうちの少なくとも一方に含まれる要素を削除する、
処理をコンピュータが実行する、機械学習方法。
【請求項8】
アテンション構造を備えるニューラルネットワークの訓練済機械学習モデルにおける、前記アテンション構造の入力テンソルに対する演算処理結果としてQueryを出力するQ層及びKeyを出力するK層の各々の要素について、
第1削減割合に基づく要素の削減後のQ層からのテンソルQTに含まれる1以上の要素と、第2削減割合に基づく要素の削減後のK層からのテンソルKTに含まれる1以上の要素とのうち、同一のインデックスを持つ要素どうしのみを前記テンソルQT及び前記テンソルKTに残すように、前記テンソルQT及び前記テンソルKTのうちの少なくとも一方に含まれる要素を削除する、
制御部を備える、情報処理装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、機械学習プログラム、機械学習方法、及び、情報処理装置に関する。
続きを表示(約 1,300 文字)【背景技術】
【0002】
画像処理等のAI(Artificial Intelligence)タスクに利用されるNN(Neural Network)は、その構成を複雑にすることで高い性能(例えば高い推論精度)を実現できる傾向にある。一方で、NNの構成の複雑化により、計算機によるNNの実行における演算回数、及び、当該計算機がNNの実行に用いるメモリサイズが増加し得る。
【0003】
当該演算回数の削減、換言すれば演算時間の短縮(高速化)、並びに、当該メモリサイズの削減、換言すればNNの機械学習モデルの軽量化を図るための手法として、「プルーニング」(枝刈り;Pruning)が知られている。
【0004】
プルーニングは、NNのエッジ(重み)、ノード、及び、チャネルの少なくともいずれか1種類の要素を削減する(刈り取る)ことで、機械学習モデルのデータサイズを小さくし、演算時間及び通信時間を削減する手法である。
【0005】
過剰なプルーニングは、NNの推論精度の劣化を引き起こす。このため、推論精度を維持したまま、又は、推論精度の低下量を所定の水準に留めたまま、NNのプルーニングを行なうことが重要である。
【0006】
例えば、プルーニングにおいて、NNの推論精度に大きな影響を与えないレイヤ(層)を選択する手法が知られている。当該手法は、例えば、畳込み層に続くバッチノーマライゼーション(BN;Batch Normalization)層に用いられるパラメータに基づき、プルーニングを行なう畳込み層のチャネルを決定する手法である。
【0007】
また、マルチヘッドアテンション(Multi-Head Attention:MHA)構造等のアテンション構造を備えるNNが知られている。アテンション構造は、入力部に3つの全結合層を含む。3つの全結合層は、それぞれ、Q(Query)、K(Key)及びV(Value)のテンソルを出力する層である。
【先行技術文献】
【特許文献】
【0008】
米国特許出願公開第2022/0036194号明細書
【発明の概要】
【発明が解決しようとする課題】
【0009】
NNの推論精度に大きな影響を与えないレイヤを選択する手法は、BN層が接続された畳込み層に対して適用されるが、それ以外のレイヤ、例えば、BN層が接続されていない畳込み層、及び、全結合層等への適用は想定されていない。
【0010】
例えば、NNの推論精度に大きな影響を与えないレイヤを選択する手法を、上述した複数のレイヤに適用できるようにした場合において、当該NNがアテンション構造を含む場合を考える。この場合、当該手法によりプルーニングを行なうと、アテンション構造の入力部における3つの全結合層は、いずれもプルーニングされず、機械学習モデル全体のプルーニング率は低下するため、プルーニングによる機械学習モデルのデータサイズの圧縮(軽量化)効果が低減する。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
光信号増幅
今日
富士通株式会社
算出方法及び算出プログラム
14日前
富士通株式会社
情報処理装置及び情報処理方法
1か月前
富士通株式会社
光通信装置および伝送制御方法
6日前
富士通株式会社
光通信装置および伝送制御方法
29日前
富士通株式会社
画像探索方法及び画像探索プログラム
20日前
富士通株式会社
画像識別方法および画像識別プログラム
14日前
富士通株式会社
計算資源管理装置及び計算資源管理方法
9日前
富士通株式会社
制御プログラム,制御方法及び制御装置
7日前
富士通株式会社
プログラム、評価方法および情報処理装置
6日前
富士通株式会社
監視プログラム,監視装置および監視方法
7日前
富士通株式会社
情報処理装置,プログラムおよび制御方法
1か月前
富士通株式会社
習熟度推定方法および習熟度推定プログラム
今日
富士通株式会社
類似度判定方法および類似度判定プログラム
29日前
富士通株式会社
検出プログラム、検出方法および情報処理装置
15日前
富士通株式会社
評価プログラム、評価方法および情報処理装置
15日前
富士通株式会社
制御方法、制御プログラムおよび情報処理装置
1か月前
富士通株式会社
プログラム、情報処理方法および情報処理装置
13日前
富士通株式会社
設定プログラム、設定方法および情報処理装置
12日前
富士通株式会社
パターン抽出方法及びパターン抽出プログラム
12日前
富士通株式会社
倫理学に基づくマルチモーダルユーザ投稿監視
1日前
富士通株式会社
特定プログラム、特定方法および情報処理装置
12日前
富士通株式会社
特定プログラム、特定方法および情報処理装置
1か月前
富士通株式会社
判定プログラム、判定方法および情報処理装置
14日前
富士通株式会社
移動時間予測方法および移動時間予測プログラム
12日前
富士通株式会社
転写基板、電子デバイス及び転写基板の製造方法
5日前
富士通株式会社
半導体装置、半導体装置の製造方法及び電子装置
1か月前
富士通株式会社
署名支援プログラム、署名支援方法、署名支援装置
1か月前
富士通株式会社
データ処理装置、データ処理方法およびプログラム
1か月前
富士通株式会社
カメラキャリブレーション方法の評価方法及び装置
19日前
富士通株式会社
並列処理プログラム,並列処理装置及び並列処理方法
19日前
富士通株式会社
情報出力プログラム、情報出力方法及び情報処理装置
1か月前
富士通株式会社
情報処理プログラム、情報処理方法、およびシステム
19日前
富士通株式会社
画像選択プログラム、画像選択方法及び画像選択装置
8日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
1日前
富士通株式会社
情報処理プログラム,情報処理方法及び情報処理装置
6日前
続きを見る