TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2023078975
公報種別公開特許公報(A)
公開日2023-06-07
出願番号2021192336
出願日2021-11-26
発明の名称ニューラルネットワーク回路装置
出願人国立大学法人東京工業大学
代理人個人
主分類G06N 3/02 20060101AFI20230531BHJP(計算;計数)
要約【課題】効率的に処理を行うことが可能なニューラルネットワーク回路装置を提供する。
【解決手段】ニューラルネットワーク回路装置100は、学習段階において固定された乱数で設定された重みと、学習段階で生成されたスーパーマスクとを用いて構成された、ニューラルネットワークモデルを実現する。ニューラルネットワーク回路装置100は、重み生成回路200と、演算回路400とを有する。重み生成回路200は、推論を行う際に、学習段階で用いられたシードと同じシードを用いて学習段階で生成された乱数と同じ乱数を生成するように構成された乱数生成器により重みを生成する。演算回路400は、推論対象データ又は当該推論対象データに対応する活性値データである入力データと、重みと、スーパーマスクとを用いて、積和演算を行う。
【選択図】図5
特許請求の範囲【請求項1】
学習段階において、ノード間の接続それぞれの重みが固定された乱数で設定され、前記接続それぞれの有効又は無効を決定することによってマスクが生成され、前記重みと前記マスクとを用いて構成された、ニューラルネットワークモデルを実現するニューラルネットワーク回路装置であって、
推論を行う際に、学習段階で用いられたシードと同じシードを用いて学習段階で生成された乱数と同じ乱数を生成するように構成された乱数生成器により前記重みを生成する重み生成回路と、
推論対象データ又は当該推論対象データに対応する活性値データである入力データと、前記重みと、前記マスクとを用いて、積和演算を行う演算回路と、
を有するニューラルネットワーク回路装置。
続きを表示(約 950 文字)【請求項2】
前記重み生成回路は、出力チャネルごとに異なるシードを用いて生成された前記乱数を、前記重みとして生成する、
請求項1に記載のニューラルネットワーク回路装置。
【請求項3】
出力チャネル番号と前記ニューラルネットワークモデルを構成する層の層番号とを用いて前記シードを生成する制御回路、
をさらに有する請求項2に記載のニューラルネットワーク回路装置。
【請求項4】
前記制御回路は、前記出力チャネル番号と前記層番号とを入力とするハッシュ関数によって、前記シードを生成する、
請求項3に記載のニューラルネットワーク回路装置。
【請求項5】
推論を行う際に、圧縮された状態の前記マスクを展開するマスク展開回路、
をさらに有し、
前記演算回路は、前記マスク展開回路によって展開された前記マスクを用いて、積和演算を行う、
請求項1から4のいずれか1項に記載のニューラルネットワーク回路装置。
【請求項6】
圧縮された状態の前記マスクは、ゼロランレングス圧縮方式によって圧縮されている、
請求項5に記載のニューラルネットワーク回路装置。
【請求項7】
圧縮された状態の前記マスクは、当該マスクが疎であるほど、圧縮率が高い状態で圧縮されている、
請求項6に記載のニューラルネットワーク回路装置。
【請求項8】
前記演算回路は、前記入力データと前記重みとの積が前記マスクによって有効化又は無効化されるように、演算を行う、
請求項1から7のいずれか1項に記載のニューラルネットワーク回路装置。
【請求項9】
前記演算回路は、ある接続に入力される前記入力データと前記マスクにおける当該接続に対応する有効又は無効を示す値との論理積を当該接続に対応する前記重みで乗算する、
請求項8に記載のニューラルネットワーク回路装置。
【請求項10】
前記マスクは、推論の精度及び推論対象の少なくとも一方ごとに生成されている、
請求項1から9のいずれか1項に記載のニューラルネットワーク回路装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、ニューラルネットワーク回路装置に関する。
続きを表示(約 2,400 文字)【背景技術】
【0002】
従来、CNN(Convolutional Neural Network:畳み込みニューラルネットワーク)等のニューラルネットワークでは、学習段階でノード(ニューロン)間の接続(エッジ)の重みを更新(調整)することによって、ニューラルネットワークが学習される。これに対し、非特許文献1は、学習段階でも重みを更新しないようなニューラルネットワーク(HNN:Hidden Network)のアルゴリズムを開示している。非特許文献1にかかるアルゴリズムは、学習段階で、ニューラルネットワークに隠れている、推論の精度が良好なサブネットワークを抽出する。その際に、このアルゴリズムは、ランダムに設定された重みを更新しない。つまり、非特許文献1にかかる技術では、ランダムに設定された重みが固定されている。また、非特許文献1にかかる技術では、ノード間の接続の有効又は無効を定義するスーパーマスク(Supermask;単に「マスク」と称することもある)が、学習段階で決定される。非特許文献1にかかる技術では、スーパーマスクと固定された重みとを用いて、推論で用いられるモデル(サブネットワーク)が構成される。
【先行技術文献】
【非特許文献】
【0003】
Vivek Ramanujan他、「What's Hidden in a Randomly Weighted Neural Network?」、CVPR 2020、https://arxiv.org/abs/1911.13299
【発明の概要】
【発明が解決しようとする課題】
【0004】
非特許文献1は、推論で用いられるHNNのモデルをハードウェアで実装する方法を開示していない。したがって、単に非特許文献1にかかるアルゴリズムをハードウェアで実現しようとすると、モデル情報のデータ量が膨大となる場合に、メモリ容量及びメモリアクセスが膨大となるような、処理効率の悪いハードウェアが構成されてしまうおそれがある。
【0005】
本発明は、効率的に処理を行うことが可能なニューラルネットワーク回路装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明にかかるニューラルネットワーク回路装置は、学習段階において、ノード間の接続それぞれの重みが固定された乱数で設定され、前記接続それぞれの有効又は無効を決定することによってマスクが生成され、前記重みと前記マスクとを用いて構成された、ニューラルネットワークモデルを実現するニューラルネットワーク回路装置であって、推論を行う際に、学習段階で用いられたシードと同じシードを用いて学習段階で生成された乱数と同じ乱数を生成するように構成された乱数生成器により前記重みを生成する重み生成回路と、推論対象データ又は当該推論対象データに対応する活性値データである入力データと、前記重みと、前記マスクとを用いて、積和演算を行う演算回路と、を有する。
【発明の効果】
【0007】
本発明によれば、効率的に処理を行うことが可能なニューラルネットワーク回路装置を提供することを目的とする。
【図面の簡単な説明】
【0008】
HNNアルゴリズムを説明するための図である。
HNNアルゴリズムを説明するための図である。
HNNアルゴリズムにおけるスーパーマスクのkの値と推論の精度との関係を示すグラフである。
本実施の形態にかかるスーパーマスクの選択について説明するための図である。
実施の形態1にかかるニューラルネットワーク回路装置の構成を示す図である。
実施の形態1にかかる重み生成回路及びマスク展開回路の処理を説明するための図である。
実施の形態1にかかる重み生成回路の構成を示す図である。
実施の形態1にかかるマスク展開回路の構成を示す図である。
実施の形態1にかかる入力データを説明するための図である。
実施の形態1にかかる演算回路の動作を説明するための図である。
実施の形態1にかかるPEベクトルの処理を説明するための図である。
実施の形態1にかかるニューラルネットワーク回路装置の各構成要素に関するタイミングチャートを示す図である。
実施の形態1にかかる後処理回路の構成を示す図である。
実施の形態1にかかるニューラルネットワーク回路装置によって演算を行った結果を示す図である。
実施の形態1にかかるニューラルネットワーク回路装置によって演算を行った結果を示す図である。
実施の形態1にかかるニューラルネットワーク回路装置によって演算を行った結果を示す図である。
実施の形態1にかかるニューラルネットワーク回路装置によって演算を行った結果を示す図である。
【発明を実施するための形態】
【0009】
(実施の形態の概要)
実施の形態の説明に先立って、本発明にかかる実施の形態の概要について説明する。なお、以下、本発明の実施形態を説明するが、以下の実施形態は請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0010】
<HNNについて>
図1及び図2は、HNNアルゴリズムを説明するための図である。HNNアルゴリズムは、非特許文献1にかかる技術に対応する。図1の左側には、HNNアルゴリズムにかかるモデル(ニューラルネットワーク)の学習について説明するための図が記載されている。
(【0011】以降は省略されています)

特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する

関連特許

個人
乗降調査装置
9日前
個人
自動販売機
16日前
個人
リユース統合システム
29日前
日本精機株式会社
投影装置
9日前
個人
コメント配信システム
1か月前
日本精機株式会社
投影システム
10日前
個人
広告提供方法
1か月前
株式会社SUBARU
車両
17日前
個人
コンピュータシステム
1か月前
個人
情報処理装置及びプログラム
1か月前
個人
モノづくり知識情報システム
1か月前
個人
チラシ掲載位置表示システム
27日前
株式会社SUBARU
車両
1か月前
個人
釣PAID降水確率ポイント
1か月前
小林クリエイト株式会社
RFタグ
16日前
17LIVE株式会社
サーバ
9日前
株式会社協同印刷
防災・災害マウス
22日前
株式会社ゼロボード
価格決定システム
8日前
太陽誘電株式会社
触覚生成装置
20日前
ユニパルス株式会社
プログラム、方法
1か月前
株式会社カネカ
異常推定システム
28日前
中国電力株式会社
ゲームシステム
1か月前
株式会社アジラ
姿勢推定システム
7日前
株式会社フォーバル
仕訳システム
28日前
株式会社カクシン
管理装置
1か月前
株式会社イトーキ
分析装置
20日前
個人
オーダーメイド品販売システム
1か月前
株式会社mov
情報処理装置
1か月前
オムロン株式会社
操作制御システム
1か月前
個人
ディスプレイ・セットシステム
1か月前
日本信号株式会社
自転車貸出システム
10日前
個人
デジタルコンテンツ提供システム
1か月前
日本電気株式会社
勤務管理装置
15日前
個人
ブロックチェーンと既存網との接続方法
29日前
小林クリエイト株式会社
あて先表示システム
16日前
個人
言語翻訳システム及びプログラム
今日
続きを見る