TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025176762
公報種別
公開特許公報(A)
公開日
2025-12-05
出願番号
2024083047
出願日
2024-05-22
発明の名称
構造秘匿ニューラルネットワークモデル生成装置
出願人
日本電気株式会社
代理人
個人
,
個人
主分類
G06N
3/09 20230101AFI20251128BHJP(計算;計数)
要約
【課題】生成したニューラルネットワーク構造を秘匿できるようにする。
【解決手段】サブネット構築手段は、学習済スーパーネット情報内のアーキテクチャパラメータに基づいて、ブロック毎に1つの候補構造を特定する情報であるアーキテクチャ情報と、アーキテクチャ情報によって定まるサブネット情報とを生成する。サブネット追加学習手段は、学習データセットを用いた学習で、サブネット情報内のパラメタを更新することによって、追加学習済サブネット情報を生成する。構造秘匿モデル情報生成手段は、学習済スーパーネット情報に含まれている所定モジュールおよびアーキテクチャパラメタを除外した上で、学習済スーパーネット情報に含まれているパラメタのうち、サブネット情報に該当する部分のパラメタを、追加学習済サブネット情報に含まれるパラメタで置換することによって、構造秘匿モデル情報を生成する。
【選択図】図12
特許請求の範囲
【請求項1】
入力として与えられる候補構造情報に基づいて、スーパーネット情報を生成するスーパーネットモデル構築手段と、
入力として与えられる学習データセットを用いた学習で、前記スーパーネット情報に含まれる所定モジュール以外のモジュールのパラメタと、前記所定モジュールの全てのパラメタの組であるアーキテクチャパラメタとを更新することによって、学習済スーパーネット情報を生成するスーパーネット学習手段と、
前記学習済スーパーネット情報内の前記アーキテクチャパラメータに基づいて、ブロック毎に1つの候補構造を特定する情報であるアーキテクチャ情報と、前記アーキテクチャ情報によって定まるサブネット情報とを生成し、前記アーキテクチャ情報を出力するサブネット構築手段と、
前記学習データセットを用いた学習で、前記サブネット情報内のパラメタを更新することによって、追加学習済サブネット情報を生成するサブネット追加学習手段と、
前記学習済スーパーネット情報に含まれている前記所定モジュールおよび前記アーキテクチャパラメタを除外した上で、前記学習済スーパーネット情報に含まれているパラメタのうち、前記サブネット情報に該当する部分のパラメタを、前記追加学習済サブネット情報に含まれるパラメタで置換することによって、構造秘匿モデル情報を生成し、前記構造秘匿モデル情報を出力する構造秘匿モデル情報生成手段とを備える
ことを特徴とする構造秘匿ニューラルネットワークモデル生成装置。
続きを表示(約 2,300 文字)
【請求項2】
前記所定モジュール以外のモジュールのパラメタは、畳み込み演算における重みとバイアスである
請求項1に記載の構造秘匿ニューラルネットワークモデル生成装置。
【請求項3】
入力として与えられる候補構造情報に基づいて、スーパーネット情報を生成するスーパーネットモデル構築手段と、
入力として与えられる学習データセットを用いた学習で、前記スーパーネット情報に含まれる所定モジュール以外のモジュールのパラメタと、前記所定モジュールの全てのパラメタの組であるアーキテクチャパラメタとを更新することによって、学習済スーパーネット情報を生成するスーパーネット学習手段と、
前記学習済スーパーネット情報から前記所定モジュールおよび前記アーキテクチャパラメタを除外した情報と、前記アーキテクチャパラメータとを分けて出力する出力手段とを備える
ことを特徴とする構造秘匿ニューラルネットワークモデル生成装置。
【請求項4】
コンピュータが、
入力として与えられる候補構造情報に基づいて、スーパーネット情報を生成し、
入力として与えられる学習データセットを用いた学習で、前記スーパーネット情報に含まれる所定モジュール以外のモジュールのパラメタと、前記所定モジュールの全てのパラメタの組であるアーキテクチャパラメタとを更新することによって、学習済スーパーネット情報を生成し、
前記学習済スーパーネット情報内の前記アーキテクチャパラメータに基づいて、ブロック毎に1つの候補構造を特定する情報であるアーキテクチャ情報と、前記アーキテクチャ情報によって定まるサブネット情報とを生成し、前記アーキテクチャ情報を出力し、
前記学習データセットを用いた学習で、前記サブネット情報内のパラメタを更新することによって、追加学習済サブネット情報を生成し、
前記学習済スーパーネット情報に含まれている前記所定モジュールおよび前記アーキテクチャパラメタを除外した上で、前記学習済スーパーネット情報に含まれているパラメタのうち、前記サブネット情報に該当する部分のパラメタを、前記追加学習済サブネット情報に含まれるパラメタで置換することによって、構造秘匿モデル情報を生成し、前記構造秘匿モデル情報を出力する
ことを特徴とする構造秘匿ニューラルネットワークモデル生成方法。
【請求項5】
コンピュータが、
入力として与えられる候補構造情報に基づいて、スーパーネット情報を生成し、
入力として与えられる学習データセットを用いた学習で、前記スーパーネット情報に含まれる所定モジュール以外のモジュールのパラメタと、前記所定モジュールの全てのパラメタの組であるアーキテクチャパラメタとを更新することによって、学習済スーパーネット情報を生成し、
前記学習済スーパーネット情報から前記所定モジュールおよび前記アーキテクチャパラメタを除外した情報と、前記アーキテクチャパラメータとを分けて出力する
ことを特徴とする構造秘匿ニューラルネットワークモデル生成方法。
【請求項6】
コンピュータに、
入力として与えられる候補構造情報に基づいて、スーパーネット情報を生成するスーパーネットモデル構築処理、
入力として与えられる学習データセットを用いた学習で、前記スーパーネット情報に含まれる所定モジュール以外のモジュールのパラメタと、前記所定モジュールの全てのパラメタの組であるアーキテクチャパラメタとを更新することによって、学習済スーパーネット情報を生成するスーパーネット学習処理、
前記学習済スーパーネット情報内の前記アーキテクチャパラメータに基づいて、ブロック毎に1つの候補構造を特定する情報であるアーキテクチャ情報と、前記アーキテクチャ情報によって定まるサブネット情報とを生成し、前記アーキテクチャ情報を出力するサブネット構築処理、
前記学習データセットを用いた学習で、前記サブネット情報内のパラメタを更新することによって、追加学習済サブネット情報を生成するサブネット追加学習処理、および、
前記学習済スーパーネット情報に含まれている前記所定モジュールおよび前記アーキテクチャパラメタを除外した上で、前記学習済スーパーネット情報に含まれているパラメタのうち、前記サブネット情報に該当する部分のパラメタを、前記追加学習済サブネット情報に含まれるパラメタで置換することによって、構造秘匿モデル情報を生成し、前記構造秘匿モデル情報を出力する構造秘匿モデル情報生成処理
を実行させるための構造秘匿ニューラルネットワークモデル生成プログラム。
【請求項7】
コンピュータに、
入力として与えられる候補構造情報に基づいて、スーパーネット情報を生成するスーパーネットモデル構築処理、
入力として与えられる学習データセットを用いた学習で、前記スーパーネット情報に含まれる所定モジュール以外のモジュールのパラメタと、前記所定モジュールの全てのパラメタの組であるアーキテクチャパラメタとを更新することによって、学習済スーパーネット情報を生成するスーパーネット学習処理、および、
前記学習済スーパーネット情報から前記所定モジュールおよび前記アーキテクチャパラメタを除外した情報と、前記アーキテクチャパラメータとを分けて出力する出力処理
を実行させるための構造秘匿ニューラルネットワークモデル生成プログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、構造秘匿ニューラルネットワークモデル生成装置、構造秘匿ニューラルネットワークモデル生成方法、および、構造秘匿ニューラルネットワークモデル生成プログラムに関する。
続きを表示(約 1,400 文字)
【背景技術】
【0002】
非特許文献1には、複数の候補構造を含んだonce-for-allネットワークを用いたニューラルネットワーク構造の探索方法が開示されている。
【0003】
非特許文献2には、複数の候補構造を含んだスーパーネットの初期重みを適切に設定することで効率的にニューラルネットワーク構造の探索を行う方法が開示されている。
【先行技術文献】
【非特許文献】
【0004】
Han Cai, et al., “ONCE-FOR-ALL: TRAIN ONE NETWORK AND SPECIALIZE IT FOR EFFICIENT DEPLOYMENT”, [online], [2024年4月15日検索], インターネット<URL :https://arxiv.org/abs/1908.09791>
Jiemin Fang, et al., “FAST NEURAL NETWORK ADAPTATION VIA PARAMETER REMAPPING AND ARCHITECTURE SEARCH”, [online], [2024年4月15日検索], インターネット<URL :https://arxiv.org/abs/2001.02525>
【発明の概要】
【発明が解決しようとする課題】
【0005】
高い認識精度を保ちつつ、高速に実行可能なニューラルネットワークを実現するためには、ニューラルネットワーク構造の決定が重要である。
【0006】
一般に、熟練の研究者がニューラルネットワーク構造の改良を行っている。近年では、最適なニューラルネットワーク構造を探索するNAS(Neural Architecture Search)の研究が進み、入力となる学習データに対し、認識精度や実行速度に優れたニューラルネットワーク構造を自動的に探索する方法が提案されている。
【0007】
また、近年では、One-shot NASと呼ばれる、比較的効率的にニューラルネットワーク構造の探索を行う方法が提案されている。
【0008】
しかし、自動的かつ比較的効率的にニューラルネットワーク構造を探索できるようになっても、探索には一定の時間やコストが必要である。例えば、非特許文献2によると、ニューラルネットワーク構造の探索に、1台のGPU(Graphics Processing Unit)を21.6日間連続して稼働させるコストが必要である。
【0009】
また、探索結果(探索されたニューラルネットワーク構造)の品質は、探索時に用いる学習データの品質に影響される。一般的に、学習データは、特定の応用分野に習熟した技術者が長い時間をかけて収集、選別したノウハウの塊であり、競争力の源泉となり得る。このため、探索結果として得られるニューラルネットワーク構造は、第三者に容易に使われないように、秘匿する必要がある。
【0010】
例えば、探索結果として得られたニューラルネットワーク構造を製品に組み込み、現場にデプロイしたとしても、ニューラルネットワーク構造が第三者に盗まれて流用されると、競争力が低下し、ビジネス上の損害を受ける。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
日本電気株式会社
特定装置
8日前
日本電気株式会社
光モジュール
1か月前
日本電気株式会社
推論装置および推論方法
1か月前
日本電気株式会社
時刻維持装置および時刻維持方法
1か月前
日本電気株式会社
考査装置、考査方法、プログラム
1か月前
日本電気株式会社
考査装置、考査方法、プログラム
1か月前
日本電気株式会社
ボロメータアレイ、及び光検出方法
10日前
日本電気株式会社
交渉装置、交渉方法及びプログラム
16日前
日本電気株式会社
交渉装置、交渉方法及びプログラム
1か月前
日本電気株式会社
監視装置、監視方法、及びプログラム
29日前
日本電気株式会社
情報処理装置、方法、及び、プログラム
1日前
日本電気株式会社
情報処理装置、方法、及び、プログラム
1日前
日本電気株式会社
乗車誘導計画装置および乗車誘導計画方法
22日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
1か月前
日本電気株式会社
店舗端末、情報処理方法、及びプログラム
1か月前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
8日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
1日前
日本電気株式会社
合意判定装置、合意判定方法及びプログラム
16日前
日本電気株式会社
制御装置、無線端末、方法、及びプログラム
9日前
日本電気株式会社
合意判定装置、合意判定方法及びプログラム
1か月前
日本電気株式会社
視聴支援装置、視聴支援方法及びプログラム
1か月前
日本電気株式会社
発話認識装置、プログラム及び発話認識方法
10日前
日本電気株式会社
健康管理装置、健康管理方法及びプログラム
1か月前
日本電気株式会社
経路選択装置、経路選択方法及びプログラム
29日前
日本電気株式会社
制御装置、制御プログラム、および制御方法
1日前
日本電気株式会社
情報処理装置、情報処理方法及びプログラム
1日前
日本電気株式会社
学習装置、利用装置、学習方法及びプログラム
29日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
1か月前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
1か月前
日本電気株式会社
情報処理装置、応答方法、及び応答プログラム
10日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
1か月前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
1か月前
日本電気株式会社
情報処理装置、情報処理方法およびプログラム
16日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
1か月前
日本電気株式会社
情報処理装置、情報処理方法およびプログラム
17日前
日本電気株式会社
画像生成装置、画像生成方法、及びプログラム
1か月前
続きを見る
他の特許を見る