TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025016154
公報種別
公開特許公報(A)
公開日
2025-01-31
出願番号
2023119243
出願日
2023-07-21
発明の名称
情報処理装置、方法およびプログラム
出願人
株式会社東芝
代理人
弁理士法人鈴榮特許綜合事務所
主分類
G06N
20/00 20190101AFI20250124BHJP(計算;計数)
要約
【課題】モデルサイズを小さくしつつ性能を向上できる。
【解決手段】本実施形態に係る情報処理装置は、取得部と、決定部と、第1抽出部と、第2抽出部と、訓練部とを含む。取得部は、第1特徴量抽出器と第2特徴量抽出器との訓練に用いる訓練データを取得する。決定部は、前記第2特徴量抽出器のモデルサイズを決定する。第1抽出部は、前記訓練データを前記第1特徴量抽出器に入力し、第1特徴量を抽出する。第2抽出部は、前記第1特徴量を前記第2特徴量抽出器に入力し、第2特徴量を抽出する。訓練部は、前記第1特徴量を前記第2特徴量に近づけるように前記第1特徴量抽出器を訓練する。
【選択図】図1
特許請求の範囲
【請求項1】
第1特徴量抽出器と第2特徴量抽出器との訓練に用いる訓練データを取得する取得部と、
前記第2特徴量抽出器のモデルサイズを決定する決定部と、
前記訓練データを前記第1特徴量抽出器に入力し、第1特徴量を抽出する第1抽出部と、
前記第1特徴量を前記第2特徴量抽出器に入力し、第2特徴量を抽出する第2抽出部と、
前記第1特徴量を前記第2特徴量に近づけるように前記第1特徴量抽出器を訓練する訓練部と、
を具備する情報処理装置。
続きを表示(約 1,000 文字)
【請求項2】
前記第1特徴量抽出器と前記第2特徴量抽出器とは、抽出される特徴量の次元数が同じとなる構造を有する、請求項1に記載の情報処理装置。
【請求項3】
前記第1特徴量抽出器は、事前学習済みのパラメータが初期値として設定される、請求項1に記載の情報処理装置。
【請求項4】
前記第2特徴量抽出器を複数格納する格納部をさらに具備し、
前記決定部は、複数の第2特徴量抽出器の中から訓練に利用する前記第2特徴量抽出器を選択する、請求項1に記載の情報処理装置。
【請求項5】
前記決定部は、メモリサイズ、計算コストおよび推論精度の少なくとも1つに基づいて前記第2特徴量抽出器の前記モデルサイズを決定する、請求項1に記載の情報処理装置。
【請求項6】
前記第1特徴量抽出器と前記第2特徴量抽出器とは、Transformer構造を用いたモデルまたはMLP-Mixerを用いたモデルである、請求項1に記載の情報処理装置。
【請求項7】
前記第1抽出部は、前記第1特徴量として前記第1特徴量抽出器の中間層の特徴量を抽出し、
前記第2抽出部は、前記第2特徴量として前記第2特徴量抽出器の中間層の特徴量を抽出する、請求項1に記載の情報処理装置。
【請求項8】
第1特徴量抽出器と第2特徴量抽出器との訓練に用いる訓練データを取得し、
前記第2特徴量抽出器のモデルサイズを決定し、
前記訓練データを前記第1特徴量抽出器に入力することで第1特徴量を抽出し、
前記第1特徴量を前記第2特徴量抽出器に入力することで第2特徴量を抽出し、
前記第1特徴量を前記第2特徴量に近づけるように前記第1特徴量抽出器を訓練する、情報処理方法。
【請求項9】
コンピュータを、
第1特徴量抽出器と第2特徴量抽出器との訓練に用いる訓練データを取得する取得手段と、
前記第2特徴量抽出器のモデルサイズを決定する決定手段と、
前記訓練データを前記第1特徴量抽出器に入力し、第1特徴量を抽出する第1抽出手段と、
前記第1特徴量を前記第2特徴量抽出器に入力し、第2特徴量を抽出する第2抽出手段と、
前記第1特徴量を前記第2特徴量に近づけるように前記第1特徴量抽出器を訓練する訓練手段と、して機能させるための情報処理プログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明の実施形態は、情報処理装置、方法およびプログラムに関する。
続きを表示(約 2,000 文字)
【背景技術】
【0002】
深層学習では、自然言語処理及び画像認識処理において、モデルサイズに応じて性能が向上する、べき乗則が確認される。しかし、モデルサイズが大きくなるほど、推論時のメモリおよび計算コストが増加してしまうという課題がある。
【先行技術文献】
【非特許文献】
【0003】
Zhang, L., Song, J., Gao, A., Chen, J., Bao, C., Ma, K., Be your own teacher: Improve the performance of convolutional neural networks via self distillation., Proceedings of the IEEE/CVF International Conference on Computer Vision. (2019) 3713-3722
【発明の概要】
【発明が解決しようとする課題】
【0004】
本開示は、上述の課題を解決するためになされたものであり、モデルサイズを小さくしつつ性能を向上できる情報処理装置、方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0005】
本実施形態に係る情報処理装置は、取得部と、決定部と、第1抽出部と、第2抽出部と、訓練部とを含む。取得部は、第1特徴量抽出器と第2特徴量抽出器との訓練に用いる訓練データを取得する。決定部は、前記第2特徴量抽出器のモデルサイズを決定する。第1抽出部は、前記訓練データを前記第1特徴量抽出器に入力し、第1特徴量を抽出する。第2抽出部は、前記第1特徴量を前記第2特徴量抽出器に入力し、第2特徴量を抽出する。訓練部は、前記第1特徴量を前記第2特徴量に近づけるように前記第1特徴量抽出器を訓練する。
【図面の簡単な説明】
【0006】
第1実施形態に係る情報処理装置を示すブロック図。
第1実施形態に係る情報処理装置の動作例を示すフローチャート。
第1特徴量抽出器および第2特徴量抽出器の第1例を示す図。
第1特徴量抽出器および第2特徴量抽出器の第2例を示す図。
第2実施形態に係る情報処理装置を示すブロック図。
第2実施形態に係る情報処理装置の動作例を示すフローチャート。
第3実施形態に係る情報処理装置を示すブロック図。
第3実施形態に係る情報処理装置の第1動作例を示すフローチャート。
第3実施形態に係る情報処理装置の第2動作例を示すフローチャート。
情報処理装置のハードウェア構成の一例を示すブロック図。
【発明を実施するための形態】
【0007】
以下、図面を参照しながら本実施形態に係る情報処理装置、方法およびプログラムについて詳細に説明する。なお、以下の実施形態では、同一の参照符号を付した部分は同様の動作をおこなうものとして、重複する説明を適宜省略する。
【0008】
(第1実施形態)
第1実施形態に係る情報処理装置について図1のブロック図を参照して説明する。
第1実施形態に係る情報処理装置10は、格納部101と、取得部102と、決定部103と、第1抽出部104と、第2抽出部105と、訓練部106と、出力部107とを含む。
【0009】
格納部101は、第1特徴量抽出器および第2特徴量抽出器を有する機械学習モデル(以下、単にモデルともいう)、訓練データなどを格納する。モデルは、例えば、いわゆるTransformerの構造を用いた、ViT(Vision Transformer)、BERT(Bidirectional Encoder Representations from Transformer)、GPT(Generative Pretrained Transformer)などを想定する。なお、Transformerの構造に限らず、MLP(Multi Layer Perceptron)-Mixerでもよく、モデルへの入力と、当該モデルからの出力との次元数が同じ構造であればよい。当該構造により、モデルを形成する層の積層が容易となる。
【0010】
本実施形態では、訓練データが画像である場合を想定するが、これに限らない。例えば、制御信号データ、音声データ、自然言語データ、音楽データ、センサ値などの1次元の時系列データでもよいし、記号データ、ログデータ、動画データ、テーブルデータ、トランザクションデータなどの画像以外の2次元以上のデータでもよい。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
株式会社東芝
電源回路
9日前
株式会社東芝
半導体装置
15日前
株式会社東芝
半導体装置
15日前
株式会社東芝
半導体装置
15日前
株式会社東芝
半導体装置
15日前
株式会社東芝
ガス遮断器
2日前
株式会社東芝
半導体装置
15日前
株式会社東芝
半導体装置
15日前
株式会社東芝
半導体装置
15日前
株式会社東芝
半導体装置
15日前
株式会社東芝
半導体装置
15日前
株式会社東芝
半導体装置
3日前
株式会社東芝
半導体装置
15日前
株式会社東芝
半導体装置
3日前
株式会社東芝
水処理装置
3日前
株式会社東芝
半導体装置
9日前
株式会社東芝
半導体装置
9日前
株式会社東芝
半導体装置
15日前
株式会社東芝
磁気記録装置
2日前
株式会社東芝
伝送システム
2日前
株式会社東芝
ディスク装置
2日前
株式会社東芝
空調制御装置
15日前
株式会社東芝
ディスク装置
2日前
株式会社東芝
モータ駆動装置
9日前
株式会社東芝
原子炉用制御棒
15日前
株式会社東芝
一括保護システム
15日前
株式会社東芝
電力変換システム
8日前
株式会社東芝
組電池及び電池盤
15日前
株式会社東芝
粒子線照射システム
19日前
株式会社東芝
系統安定化システム
2日前
株式会社東芝
拾得機能付き調査器具
8日前
株式会社東芝
半導体装置の製造方法
3日前
株式会社東芝
車両用蓄電池の冷却装置
8日前
株式会社東芝
無人航空機駐機システム
9日前
株式会社東芝
発電システム、制御装置
1日前
株式会社東芝
要介護認定調査システム
2日前
続きを見る
他の特許を見る