TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024151738
公報種別
公開特許公報(A)
公開日
2024-10-25
出願番号
2023065376
出願日
2023-04-13
発明の名称
プログラム、情報処理装置および情報処理方法
出願人
株式会社東芝
代理人
弁理士法人酒井国際特許事務所
主分類
G06N
3/0464 20230101AFI20241018BHJP(計算;計数)
要約
【課題】畳み込みニューラルネットワークモデルを用いる場合に、1つのモデルを用いて計算量と精度とのトレードオフを制御する柔軟な実装を実現する。
【解決手段】実施形態のプログラムは、コンピュータを、記憶制御部と変換部と第1CNN部と第2CNN部として機能させる。記憶制御部は、第1のストライドパラメータと第1のディレーションパラメータと、を記憶装置から読み出す。変換部は、変換パラメータを用いて、第1のストライドパラメータを第2のストライドパラメータに変換し、第1のディレーションパラメータを第2のディレーションパラメータに変換する。第1CNN部は、少なくとも第2のストライドパラメータを用いて、特徴ベクトルの第1CNN処理を実行する。第2CNN部は、少なくとも第2のディレーションパラメータを用いて、第1CNN部の出力ベクトルを入力とする第2CNN処理を実行する。
【選択図】図4
特許請求の範囲
【請求項1】
コンピュータを、
出力の解像度を制御する第1のストライドパラメータと、入力の解像度を制御する第1のディレーションパラメータと、を記憶装置から読み出す記憶制御部と、
変換パラメータを用いて、前記第1のストライドパラメータを第2のストライドパラメータに変換し、前記第1のディレーションパラメータを第2のディレーションパラメータに変換する変換部と、
少なくとも前記第2のストライドパラメータを用いて、特徴ベクトルの第1CNN(Convolutional Neural Network)処理を実行する第1CNN部と、
少なくとも前記第2のディレーションパラメータを用いて、前記第1CNN部の出力ベクトルを入力とする第2CNN処理を実行する第2CNN部、
として機能させるためのプログラム。
続きを表示(約 2,200 文字)
【請求項2】
前記変換部は、前記第1のストライドパラメータに前記変換パラメータを乗じることによって前記第2のストライドパラメータを生成し、前記第1のディレーションパラメータに前記変換パラメータの逆数を乗じることによって、前記第2のディレーションパラメータを生成する、
請求項1に記載のプログラム。
【請求項3】
前記記憶装置は、複数の前記第2のストライドパラメータと、複数の前記第2のディレーションパラメータとを記憶し、
前記変換部は、前記変換パラメータに基づき、前記複数の第2のストライドパラメータから1つの前記第2のストライドパラメータを選択することによって、前記第1のストライドパラメータを変換し、前記変換パラメータに基づき、前記複数の第2のディレーションパラメータから1つの前記第2のディレーションパラメータを選択することによって、前記第1のディレーションパラメータを変換する、
請求項1に記載のプログラム。
【請求項4】
前記複数の第2のストライドパラメータのそれぞれは、第1の方向の出力解像度を制御するパラメータと、第2の方向の出力解像度を制御するパラメータとを含み、
前記複数の第2のディレーションパラメータのそれぞれは、第1の方向の入力解像度を制御するパラメータと、第2の方向の入力解像度を制御するパラメータとを含む、
請求項3に記載のプログラム。
【請求項5】
前記第2CNN部の出力ベクトルの次元は、1次元以上であり、
前記第2CNN部の出力ベクトルの少なくとも一つの次元の解像度が不足している場合、前記解像度が不足している少なくとも1つの次元の解像度を補間する補間部、
を更に備える請求項1乃至3のいずれか1項に記載のプログラム。
【請求項6】
前記特徴ベクトルは、入力された音声の特徴量を示し、
前記入力された音声から前記特徴量を抽出することによって、前記特徴ベクトルを生成する抽出部と、
前記第2CNN部の出力ベクトルを用いて、前記音声を認識する認識部、
として更に機能させる請求項1乃至4のいずれか1項に記載のプログラム。
【請求項7】
前記認識部は、前記第2CNN部の出力ベクトルを用いて、前記音声に含まれるキーワードを検出し、
前記キーワードに対応付けられたコマンドを起動する起動部、
として更に機能させる請求項6に記載のプログラム。
【請求項8】
出力の解像度を制御する第1のストライドパラメータと、入力の解像度を制御する第1のディレーションパラメータと、を記憶装置から読み出す記憶制御部と、
変換パラメータを用いて、前記第1のストライドパラメータを第2のストライドパラメータに変換し、前記第1のディレーションパラメータを第2のディレーションパラメータに変換する変換部と、
少なくとも前記第2のストライドパラメータを用いて、特徴ベクトルの第1CNN(Convolutional Neural Network)処理を実行する第1CNN部と、
少なくとも前記第2のディレーションパラメータを用いて、前記第1CNN部の出力ベクトルを入力とする第2CNN処理を実行する第2CNN部と、
を備える情報処理装置。
【請求項9】
情報処理装置が、出力の解像度を制御する第1のストライドパラメータと、入力の解像度を制御する第1のディレーションパラメータと、を記憶装置から読み出すステップと、
前記情報処理装置が、変換パラメータを用いて、前記第1のストライドパラメータを第2のストライドパラメータに変換し、前記第1のディレーションパラメータを第2のディレーションパラメータに変換するステップと、
前記情報処理装置が、少なくとも前記第2のストライドパラメータを用いて、特徴ベクトルの第1CNN(Convolutional Neural Network)処理を実行するステップと、
前記情報処理装置が、少なくとも前記第2のディレーションパラメータを用いて、前記第1CNN処理の出力ベクトルを入力とする第2CNN処理を実行するステップと、
を含む情報処理方法。
【請求項10】
第1の情報処理装置が、出力の解像度を制御する第1のストライドパラメータと、入力の解像度を制御する第1のディレーションパラメータと、を記憶装置から読み出すステップと、
前記第1の情報処理装置が、変換パラメータを用いて、前記第1のストライドパラメータを第2のストライドパラメータに変換し、前記第1のディレーションパラメータを第2のディレーションパラメータに変換するステップと、
前記第1の情報処理装置が、少なくとも前記第2のストライドパラメータを、特徴ベクトルの第1CNN(Convolutional Neural Network)処理に使用されるパラメータとして、第2の情報処理装置に保存するステップと、
前記第1の情報処理装置が、少なくとも前記第2のディレーションパラメータを、前記第1CNN処理の出力ベクトルを入力とする第2CNN処理に使用されるパラメータとして、前記第2の情報処理装置に保存するステップと、
を含む情報処理方法。
発明の詳細な説明
【技術分野】
【0001】
本発明の実施形態はプログラム、情報処理装置および情報処理方法に関する。
続きを表示(約 1,800 文字)
【背景技術】
【0002】
ニューラルネットワークの計算量を削減する方法としてフレームスキップが従来から知られている。この方法は、例えば奇数番目のフレームのみニューラルネットワーク処理を実行して出力し、偶数番目のフレームは処理を実行せずに奇数番目の出力を使用することで計算量を半減する技術である。
【先行技術文献】
【特許文献】
【0003】
特許第6453917号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術では、畳み込みニューラルネットワークモデルを用いる場合に、1つのモデルを用いて計算量と精度とのトレードオフを制御する柔軟な実装を実現することができなかった。
【課題を解決するための手段】
【0005】
実施形態のプログラムは、コンピュータを、記憶制御部と変換部と第1CNN部と第2CNN部として機能させる。記憶制御部は、出力の解像度を制御する第1のストライドパラメータと、入力の解像度を制御する第1のディレーションパラメータと、を記憶装置から読み出す。変換部は、変換パラメータを用いて、前記第1のストライドパラメータを第2のストライドパラメータに変換し、前記第1のディレーションパラメータを第2のディレーションパラメータに変換する。第1CNN部は、少なくとも前記第2のストライドパラメータを用いて、特徴ベクトルの第1CNN(Convolutional Neural Network)処理を実行する。第2CNN部は、少なくとも前記第2のディレーションパラメータを用いて、前記第1CNN部の出力ベクトルを入力とする第2CNN処理を実行する。
【図面の簡単な説明】
【0006】
第1実施形態の情報処理装置のハードウェア構成の一例を示す図。
第1実施形態の情報処理装置の機能構成の一例を示す図。
第1実施形態のキーワードおよびコマンドの対応情報の例を示す図。
第1実施形態の検出制御部の機能構成の一例を示す図。
第1実施形態の畳み込みニューラルネットワーク処理の例1を示す図。
第1実施形態の畳み込みニューラルネットワーク処理の例2を示す図。
第1実施形態の情報処理方法の例を示すフローチャート。
第2実施形態の情報処理装置の機能構成の一例を示す図。
第2実施形態のパラメータの一例を示す図。
第2実施形態の計算リソースに応じた変換パラメータの一例を示す図。
第2実施形態の補間部の入力例1を示す図。
第2実施形態の補間部の入力例2を示す図。
第2実施形態の補間部の入力例3を示す図。
第2実施形態の情報処理方法の一例を示すフローチャート。
【発明を実施するための形態】
【0007】
以下に添付図面を参照して、プログラム、情報処理装置および情報処理方法の実施形態を詳細に説明する。
【0008】
(第1実施形態)
はじめに、第1実施形態の情報処理装置100のハードウェア構成の例について説明する。
【0009】
[ハードウェア構成の例]
図1は第1実施形態の情報処理装置100のハードウェア構成の一例を示す図である。図1の例は、第1実施形態の情報処理装置100が、スマートフォンなどのスマートデバイスに搭載されるキーワード発話検出装置およびコマンド起動装置として実現される場合を示す。
【0010】
第1実施形態の情報処理装置100は、CPU(Central Processing Unit)301と、RAM(Random Access Memory)302と、ROM(Read Only Memory)303と、操作入力装置304と、表示装置305と、記憶装置306と、通信装置307と、音声入力装置308とを備える。そして、CPU301と、RAM302と、ROM303と、操作入力装置304と、表示装置305と、記憶装置306と、通信装置307と、音声入力装置308とは、バス309により接続される。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
株式会社東芝
電池
28日前
株式会社東芝
電解装置
28日前
株式会社東芝
除去装置
7日前
株式会社東芝
電源回路
28日前
株式会社東芝
半導体装置
29日前
株式会社東芝
半導体装置
25日前
株式会社東芝
半導体装置
25日前
株式会社東芝
半導体装置
1か月前
株式会社東芝
真空バルブ
1か月前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体回路
25日前
株式会社東芝
半導体装置
28日前
株式会社東芝
半導体装置
25日前
株式会社東芝
半導体装置
25日前
株式会社東芝
半導体装置
28日前
株式会社東芝
半導体装置
29日前
株式会社東芝
コンデンサ
28日前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
28日前
株式会社東芝
半導体装置
28日前
株式会社東芝
半導体装置
28日前
株式会社東芝
扉開閉装置
1か月前
株式会社東芝
半導体装置
1か月前
株式会社東芝
真空バルブ
9日前
株式会社東芝
ストレージ
28日前
株式会社東芝
半導体装置
28日前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
28日前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
28日前
株式会社東芝
半導体装置
28日前
株式会社東芝
半導体装置
28日前
株式会社東芝
半導体装置
28日前
株式会社東芝
半導体装置
28日前
株式会社東芝
半導体装置
28日前
続きを見る
他の特許を見る