TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2024126731
公報種別
公開特許公報(A)
公開日
2024-09-20
出願番号
2023035307
出願日
2023-03-08
発明の名称
演算処理装置
出願人
株式会社デンソー
代理人
個人
,
個人
主分類
G06N
3/063 20230101AFI20240912BHJP(計算;計数)
要約
【課題】 本発明は、演算処理装置を提供することを目的とする。
【解決手段】 ニューラルネットワークを実行するモデルを用いて推論を行う演算処理装置であって、演算処理装置は、入力を受け付けたデータを、モデルに入力して推論処理を実行する推論処理部(11)と、推論した出力値の精度が所定の条件を充足しているかを判定する判定処理部(12)と、判定処理部において所定の条件を充足していると判定した場合に、演算処理の精度を変更する変更処理部(13)と、を有する演算処理装置である。
【選択図】 図1
特許請求の範囲
【請求項1】
ニューラルネットワークを実行するモデルを用いて推論を行う演算処理装置(1)であって、
前記演算処理装置は、
入力を受け付けたデータを、前記モデルに入力して推論処理を実行する推論処理部(11)と、
前記推論した出力値の精度が所定の条件を充足しているかを判定する判定処理部(12)と、
前記判定処理部において所定の条件を充足していると判定した場合に、演算処理の精度を変更する変更処理部(13)と、
を有する演算処理装置。
続きを表示(約 900 文字)
【請求項2】
前記判定処理部は、
前記推論処理部における推論処理において異常を検出した場合には、前記所定の条件を充足したと判定する、
請求項1に記載の演算処理装置。
【請求項3】
前記判定処理部は、
前記推論処理部における推論処理においてオーバーフローまたはエラーを検出した場合には、前記所定の条件を充足したと判定する、
請求項2に記載の演算処理装置。
【請求項4】
前記判定処理部は、
前記出力値が、過去の所定回数分の出力値のダイナミックレンジまたは分散と比較して異常であると判定する場合には、前記所定の条件を充足したと判定する、
請求項1に記載の演算処理装置。
【請求項5】
前記変更処理部は、
量子化パラメータを変更することで、前記演算処理の精度を変更する、
請求項1に記載の演算処理装置。
【請求項6】
前記推論処理部は、
複数の演算精度のレイヤにより推論処理を実行し、
前記変更処理部は、
前記判定処理部において前記所定の条件を充足していると判定した演算精度のレイヤの出力値よりも、高い演算精度のレイヤの出力値を用いる、
請求項1に記載の演算処理装置。
【請求項7】
前記推論処理部は、
前記判定処理部において、前記推論した出力値の精度が所定の条件を充足していない、と判定した場合には、他の演算精度のレイヤの推論処理を中止する、
請求項6に記載の演算処理装置。
【請求項8】
ニューラルネットワークを実行するモデルを用いて推論を行う演算処理装置における制御方法であって、
前記演算処理装置は、
入力を受け付けたデータを、前記モデルに入力して推論処理を実行し、
前記推論した出力値の精度が所定の条件を充足しているかを判定し、
前記判定において所定の条件を充足していると判定した場合に、演算処理の精度を変更する、
演算処理装置の制御方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、演算処理装置に関する。
続きを表示(約 1,000 文字)
【背景技術】
【0002】
ニューラルネットワークを実行するモデルを、何らかの装置に組み込んで実行する場合に、そのモデルを小さくすることが求められている。このモデルを小さくすることは量子化として知られている。
【0003】
事前に想定した入力値を用いて量子化したモデルでは、実際のデータを入力したニューラルネットワークでの推論において、オーバーフローやS/N比の悪化により、推論精度が落ちてしまう場合がある。
【0004】
そこで、想定する入力値を何セットか用意しておき量子化したモデルを、事前に複数作成しておく方法がある。しかし、実際の入力データに対して推論結果が適切かどうかは保証できない。
【0005】
別の方法として、実際の入力データに応じて動的に量子化を行う方法がある(下記特許文献1)。
【先行技術文献】
【特許文献】
【0006】
特開2022-117866号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
入力データに応じて動的に量子化を行う方法では、処理時間が必要となるため、入力が急激に変化した場合にそれに追従して処理を行うことが難しい。
【課題を解決するための手段】
【0008】
そこで本発明者は上記課題に鑑み、入力データに応じて動的に量子化を行う場合に、処理時間の増加を抑えつつ、推論の精度向上を行うことができる演算処理装置を発明した。
【0009】
本発明は、上記課題を解決するために以下の技術的手段を採用する。特許請求の範囲及びこの項に記載した括弧内の符号は、ひとつの態様として後述する実施形態に記載の具体的手段との対応関係を示す一例であって、本発明の技術的範囲を限定するものではない。
【0010】
本発明の演算処理装置は、ニューラルネットワークを実行するモデルを用いて推論を行う演算処理装置(1)であって、前記演算処理装置は、入力を受け付けたデータを、前記モデルに入力して推論処理を実行する推論処理部(11)と、前記推論した出力値の精度が所定の条件を充足しているかを判定する判定処理部(12)と、前記判定処理部において所定の条件を充足していると判定した場合に、演算処理の精度を変更する変更処理部(13)と、を有する。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
マウス用テーブル
1か月前
個人
管理装置
1か月前
アズビル株式会社
防爆装置
26日前
個人
特徴検討支援システム
1か月前
個人
人的価値発掘システム
16日前
個人
業界地図作成システム
13日前
個人
契約管理サーバ
1か月前
キヤノン電子株式会社
情報処理装置
16日前
株式会社セガフェイブ
遊戯機
1か月前
株式会社宗建
SNSサーバー
24日前
個人
配送システムおよび同包箱
16日前
株式会社ジール
文章の分析装置
1か月前
個人
選択操作音声出力システム
1か月前
ミサワホーム株式会社
システム
16日前
ミサワホーム株式会社
管理装置
16日前
キヤノン株式会社
印刷制御装置
4日前
株式会社奥村組
削孔位置検出方法
1か月前
個人
動作のデザイン評価の方法及び装置
23日前
大同特殊鋼株式会社
棒材計数装置
23日前
トヨタ自動車株式会社
車両
1か月前
アスエネ株式会社
森林管理の方法
26日前
オムロン株式会社
認証中継サーバ
23日前
個人
口座悪用を防止する口座管理システム
18日前
株式会社チノー
ユーザ認証システム
11日前
株式会社八咲
イベント管理システム
23日前
トヨタ自動車株式会社
作業評価装置
2日前
日本電気株式会社
システム及び方法
1か月前
個人
分類処理プログラム、システム及び方法
1か月前
個人
分類処理プログラム、システム及び方法
1か月前
セコム株式会社
監視装置
1か月前
セコム株式会社
監視装置
1か月前
三菱電機モビリティ株式会社
メモリ制御装置
17日前
スタートバーン株式会社
管理装置
1か月前
株式会社ウェイビー
情報提供装置
17日前
ミサワホーム株式会社
水素配送システム
16日前
株式会社コペル
自立就労支援方法
1か月前
続きを見る
他の特許を見る