TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025015893
公報種別公開特許公報(A)
公開日2025-01-31
出願番号2023118774
出願日2023-07-21
発明の名称学習装置及び推論装置
出願人個人
代理人個人
主分類G06T 1/40 20060101AFI20250124BHJP(計算;計数)
要約【課題】機械学習によるデータ処理において、元となる教師データの水増しを行って学習を行う際にも、より高品質のデータを準備して、機械学習モデルの学習効率の低下を確実に抑えることができる学習装置を提供する。
【解決手段】学習装置は、元となる教師データの入力を受け付ける入力部110と、元となる教師データに基づいて加工された加工後教師データを作成するデータ加工部113と、学習対象の機械学習モデル111を用いて、少なくとも加工後教師データを含む教師データに基づいて、学習対象の機械学習モデル111における設定値を学習する処理を実行するための学習処理実行部101と、設定値を記憶する記憶部12と、を備える。この構成により、学習装置では、機械学習によるデータ処理において、元となる教師データの水増しを行って学習を行う際にも、より高品質のデータを準備して、機械学習モデル111の学習効率の低下を抑えることができる。
【選択図】図2
特許請求の範囲【請求項1】
教師データに基づいて機械学習モデルにおける設定値を学習する学習装置であって、
元となる教師データの入力を受け付ける入力部と、
前記元となる教師データに基づいて加工された加工後教師データを作成するデータ加工部と、
学習対象の機械学習モデルと、前記機械学習モデルを用いて、少なくとも前記加工後教師データを含む教師データに基づいて、前記学習対象の機械学習モデルにおける設定値を学習する処理を実行するための学習処理実行部と、
前記設定値を記憶する記憶部と、を備え、
前記データ加工部では、
前記加工後教師データの目標解像度を特定し、
前記元となる教師データに基づいて前記目標解像度を有する画像の所定倍の大きさの暫定基準画像を獲得し、
前記暫定基準画像に対する回転、移動又は変形を含む編集を受け付け、
編集実行後の前記暫定基準画像に対し、前記所定倍よりも高い倍率のサンプリングレートでサンプリングし、
当該サンプリング後の画像を、前記目標解像度を有する画像の大きさに変換したものを前記加工後教師データとする、ことを特徴とする学習装置。
続きを表示(約 1,600 文字)【請求項2】
前記学習装置は、さらに、
前記元となる教師データの周囲を予め自動生成してより大きな教師データを作成するアウトペインティングモデルを有し、
前記データ加工部は、前記アウトペインティングモデルにより作成された教師データを、前記加工後教師データに変換する、ことを特徴とする請求項1記載の学習装置。
【請求項3】
前記データ加工部は、
編集実行後の前記暫定基準画像に対し、前記編集に応じてオーバーサンプルのレートを前記所定倍よりも高い倍率以上で決定し、
決定されたレートでオーバーサンプリングを行ない、
オーバーサンプリングにより得られた画像を、前記加工後教師データへ変換する、ことを特徴とする請求項1記載の学習装置。
【請求項4】
前記学習装置は、さらに、
前記元となる教師データの解像度が前記目標解像度の前記所定倍未満である場合、前記元となる教師データに基づいて前記所定倍の超解像画像を作成する超解像モデルを有し、
前記データ加工部においては、前記超解像モデルで作成された当該超解像画像を前記暫定基準画像とする、ことを特徴とする請求項1記載の学習装置。
【請求項5】
請求項1乃至4の何れか一項に記載の学習装置の学習処理実行部において前記設定値を学習された機械学習モデルの、少なくとも一部を損失関数として用いることを特徴とする学習装置。
【請求項6】
機械学習モデルを用いて対象データに対して所定の推論処理を実行する推論装置であって、
前記対象データの入力を受け付ける入力部と、
前記入力部から対象データが入力される機械学習モデルと、
推論処理を実行する機械学習モデルを用いて、対象データに対して所定の推論処理を実行する推論処理実行部と、を備え、
前記機械学習モデルは、請求項1乃至4の何れか一項に記載の学習装置の学習処理実行部において前記設定値を学習された機械学習モデルである、ことを特徴とする推論装置。
【請求項7】
コンピュータを請求項1~4の何れか1項に記載の学習装置として動作させる、ことを特徴とするコンピュータプログラム。
【請求項8】
コンピュータを請求項5に記載の学習装置として動作させる、ことを特徴とするコンピュータプログラム。
【請求項9】
コンピュータを請求項6に記載の推論装置として動作させる、ことを特徴とするコンピュータプログラム。
【請求項10】
教師データに基づいて機械学習モデルにおける設定値を学習する学習方法であって、
元となる教師データの入力を受け付ける入力ステップと、
前記元となる教師データに基づいて加工された加工後教師データを作成するデータ加工ステップと、
学習対象の機械学習モデルと、前記機械学習モデルを用いて、少なくとも前記加工後教師データを含む教師データに基づいて、前記学習対象の機械学習モデルにおける設定値を学習する処理を実行するための学習処理実行ステップと、
前記設定値を記憶する記憶ステップと、を含み、
前記データ加工ステップにおいては、
前記加工後教師データの目標解像度を特定し、
前記元となる教師データに基づいて前記目標解像度を有する画像の所定倍の大きさの暫定基準画像を獲得し、
前記暫定基準画像に対する回転、移動又は変形を含む編集を受け付け、
編集実行後の前記暫定基準画像に対し、前記所定倍よりも高い倍率のサンプリングレートでサンプリングし、
当該サンプリング後の画像を、前記目標解像度を有する画像の大きさに変換したものを前記加工後教師データとする、ことを特徴とする学習方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、機械学習モデルを用いた学習装置及び推論装置に関し、特に、画像処理用の機械学習モデルを用いた学習装置及び推論装置に関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
従来より、機械学習によるデータ処理方法で、コンピュータのプログラムに対して、教師データとなるデータセットを与えて、プログラムのパラメータを学習することで、任意のデータに対してデータ処理を行うことができる学習済みモデルを生成する方法が知られている。
【0003】
例えば、機械学習を用いた「入力画像(教師データ)→学習用プログラム→出力画像(教師データ)」という処理において、入力画像と出力画像の誤差が一番小さくなるように学習用プログラムのパラメータを計算して「学習済みモデル」を生成する。そして、この「学習済モデル」を用いることで、「入力画像(任意のデータ:例えば低解像度画像)→学習済みモデル→出力画像(推論データ:例えば高解像度画像)」という、入力画像から出力画像を推論することで出力画像を生成することができる。
【0004】
近年、機械学習のうちニューラルネットワークを用いた機械学習が多くの分野に適用されている。特に画像認識、音声認識の分野にて、ニューラルネットワークを多層構造で使用したディープラーニング(Deep Learning;深層学習) が高い認識精度を発揮している。多層化したディープラーニングでも、入力の特徴を抽出する畳み込み層及びプーリング層を複数回使用した畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を用いた画像処理が行なわれている。
【0005】
そして、ニューラルネットワークを用いた画像処理としては、信号を高解像度化させる超解像装置(例えば、特許文献1参照)や疾患領域の違いを把握することを容易にして精度の高い診断支援を行う診断支援装置(例えば、特許文献2参照)などがある。また、デジタル画像に対する自由変形による劣化を回避したプログラム、画像処理方法及び画像処理装置も開示されている(例えば、特許文献3参照)。
【先行技術文献】
【特許文献】
【0006】
特開2020-27557号公報
特開2018-38789号公報
特許第6570164号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
機械学習において、教師データの質と量は、そのまま機械学習モデルの性能に直結する。大量の高品質の学習用データセットを準備することは非常なる労力を有するため、少ない学習用データで、高い性能を得るために、学習データの水増し(Data Augmentation)が一般的に用いられている。
【0008】
例えば、少ない教師画像データから効率よく学習を行うために、拡大・縮小、回転、菱形・台形変形、シフト、カラーシフト、シャープネス・アンシャープネスなどの編集を教師用データに適用して、データ量の水増し(Data Augmentation)を行う。このうちの拡大・縮小、回転、菱形・台形変形、シフトは、小さい画像データをそのまま変形した場合にはボケやエイリアスを生じるので、データの水増しを行った場合は常に一定以上ボケやノイズが発生した水増しデータが新たに生成される。このため、従来のデータ水増しにおいては、画質のいい画像に含まれる微細な高周波データを切り捨てているので、このように画質の劣化した水増しデータを用いて学習すると、反って機械学習モデルの性能が悪化するという問題が生じる。
【0009】
そして、上記特許文献1乃至3においても少ない学習用データから高品質の学習用データを多量に準備するという内容に関しては開示されていない。
【0010】
本発明は、上記課題に鑑みてなされたものであり、機械学習によるデータ処理において、元となる教師データの水増しを行って学習を行う際にも、より高品質のデータを準備して、機械学習モデルの学習効率の低下を確実に抑えることができる学習装置を提供することを目的とする。また、この機械学習モデルを用いた推論装置を提供することをも目的とする。
【課題を解決するための手段】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
情報処理システム
5日前
個人
記入設定プラグイン
21日前
個人
検査システム
7日前
個人
不動産売買システム
13日前
株式会社サタケ
籾摺・調製設備
6日前
キヤノン電子株式会社
携帯装置
6日前
個人
備蓄品の管理方法
5日前
キヤノン株式会社
情報処理装置
6日前
キヤノン株式会社
情報処理装置
6日前
株式会社BONNOU
管理装置
26日前
サクサ株式会社
中継装置
6日前
キヤノン電子株式会社
名刺管理システム
7日前
株式会社ワコム
電子消去具
13日前
東洋電装株式会社
操作装置
6日前
アスエネ株式会社
排水量管理方法
6日前
東洋電装株式会社
操作装置
6日前
ホシデン株式会社
タッチ入力装置
13日前
株式会社東芝
電子機器
14日前
個人
パターン抽出方法及び通信多重化方法
12日前
株式会社ライト
情報処理装置
26日前
株式会社JVCケンウッド
管理装置
7日前
株式会社CBE-A
情報処理システム
12日前
大王製紙株式会社
RFIDタグ
12日前
個人
システム、データおよびプログラム
22日前
キヤノン株式会社
通信端末
7日前
株式会社寺岡精工
顔認証システム
7日前
株式会社半導体エネルギー研究所
検索支援方法
26日前
株式会社半導体エネルギー研究所
会計システム
19日前
アスエネ株式会社
廃棄物排出量管理方法
6日前
株式会社NONAME
物々交換システム
5日前
株式会社カノア
物流拠点無人監視システム
5日前
株式会社カノア
物流業務事故予測システム
5日前
株式会社寺岡精工
システム、サーバ
5日前
協栄産業株式会社
乱数生成装置
5日前
キヤノン株式会社
印刷システム
12日前
株式会社共同経営
農企業用の経営診断システム
21日前
続きを見る