TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025015893
公報種別公開特許公報(A)
公開日2025-01-31
出願番号2023118774
出願日2023-07-21
発明の名称学習装置及び推論装置
出願人個人
代理人個人
主分類G06T 1/40 20060101AFI20250124BHJP(計算;計数)
要約【課題】機械学習によるデータ処理において、元となる教師データの水増しを行って学習を行う際にも、より高品質のデータを準備して、機械学習モデルの学習効率の低下を確実に抑えることができる学習装置を提供する。
【解決手段】学習装置は、元となる教師データの入力を受け付ける入力部110と、元となる教師データに基づいて加工された加工後教師データを作成するデータ加工部113と、学習対象の機械学習モデル111を用いて、少なくとも加工後教師データを含む教師データに基づいて、学習対象の機械学習モデル111における設定値を学習する処理を実行するための学習処理実行部101と、設定値を記憶する記憶部12と、を備える。この構成により、学習装置では、機械学習によるデータ処理において、元となる教師データの水増しを行って学習を行う際にも、より高品質のデータを準備して、機械学習モデル111の学習効率の低下を抑えることができる。
【選択図】図2
特許請求の範囲【請求項1】
教師データに基づいて機械学習モデルにおける設定値を学習する学習装置であって、
元となる教師データの入力を受け付ける入力部と、
前記元となる教師データに基づいて加工された加工後教師データを作成するデータ加工部と、
学習対象の機械学習モデルと、前記機械学習モデルを用いて、少なくとも前記加工後教師データを含む教師データに基づいて、前記学習対象の機械学習モデルにおける設定値を学習する処理を実行するための学習処理実行部と、
前記設定値を記憶する記憶部と、を備え、
前記データ加工部では、
前記加工後教師データの目標解像度を特定し、
前記元となる教師データに基づいて前記目標解像度を有する画像の所定倍の大きさの暫定基準画像を獲得し、
前記暫定基準画像に対する回転、移動又は変形を含む編集を受け付け、
編集実行後の前記暫定基準画像に対し、前記所定倍よりも高い倍率のサンプリングレートでサンプリングし、
当該サンプリング後の画像を、前記目標解像度を有する画像の大きさに変換したものを前記加工後教師データとする、ことを特徴とする学習装置。
続きを表示(約 1,600 文字)【請求項2】
前記学習装置は、さらに、
前記元となる教師データの周囲を予め自動生成してより大きな教師データを作成するアウトペインティングモデルを有し、
前記データ加工部は、前記アウトペインティングモデルにより作成された教師データを、前記加工後教師データに変換する、ことを特徴とする請求項1記載の学習装置。
【請求項3】
前記データ加工部は、
編集実行後の前記暫定基準画像に対し、前記編集に応じてオーバーサンプルのレートを前記所定倍よりも高い倍率以上で決定し、
決定されたレートでオーバーサンプリングを行ない、
オーバーサンプリングにより得られた画像を、前記加工後教師データへ変換する、ことを特徴とする請求項1記載の学習装置。
【請求項4】
前記学習装置は、さらに、
前記元となる教師データの解像度が前記目標解像度の前記所定倍未満である場合、前記元となる教師データに基づいて前記所定倍の超解像画像を作成する超解像モデルを有し、
前記データ加工部においては、前記超解像モデルで作成された当該超解像画像を前記暫定基準画像とする、ことを特徴とする請求項1記載の学習装置。
【請求項5】
請求項1乃至4の何れか一項に記載の学習装置の学習処理実行部において前記設定値を学習された機械学習モデルの、少なくとも一部を損失関数として用いることを特徴とする学習装置。
【請求項6】
機械学習モデルを用いて対象データに対して所定の推論処理を実行する推論装置であって、
前記対象データの入力を受け付ける入力部と、
前記入力部から対象データが入力される機械学習モデルと、
推論処理を実行する機械学習モデルを用いて、対象データに対して所定の推論処理を実行する推論処理実行部と、を備え、
前記機械学習モデルは、請求項1乃至4の何れか一項に記載の学習装置の学習処理実行部において前記設定値を学習された機械学習モデルである、ことを特徴とする推論装置。
【請求項7】
コンピュータを請求項1~4の何れか1項に記載の学習装置として動作させる、ことを特徴とするコンピュータプログラム。
【請求項8】
コンピュータを請求項5に記載の学習装置として動作させる、ことを特徴とするコンピュータプログラム。
【請求項9】
コンピュータを請求項6に記載の推論装置として動作させる、ことを特徴とするコンピュータプログラム。
【請求項10】
教師データに基づいて機械学習モデルにおける設定値を学習する学習方法であって、
元となる教師データの入力を受け付ける入力ステップと、
前記元となる教師データに基づいて加工された加工後教師データを作成するデータ加工ステップと、
学習対象の機械学習モデルと、前記機械学習モデルを用いて、少なくとも前記加工後教師データを含む教師データに基づいて、前記学習対象の機械学習モデルにおける設定値を学習する処理を実行するための学習処理実行ステップと、
前記設定値を記憶する記憶ステップと、を含み、
前記データ加工ステップにおいては、
前記加工後教師データの目標解像度を特定し、
前記元となる教師データに基づいて前記目標解像度を有する画像の所定倍の大きさの暫定基準画像を獲得し、
前記暫定基準画像に対する回転、移動又は変形を含む編集を受け付け、
編集実行後の前記暫定基準画像に対し、前記所定倍よりも高い倍率のサンプリングレートでサンプリングし、
当該サンプリング後の画像を、前記目標解像度を有する画像の大きさに変換したものを前記加工後教師データとする、ことを特徴とする学習方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、機械学習モデルを用いた学習装置及び推論装置に関し、特に、画像処理用の機械学習モデルを用いた学習装置及び推論装置に関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
従来より、機械学習によるデータ処理方法で、コンピュータのプログラムに対して、教師データとなるデータセットを与えて、プログラムのパラメータを学習することで、任意のデータに対してデータ処理を行うことができる学習済みモデルを生成する方法が知られている。
【0003】
例えば、機械学習を用いた「入力画像(教師データ)→学習用プログラム→出力画像(教師データ)」という処理において、入力画像と出力画像の誤差が一番小さくなるように学習用プログラムのパラメータを計算して「学習済みモデル」を生成する。そして、この「学習済モデル」を用いることで、「入力画像(任意のデータ:例えば低解像度画像)→学習済みモデル→出力画像(推論データ:例えば高解像度画像)」という、入力画像から出力画像を推論することで出力画像を生成することができる。
【0004】
近年、機械学習のうちニューラルネットワークを用いた機械学習が多くの分野に適用されている。特に画像認識、音声認識の分野にて、ニューラルネットワークを多層構造で使用したディープラーニング(Deep Learning;深層学習) が高い認識精度を発揮している。多層化したディープラーニングでも、入力の特徴を抽出する畳み込み層及びプーリング層を複数回使用した畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を用いた画像処理が行なわれている。
【0005】
そして、ニューラルネットワークを用いた画像処理としては、信号を高解像度化させる超解像装置(例えば、特許文献1参照)や疾患領域の違いを把握することを容易にして精度の高い診断支援を行う診断支援装置(例えば、特許文献2参照)などがある。また、デジタル画像に対する自由変形による劣化を回避したプログラム、画像処理方法及び画像処理装置も開示されている(例えば、特許文献3参照)。
【先行技術文献】
【特許文献】
【0006】
特開2020-27557号公報
特開2018-38789号公報
特許第6570164号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
機械学習において、教師データの質と量は、そのまま機械学習モデルの性能に直結する。大量の高品質の学習用データセットを準備することは非常なる労力を有するため、少ない学習用データで、高い性能を得るために、学習データの水増し(Data Augmentation)が一般的に用いられている。
【0008】
例えば、少ない教師画像データから効率よく学習を行うために、拡大・縮小、回転、菱形・台形変形、シフト、カラーシフト、シャープネス・アンシャープネスなどの編集を教師用データに適用して、データ量の水増し(Data Augmentation)を行う。このうちの拡大・縮小、回転、菱形・台形変形、シフトは、小さい画像データをそのまま変形した場合にはボケやエイリアスを生じるので、データの水増しを行った場合は常に一定以上ボケやノイズが発生した水増しデータが新たに生成される。このため、従来のデータ水増しにおいては、画質のいい画像に含まれる微細な高周波データを切り捨てているので、このように画質の劣化した水増しデータを用いて学習すると、反って機械学習モデルの性能が悪化するという問題が生じる。
【0009】
そして、上記特許文献1乃至3においても少ない学習用データから高品質の学習用データを多量に準備するという内容に関しては開示されていない。
【0010】
本発明は、上記課題に鑑みてなされたものであり、機械学習によるデータ処理において、元となる教師データの水増しを行って学習を行う際にも、より高品質のデータを準備して、機械学習モデルの学習効率の低下を確実に抑えることができる学習装置を提供することを目的とする。また、この機械学習モデルを用いた推論装置を提供することをも目的とする。
【課題を解決するための手段】
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

個人
裁判のAI化
2か月前
個人
情報処理システム
2か月前
個人
工程設計支援装置
1か月前
個人
フラワーコートA
1か月前
個人
検査システム
2か月前
個人
為替ポイント伊達夢貯
14日前
個人
介護情報提供システム
1か月前
個人
冷凍食品輸出支援構造
14日前
個人
表変換編集支援システム
7日前
個人
携帯情報端末装置
1か月前
個人
設計支援システム
1か月前
個人
設計支援システム
1か月前
個人
不動産売買システム
2か月前
個人
知財出願支援AIシステム
14日前
株式会社サタケ
籾摺・調製設備
2か月前
個人
結婚相手紹介支援システム
1か月前
キヤノン電子株式会社
携帯装置
2か月前
個人
AIによる情報の売買の仲介
16日前
株式会社カクシン
支援装置
1か月前
個人
行動時間管理システム
9日前
個人
パスワード管理支援システム
7日前
個人
システム及びプログラム
今日
個人
AIキャラクター制御システム
7日前
個人
パスポートレス入出国システム
20日前
個人
アンケート支援システム
1か月前
株式会社アジラ
進入判定装置
20日前
日本精機株式会社
施工管理システム
16日前
個人
備蓄品の管理方法
2か月前
個人
冷凍加工連携型農場運用システム
14日前
個人
食事受注会計処理システム
21日前
キヤノン株式会社
情報処理装置
2か月前
キヤノン株式会社
情報処理装置
2か月前
大阪瓦斯株式会社
住宅設備機器
28日前
個人
音声対話型帳票生成支援システム
7日前
サクサ株式会社
中継装置
2か月前
個人
人格進化型対話応答制御システム
7日前
続きを見る