TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025112795
公報種別公開特許公報(A)
公開日2025-08-01
出願番号2024007266
出願日2024-01-22
発明の名称情報処理装置、情報処理装置の制御方法およびプログラム
出願人キヤノン株式会社
代理人個人
主分類G06N 3/094 20230101AFI20250725BHJP(計算;計数)
要約【課題】効率よく学習データを選択して学習データによる学習効率の不均一性を改善し、ニューラルネットワークモデルの精度を向上できるようにする。
【解決手段】まず、事前に学習データセットをクラスタリングして複数のクラスタの何れかに分類する。そして、前記学習データセットの正解値と、ニューラルネットワークモデルによる学習データの推論結果との差異が閾値以上となる苦手画像データを含むか否かを判定し、苦手画像データが存在する場合には、苦手画像データを同じ分類器でクラスタリングして苦手画像データの属するクラスタを特定する。そして、そのクラスタ内のデータと苦手画像データとの類似度を算出し、類似度の高いデータから学習データに追加する。
【選択図】図1
特許請求の範囲【請求項1】
ニューラルネットワークモデルを学習するための学習データセットをクラスタリングして複数のクラスタの何れかに分類する分類手段と、
前記学習データセットの正解値と、前記ニューラルネットワークモデルによる学習データの推論結果または学習時とは異なる検証データとの差異が閾値以上となる画像データを判定する判定手段と、
前記判定手段によって判定された画像データの属するクラスタを前記複数のクラスタの中から特定し、前記分類手段によって前記特定されたクラスタに分類されたデータと、前記判定された画像データとの類似度を算出する算出手段と、
前記特定されたクラスタに分類されたデータのうち、前記算出手段で算出した類似度が所定値以上であるデータを、前記ニューラルネットワークモデルを学習するための学習データとして選択する選択手段と、
を備えることを特徴とする情報処理装置。
続きを表示(約 890 文字)【請求項2】
前記分類手段は、評価指標毎、時系列毎または画像特性毎でラベル付けした教師データを用いた教師あり学習によって生成された分類器を用いて分類することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記評価指標は、SNR(Signal to Noise Ratio)、PSNR(Peak Signal to Noise Ratio)、SSIM(Structual SIMilarity)、またはMSE(Mean Squared Error)であることを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記画像特性は、輝度、明度、または彩度であることを特徴とする請求項2に記載の情報処理装置。
【請求項5】
前記分類手段は、教師なし学習を用いて生成された分類器を用いて、画像の特徴ベクトルの類似度に応じた分類を行うことを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記分類手段は、階層的クラスタリングまたは非階層的クラスタリングを用いて生成された分類器を用いて分類することを特徴とする請求項1に記載の情報処理装置。
【請求項7】
前記判定手段は、学習データを局所的な領域に分割し、それぞれの局所的な領域について前記正解値との差異を算出することにより判定することを特徴とする請求項1に記載の情報処理装置。
【請求項8】
前記算出手段は、前記分類手段が用いた分類器と同一の分類器を用いて前記判定された画像データの属するクラスタを前記複数のクラスタの中から特定することを特徴とする請求項1に記載の情報処理装置。
【請求項9】
前記算出手段は、画像の特徴量を用いて類似度を算出することを特徴とする請求項1に記載の情報処理装置。
【請求項10】
前記算出手段は、前記画像の特徴量をベクトルに変換し、ベクトル間の距離により類似度を算出することを特徴とする請求項9に記載の情報処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、特に、学習データを選択するために用いて好適な情報処理装置、情報処理装置の制御方法およびプログラムに関する。
続きを表示(約 1,800 文字)【背景技術】
【0002】
近年、AIを活用した様々なサービスが提供されており、任意の事象の予測を行うAIを実現するモデルを構築する方法として、機械学習を利用する方法が知られている。機械学習モデルのアルゴリズムの一つとしては、入力及び正解ラベルから構成される学習データを用いた教師有り学習が知られている。
【0003】
教師有り学習を用いてモデルを構築する場合、質の高い学習データを用いて学習を行うことによって過学習を抑制し、また、予測精度を向上させることができる。ここで、質の高い学習データとは、モデルの予測精度の向上効果が高い学習データを表す。また、特定の状況又は用途に適合させたモデルにチューニングするためには、状況又は用途が考慮された学習データを用いて学習を行う必要がある。したがって、教師有り学習では、使用する学習データを適切に選択することが重要である。
【0004】
そこで、学習データから意図していないデータを除外する方法が提案されている。特許文献1には、画像データ中の物体画像の特徴量とクラス情報に基づき事前にクラスタリングしておき、そのクラスタ内の複数重心と各特徴量との距離の平均/分散を利用して、誤ったクラス情報を含んだクラスタを特定する技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
特開2022-150552号公報
【非特許文献】
【0006】
Mathilde Caron, Piotr Bojanowski, Armand Joulin, and Matthijs Douse: Deep Clustering for UnsupervisedLearning of Visual Features
Krizhevsky, A., Sutskever, I., Hinton, G.E: Imagenet classification with deep convolutional neural networks.
【発明の概要】
【発明が解決しようとする課題】
【0007】
機械学習モデルが複数の評価指標を評価する際には、複数の評価指標のいずれにおいても一定以上の評価スコアが求められることがあり、特定の評価指標において評価スコアが低い場合は、該当の評価スコアを改善する必要がある。例えば学習データに偏りがある場合、特定のデータに対しては効率的に学習が進むが、他のデータに対しては効率的に学習が進まず、評価スコアが低いままとなってしまう。
【0008】
特許文献1に記載の方法では、意図しないデータを学習データから除外することにより学習データを適切に選択し、効率良く学習を行うことができるとしている。しかしながら、全クラスの中から誤ってクラスタリングしたデータを探索することは非常に多くの時間がかかる。また、クラスタ内の情報しか用いることができないため、ニューラルネットワークモデルの特定データに対する学習効率を十分に改善させることはできない。
【0009】
本発明は前述の問題点に鑑み、効率よく学習データを選択して学習データによる学習効率の不均一性を改善し、ニューラルネットワークモデルの精度を向上できるようにすることを目的としている。
【課題を解決するための手段】
【0010】
本発明に係る情報処理装置は、ニューラルネットワークモデルを学習するための学習データセットをクラスタリングして複数のクラスタの何れかに分類する分類手段と、前記学習データセットの正解値と、前記ニューラルネットワークモデルによる学習データの推論結果または学習時とは異なる検証データとの差異が閾値以上となる画像データを判定する判定手段と、前記判定手段によって判定された画像データの属するクラスタを前記複数のクラスタの中から特定し、前記分類手段によって前記特定されたクラスタに分類されたデータと、前記判定された画像データとの類似度を算出する算出手段と、前記特定されたクラスタに分類されたデータのうち、前記算出手段で算出した類似度が所定値以上であるデータを、前記ニューラルネットワークモデルを学習するための学習データとして選択する選択手段と、を備えることを特徴とする。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

キヤノン株式会社
トナー
27日前
キヤノン株式会社
トナー
27日前
キヤノン株式会社
撮像装置
28日前
キヤノン株式会社
通信端末
27日前
キヤノン株式会社
電子機器
18日前
キヤノン株式会社
電源装置
5日前
キヤノン株式会社
現像装置
今日
キヤノン株式会社
撮像装置
10日前
キヤノン株式会社
プログラム
6日前
キヤノン株式会社
レンズ装置
3日前
キヤノン株式会社
画像形成装置
12日前
キヤノン株式会社
画像形成装置
10日前
キヤノン株式会社
画像形成装置
26日前
キヤノン株式会社
画像形成装置
3日前
キヤノン株式会社
情報処理装置
26日前
キヤノン株式会社
画像形成装置
4日前
キヤノン株式会社
情報処理装置
26日前
キヤノン株式会社
画像形成装置
25日前
キヤノン株式会社
画像形成装置
25日前
キヤノン株式会社
画像形成装置
19日前
キヤノン株式会社
画像形成装置
19日前
キヤノン株式会社
画像形成装置
4日前
キヤノン株式会社
画像形成装置
12日前
キヤノン株式会社
画像形成装置
4日前
キヤノン株式会社
画像形成装置
19日前
キヤノン株式会社
画像形成装置
10日前
キヤノン株式会社
画像形成装置
7日前
キヤノン株式会社
画像形成装置
18日前
キヤノン株式会社
電子写真装置
18日前
キヤノン株式会社
画像形成装置
18日前
キヤノン株式会社
液体収容容器
5日前
キヤノン株式会社
画像形成装置
11日前
キヤノン株式会社
記録素子基板
5日前
キヤノン株式会社
撮像システム
12日前
キヤノン株式会社
電子写真装置
10日前
キヤノン株式会社
画像形成装置
4日前
続きを見る