TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024164562
公報種別公開特許公報(A)
公開日2024-11-27
出願番号2023080141
出願日2023-05-15
発明の名称情報処理装置及び情報処理方法
出願人ソフトバンク株式会社,学校法人明星学苑
代理人弁理士法人酒井国際特許事務所
主分類G06F 18/2431 20230101AFI20241120BHJP(計算;計数)
要約【課題】小型化された分類モデルを用いて詳細な分類を行うことを可能とする。
【解決手段】本願に係る情報処理装置は、複数の異なるクラスにそれぞれ属するデータに関する特徴量であって、複数の異なるクラスそれぞれの代表値である複数のクラス特徴量の類似度に基づいて、階層的にクラスタリングされた複数のクラス特徴量に基づく階層的なクラスタの各々に対応するクラスであって、複数の異なるクラスよりも上位のクラスである上位クラスを生成するクラス生成部と、分類対象となる分類対象データを、上位クラスの下位に属する複数の下位クラスのうちいずれかの下位クラスに分類する機械学習モデルである分類モデルを上位クラスごとに生成するモデル生成部と、を備える。
【選択図】図2
特許請求の範囲【請求項1】
複数の異なるクラスにそれぞれ属するデータに関する特徴量であって、前記複数の異なるクラスそれぞれの代表値である複数のクラス特徴量の類似度に基づいて、階層的にクラスタリングされた前記複数のクラス特徴量に基づく階層的なクラスタの各々に対応するクラスであって、前記複数の異なるクラスよりも上位のクラスである上位クラスを生成するクラス生成部と、
分類対象となる分類対象データを、前記上位クラスの下位に属する複数の下位クラスのうちいずれかの下位クラスに分類する機械学習モデルである分類モデルを前記上位クラスごとに生成するモデル生成部と、
を備える情報処理装置。
続きを表示(約 1,800 文字)【請求項2】
前記クラス生成部は、
前記複数の異なるクラスにそれぞれ属するデータの特徴量の平均値を前記代表値として、前記上位クラスを生成する、
請求項1に記載の情報処理装置。
【請求項3】
前記クラス生成部は、
新たに生成されるクラスタの数が所定の閾値を下回るまで前記複数のクラス特徴量を階層的にクラスタリングする、
請求項1に記載の情報処理装置。
【請求項4】
前記クラス生成部は、
前記複数のクラス特徴量の類似度に基づいて、前記複数のクラス特徴量の各々を要素とするクラスタである複数の最下位クラスタの各々を結合することにより生成されるクラスタである複数の第1上位クラスタの各々に対応するクラスである複数の第1上位クラス、および、前記複数の第1上位クラスタの類似度に基づいて、前記複数の第1上位クラスタの各々を結合することにより生成されるクラスタである複数の第2上位クラスタの各々に対応するクラスである複数の第2上位クラスを生成することにより、前記上位クラスを生成する、
請求項1に記載の情報処理装置。
【請求項5】
前記クラス生成部は、
前記階層的なクラスタを生成する過程を表現するグラフである樹形図を生成し、
前記モデル生成部は、
前記樹形図に含まれる分岐点の数に対応する数の前記分類モデルを生成する、
請求項1に記載の情報処理装置。
【請求項6】
前記モデル生成部は、
前記複数の下位クラスの各々からサンプリングされるデータの数が類似するように前記複数の下位クラスの各々からサンプリングされたデータと、前記データが属する下位クラスに対応するラベルである下位ラベルとの組である学習データセットに基づいて学習された前記機械学習モデルである前記分類モデルを前記上位クラスごとに生成する、
請求項1に記載の情報処理装置。
【請求項7】
前記モデル生成部は、
前記データが入力情報として前記機械学習モデルに入力された場合、前記下位ラベルを出力情報として出力するよう学習された前記機械学習モデルである前記分類モデルを前記上位クラスごとに生成する、
請求項6に記載の情報処理装置。
【請求項8】
前記モデル生成部は、
前記分類対象データを前記複数の下位クラスまたは前記複数の下位クラスのいずれでもない未知のクラスのうちいずれかのクラスに分類する前記機械学習モデルである前記分類モデルを前記上位クラスごとに生成する、
請求項1に記載の情報処理装置。
【請求項9】
複数の異なるクラスにそれぞれ属するデータに関する特徴量であって、前記複数の異なるクラスそれぞれの代表値である複数のクラス特徴量の類似度に基づいて、階層的にクラスタリングされた前記複数のクラス特徴量に基づく階層的なクラスタの各々に対応するクラスであって、前記複数の異なるクラスよりも上位のクラスである上位クラスの下位に属する複数の下位クラスのうちいずれかの下位クラスに分類対象となる分類対象データを分類する機械学習モデルである分類モデルと、処理対象となる処理対象データとを取得する取得部と、
最上位のクラスに対応する前記分類モデルから順番に選択される所定の上位クラスに対応する前記分類モデルである上位の分類モデルを用いて、前記処理対象データが分類される第1下位クラスを推定し、前記上位の分類モデルの推定結果に基づいて、前記所定の上位クラスの下位に属する複数の下位クラスの各々に対応する前記分類モデルの中から、前記第1下位クラスに対応する前記分類モデルである下位の分類モデルを選択し、選択された前記下位の分類モデルを用いて、前記処理対象データが分類される第2下位クラスを推定する推定部と、
を備える情報処理装置。
【請求項10】
前記推定部は、
前記処理対象データが前記複数の異なるクラスのいずれかに分類されるまで、前記上位の分類モデルの推定結果に基づいて、前記複数の下位クラスの各々に対応する前記分類モデルの中から、前記下位の分類モデルを選択し、選択された前記下位の分類モデルを用いて前記第2下位クラスを推定する処理を繰り返し実行する、
請求項9に記載の情報処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、情報処理装置及び情報処理方法に関する。
続きを表示(約 2,500 文字)【背景技術】
【0002】
従来、分類対象となるデータを高精度に分類する分類モデルとして、深層学習モデルをはじめとする様々な機械学習モデルが知られている。また従来、分類モデルの分類精度を向上させるために、機械学習モデルのサイズ(以下、モデルサイズと記載する場合がある)を大きくする様々な技術が知られている。例えば、画像分類モデルとして用いられる畳み込みニューラルネットワーク(CNN)の各層のチャネル数、層数および解像度を単一のパラメータを用いて複合的にスケールアップさせる技術が知られている。
【先行技術文献】
【非特許文献】
【0003】
Mingxing Tan、Quoc V. Le、“EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks”、[online]、May 2019、[令和5年4月17日検索]、インターネット<URL:https://arxiv.org/pdf/1905.11946.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記の従来技術では、画像分類モデルとして用いられる畳み込みニューラルネットワーク(CNN)の各層のチャネル数、層数および解像度を単一のパラメータを用いて複合的にスケールアップさせるにすぎないため、小型化された分類モデルを用いて詳細な分類を行うことを可能とすることができるとは限らない。
【0005】
本願は、小型化された分類モデルを用いて詳細な分類を行うことを可能とすることができる情報処理装置及び情報処理方法を提供することを目的とする。
【課題を解決するための手段】
【0006】
本願に係る情報処理装置は、複数の異なるクラスにそれぞれ属するデータに関する特徴量であって、前記複数の異なるクラスそれぞれの代表値である複数のクラス特徴量の類似度に基づいて、階層的にクラスタリングされた前記複数のクラス特徴量に基づく階層的なクラスタの各々に対応するクラスであって、前記複数の異なるクラスよりも上位のクラスである上位クラスを生成するクラス生成部と、分類対象となる分類対象データを、前記上位クラスの下位に属する複数の下位クラスのうちいずれかの下位クラスに分類する機械学習モデルである分類モデルを前記上位クラスごとに生成するモデル生成部と、を備える。
【0007】
また、本願に係る情報処理装置は、複数の異なるクラスにそれぞれ属するデータに関する特徴量であって、前記複数の異なるクラスそれぞれの代表値である複数のクラス特徴量の類似度に基づいて、階層的にクラスタリングされた前記複数のクラス特徴量に基づく階層的なクラスタの各々に対応するクラスであって、前記複数の異なるクラスよりも上位のクラスである上位クラスの下位に属する複数の下位クラスのうちいずれかの下位クラスに分類対象となる分類対象データを分類する機械学習モデルである分類モデルと、処理対象となる処理対象データとを取得する取得部と、最上位のクラスに対応する前記分類モデルから順番に選択される所定の上位クラスに対応する前記分類モデルである上位の分類モデルを用いて、前記処理対象データが分類される第1下位クラスを推定し、前記上位の分類モデルの推定結果に基づいて、前記所定の上位クラスの下位に属する複数の下位クラスの各々に対応する前記分類モデルの中から、前記第1下位クラスに対応する前記分類モデルである下位の分類モデルを選択し、選択された前記下位の分類モデルを用いて、前記処理対象データが分類される第2下位クラスを推定する推定部と、を備える。
【発明の効果】
【0008】
実施形態の一態様によれば、小型化された分類モデルを用いて詳細な分類を行うことを可能とすることができる。
【図面の簡単な説明】
【0009】
図1は、分類モデルのモデルサイズと分類クラス数との関係を示す図である。
図2は、実施形態に係る情報処理装置の構成例を示す図である。
図3は、実施形態に係る階層的なクラスの生成処理について説明するための図である。
図4は、実施形態に係る階層的な分類モデルの生成処理について説明するための図である。
図5は、実施形態に係る階層的な分類モデルの学習データセットについて説明するための図である。
図6は、実施形態に係るクラスの推定処理について説明するための図である。
図7は、上位の分類モデルによる一の推定結果のみを採用することにより、下位クラスの推定結果が不正解となる場合について説明するための図である。
図8は、上位の分類モデルによる複数の推定結果を採用することにより、下位クラスの推定結果が正解となる場合について説明するための図である。
図9は、通常の多クラス分類モデルと未知のクラスを検知可能な多クラス分類モデルについて説明するための図である。
図10は、変形例に係るクラスの推定処理について説明するための図である。
図11は、変形例に係る推定処理を中止する場合の一例について説明するための図である。
図12は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る情報処理装置及び情報処理方法を実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置及び情報処理方法が限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許