TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025088955
公報種別公開特許公報(A)
公開日2025-06-12
出願番号2023203828
出願日2023-12-01
発明の名称データ分析装置、方法およびプログラム
出願人株式会社東芝
代理人弁理士法人鈴榮特許綜合事務所
主分類G05B 23/02 20060101AFI20250605BHJP(制御;調整)
要約【課題】異なる条件で取得された複数のデータの特徴を精度良く比較すること。
【解決手段】実施形態に係るデータ分析装置は、第1条件を満たす複数の第1データを教師なし学習することによって複数の第1特徴ベクトルを生成する第1学習部と、複数の第1特徴ベクトルをクラスタリングすることによって第1クラスタリング結果を生成する第1クラスタリング部と、複数の第1データのうちの少なくとも一部のデータと第1条件とは異なる第2条件を満たす複数の第2データとを教師なし学習することによって複数の第2特徴ベクトルを生成する第2学習部と、複数の第2特徴ベクトルをクラスタリングすることによって第2クラスタリング結果を生成する第2クラスタリング部と、第1クラスタリング結果と第2クラスタリング結果とを比較することによって、複数の第1データおよび複数の第2データに関する比較結果を生成する比較部とを備える。
【選択図】図2

特許請求の範囲【請求項1】
第1条件を満たす複数の第1データを取得する第1取得部と、
前記複数の第1データを教師なし学習することによって複数の第1特徴ベクトルを生成する第1学習部と、
前記複数の第1特徴ベクトルをクラスタリングすることによって第1クラスタリング結果を生成する第1クラスタリング部と、
前記第1条件とは異なる第2条件を満たす複数の第2データを取得する第2取得部と、
前記複数の第1データのうちの少なくとも一部のデータと前記複数の第2データとを教師なし学習することによって複数の第2特徴ベクトルを生成する第2学習部と、
前記複数の第2特徴ベクトルをクラスタリングすることによって第2クラスタリング結果を生成する第2クラスタリング部と、
前記第1クラスタリング結果と前記第2クラスタリング結果とを比較することによって、前記複数の第1データおよび前記複数の第2データに関する比較結果を生成する比較部と
を具備する、データ分析装置。
続きを表示(約 1,300 文字)【請求項2】
前記第1クラスタリング結果は、前記第1特徴ベクトルの情報と、各クラスタを区別するための第1クラスタ番号とを対応付けたデータを含み、
前記第2クラスタリング結果は、前記第2特徴ベクトルの情報と、各クラスタを区別するための第2クラスタ番号とを対応付けたデータを含む、
請求項1に記載のデータ分析装置。
【請求項3】
前記第1クラスタリング結果は、前記第1クラスタ番号に対応する第1クラスタラベルを含む、
請求項2に記載のデータ分析装置。
【請求項4】
前記第1学習部および前記第2学習部は、類似した画像の距離が近くなり、類似しない画像の距離が遠くなるような特徴量を抽出するモデルを用いて教師なし学習を行う、
請求項1に記載のデータ分析装置。
【請求項5】
前記比較結果は、前記第2クラスタリング結果におけるクラスタに含まれる前記第1データと前記第2データとの比率を示したグラフである、
請求項1に記載のデータ分析装置。
【請求項6】
前記比較結果は、前記複数の第1特徴ベクトルおよび前記複数の第2特徴ベクトルを異なる複数の成分で表した相関図である、
請求項1に記載のデータ分析装置。
【請求項7】
前記第2クラスタリング部は、前記第1クラスタリング結果に含まれるクラスタ数よりも、前記第2クラスタリング結果に含まれるクラスタ数が多くなるようにクラスタリングする、
請求項1に記載のデータ分析装置。
【請求項8】
前記第1条件および前記第2条件の種類は、異なる装置、日時、メンテナンスの前後、および製造プロセスの変更前後のうちのいずれかである、
請求項1に記載のデータ分析装置。
【請求項9】
前記第1データおよび前記第2データは、画像である、
請求項1から請求項8までのいずれか一項に記載のデータ分析装置。
【請求項10】
コンピュータが、
第1条件を満たす複数の第1データを取得することと、
前記複数の第1データを教師なし学習することによって複数の第1特徴ベクトルを生成することと、
前記複数の第1特徴ベクトルをクラスタリングすることによって第1クラスタリング結果を生成することと、
前記第1条件とは異なる第2条件を満たす複数の第2データを取得することと、
前記複数の第1データのうちの少なくとも一部のデータと前記複数の第2データとを教師なし学習することによって複数の第2特徴ベクトルを生成することと、
前記複数の第2特徴ベクトルをクラスタリングすることによって第2クラスタリング結果を生成することと、
前記第1クラスタリング結果と前記第2クラスタリング結果とを比較することによって、前記複数の第1データおよび前記複数の第2データに関する比較結果を生成することと
を具備する、データ分析方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明の実施形態は、データ分析装置、方法およびプログラムに関する。
続きを表示(約 2,000 文字)【背景技術】
【0002】
製造分野において、機械学習により製品の検査画像を分類することで、不良や欠陥の発生を監視し、生産性を向上する取り組みが広がっている。機械学習で検査画像を分類する方法として、事前に分類基準となる教師ラベルを人手で付与し、深層学習などの手法により分類モデルを学習する教師あり学習が知られている。しかし、教師あり学習により高精度の分類モデルを学習するためには、大量の画像に正確に教師ラベルを付与する必要がある。
【0003】
機械学習で検査画像を分類する別の方法として、画像間の類似度や距離を用いて分類を行う教師なし学習の手法が知られている。教師なし学習手法は、人手によるラベル付けが不要なため、未知の大量の画像を分類することが可能であり、分類の結果から画像データセットの概要を把握することができる。近年では、深層学習を用いた教師なし学習手法が提案されており、画像の特徴を自動で学習して、それらの類似度や距離を用いて分類を行うことで性能が大きく向上している。
【0004】
このように、製造分野では、教師なし学習手法を用いて検査画像を分類することで、不良や欠陥の発生状況を把握して分析の作業コストを低減する取り組みが進んでいる。例えば、工場で大量に蓄積する検査画像を教師なし学習手法で分類することで、不良や欠陥の画像の発生枚数を確認することができ、どのような不良や欠陥がどのくらい発生しているかを知ることができる。また、教師なし学習では人手による作業が不要であるため、ユーザは必要なタイミングで検査画像の分類を行うことができ、業務開始時に前日の検査画像を分類して確認するといった使い方もできる。
【0005】
特に、工場では、製造条件ごとの不良や欠陥の発生状況を比較することでより詳細な分析が行われている。例えば、機器のメンテナンス前後の欠陥の発生を比較することで、メンテナンスの効果やメンテナンスによる悪影響の有無を確認することができる。他にも、同じ検査を行う2台の検査装置の欠陥の発生を比較することで、各検査装置の検査精度や検査に伴う撮影の癖などを確認することができる。これらのように、製造条件に特有の欠陥を把握することで、欠陥の原因が明確になり、早期に対策を実施することが可能になる。
【0006】
従来、時系列データを想定して、既存のデータと新しいデータとを用いて教師なし学習を行う技術が知られている。この技術は、時系列データの教師あり学習向けのラベル付け支援において、既存のデータの教師なし学習の分類結果を用いて、既存データに一括で教師ラベルを付与することで教師ラベル付与の作業コストを低減するものである。また、この技術は、既存のデータと新しいデータとを混合して教師なし学習を行うことで、同じグループに分類された既存データの教師ラベルを用いて、新しいデータに教師ラベルを付与することができる。また、この技術は、新しいデータしか含まれないグループを確認することで、新たに発生したトレンドの時系列データに教師ラベルを付与することもできる。これらにおいて、既存のデータと新しいデータとをそれぞれ異なる製造条件のデータと考えることで、時系列データの分析コストを低減することが可能になる。
【0007】
一方で、上記技術では、センサなどから取得される時系列データが対象となっており、既存のデータと新しいデータとの特徴の違いについては考慮されていない。工場においては製造条件の違いにより全く異なる不良や欠陥が発生する場合があり、それらが撮影された検査画像を高精度に分類するためには、それぞれに適した特徴を学習する必要がある。仮に既存の画像に適した特徴を用いて新しい検査画像を分類した場合には、新たな検査画像のみで発生する不良や欠陥を分類できず、見逃してしまう可能性がある。
【0008】
また、上記技術は、新しいデータに対して教師ラベルを付与して教師あり学習を行うことを目的としており、既存のデータと新しいデータを比較するような分析に適した方法にはなっていない。
【0009】
工場においては、多数の性質の異なる装置が稼働しており、メンテナンス、製造プロセス変更、および新製品の立ち上げなど、装置の状態が常に変化している。よって、装置の違いや状態の違いなど製造条件の違いに対応して不良や欠陥の特徴を学習して高精度に比較し、分析を支援する方法が望まれている。
【先行技術文献】
【特許文献】
【0010】
米国特許出願公開2020/0134510号明細書
【発明の概要】
【発明が解決しようとする課題】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許