TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025044152
公報種別公開特許公報(A)
公開日2025-04-01
出願番号2024156521
出願日2024-09-10
発明の名称画像解析のための、コンピュータにより実施される方法、データ処理装置、及びコンピュータプログラム
出願人富士通株式会社
代理人弁理士法人ITOH
主分類G06T 7/00 20170101AFI20250325BHJP(計算;計数)
要約【課題】画像解析のための機械学習モデルを訓練する、コンピュータにより実施される方法等を提供する。
【解決手段】方法は、実際の訓練データ及び拡張された訓練データを含む入力訓練データセットを受け取ることと、訓練済みエンコーダを得るよう機械学習モデルのエンコーダを繰り返し訓練することとを有し、繰り返し訓練することは、訓練済み弁別器を得るよう入力訓練データセットを用いて弁別器損失関数を最小化することによって弁別器モデルを訓練し、訓練済み弁別器は、入力データが実際のデータか或いは拡張されたデータかを弁別するよう構成される、ことと、訓練済みエンコーダを得るよう入力訓練データセット及び訓練済み弁別器を用いて弁別器エラーを最大化することによってエンコーダを訓練し、訓練済みエンコーダは、実際のデータ及び拡張されたデータを同じ表現空間に不変的に符号化するよう構成される、こととを含む。
【選択図】図4

特許請求の範囲【請求項1】
画像解析のための機械学習モデルを訓練する、コンピュータにより実施される方法であって、
実際のモダリティに対応する実際の訓練データと、拡張された訓練データとを含む入力訓練データセットを受け取ることと、
訓練済みエンコーダを得るよう前記機械学習モデルのエンコーダを繰り返し訓練することと、を有し、
前記繰り返し訓練することは、
訓練済み弁別器を得るよう前記入力訓練データセットを用いて弁別器損失関数を最小化することによって弁別器モデルを訓練することであり、前記訓練済み弁別器は、入力データが実際のデータか或いは拡張されたデータかを弁別するよう構成される、ことと、
前記訓練済みエンコーダを得るよう前記入力訓練データセット及び前記訓練済み弁別器を用いて弁別器エラーを最大化することによって前記エンコーダを訓練することであり、前記訓練済みエンコーダは、表現が前記実際のモダリティに関する情報を保つように、実際のデータ及び拡張されたデータを実際の表現空間に不変的に符号化するよう構成される、ことと
を有する、
方法。
続きを表示(約 990 文字)【請求項2】
前記機械学習モデルは追加的下流レイヤを更に有し、前記追加的下流レイヤは、前記訓練済みエンコーダとともに、入力データの解析結果を出力するよう訓練によって構成される、
請求項1に記載の方法。
【請求項3】
訓練済みの追加的下流レイヤを得るよう前記入力訓練データセット及び前記訓練済みエンコーダを用いて多目的最適化プロシージャによって前記追加的下流レイヤの反復訓練を更に有する、
請求項2に記載の方法。
【請求項4】
前記追加的下流レイヤはトランスフォーマエンコーダ、リアセンブリモジュール、及び融合モジュールを含む、
請求項2又は3に記載の方法。
【請求項5】
入力画像を受け取ることと、
前記入力画像の解析結果を得るよう訓練済み機械学習モデルを用いて前記入力画像を処理することと、を更に有する
請求項1に記載の方法。
【請求項6】
前記機械学習モデルは水画像のセグメンテーション用であり、前記入力訓練データセットは、実際の訓練用水画像及びシミュレーションされた訓練用水画像とを含む、
請求項1に記載の方法。
【請求項7】
入力された水画像をリアルタイムで受け取ることと、
前記入力された水画像の水域セグメンテーション結果を得るよう訓練済み機械学習モデルを用いて前記入力された水画像を処理することと、を更に有する
請求項6に記載の方法。
【請求項8】
前記水域セグメンテーション結果が閾値を超えるとの決定に応答して、アラームを出力することを更に有する
請求項7に記載の方法。
【請求項9】
前記機械学習モデルは、医用画像のセグメンテーション又は分類用であり、前記入力訓練データセットは、訓練用医用画像及び対応するゲノム訓練データを含む、
請求項1に記載の方法。
【請求項10】
入力された医用画像をリアルタイムで受け取ることと、
前記入力された医用画像の医用セグメンテーション又は分類結果を得るよう訓練済み機械学習モデルを用いて前記入力されたいよう画像を処理することと、を更に有する
請求項9に記載の方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、コンピュータビジョンの分野における画像解析の方法に関係がある。より具体的に、本発明は、画像解析のための機械学習モデルを訓練する方法、画像解析の方法、並びに関連するデータ処理装置、コンピュータプログラム、及びコンピュータ可読記憶媒体に関係がある。
続きを表示(約 2,100 文字)【背景技術】
【0002】
画像セグメンテーションのコンピュータビジョン技術は、画像内のピクセルの分類及びターゲット領域のマーキング又はマスキングにより画像を画像セグメントに分割するプロセスを指す。画像セグメンテーションは、医用画像解析、無人運転における対象検出、並びに地理及び地質のモニタリングなどの技術分野で広く適用された技術である。
【0003】
例えば、地理のモニタリングの分野において、洪水の監視は活発に研究されている分野ある。リアルタイムのビデオカメラ映像及び画像データセットの解析による洪水の監視は、通常、セグメンテーション機械学習モデルを必要とする。得られたセグメント又はマスクは洪水の範囲を確定するために使用されることがあり、これは、次いで、緊急警報及び災害管理システムに通知するために使用されることがある。
【0004】
洪水は、英国で最も一般的な自然災害であり、ヨーロッパで最も被害が大きい自然災害として認識されているところ、近年では、洪水による被害額は推定で数千万ユーロに上っている。洪水検知は重要な安全対策とみなされており、世界中のさまざまな研究グループや技術グループから幅広い関心を集めている。洪水を検知するための既存のアプローチは、一般的に、センサ、衛星画像、ビデオカメラ映像に基づいている。
【0005】
しかし、センサ及び衛星画像にはいくつかの欠点がある。センサは高価であり、設置が難しいことがある。衛星や航空機による光学技術は、日中にしか使用できないことと、雲や植生の下の洪水をマッピングできないことが障害となっている。SARイメージングは、上記の制限の一部を緩和できるかもしれないが、SAR衛星のオーバーパスは頻繁ではないため(1日に1回か2回程度)、水位の上昇部分を捉えることはまれである。
【0006】
結果として、河川ビデオカメラが、人気のある代替手段として登場した。利点としては、ライブ画像を継続的に放送でき、メンテナンスや設置にかかるコストが低く、標準ブロードバンドやモバイルブロードバンドを通じて映像を簡単に通信できることが挙げられる。
【0007】
河川のビデオカメラ映像を活用するには、通常、水域セグメンテーションモデルを使用する必要がある。図1は、Vandaele, R. et al.(Hydrology and Earth System Sciences. 25. 4435-4453. 10.5194/hess-25-4435-2021)の研究を基に改変された水域セグメンテーションモデルの適用例を示している。パネルAは河川の画像を示している(元の画像にはカラーデータが含まれていることに留意されたい。)。パネルBはセグメンテーション結果を示しており、水域セグメンテーションモデルによって水域として分類された懸念領域を白でマスクしている
【0008】
水域セグメンテーションとの関連で、セグメンテーションの現在の最先端技術は、ネットワークバックボーンとして畳み込みニューラルネットワーク(CNN)ベースのモデルであるPSPNetを使用するAquaNET(Erfani, S. et al,ATLANTIS: A benchmark for semantic segmentation of waterbody images. Environmental Modelling & Software,105333の論文を参照。)を使用して達成されると考えられている。
【0009】
しかし、水は大きく異なる形で現れることがあるため、全ての形を忠実に表現するのに十分な実データの収集は不可能である。図2は、水域セグメンテーションモデルが遭遇する可能性のある水の画像のさまざまなバリエーションを示している。これには、最良のシナリオと比較した画像品質のバリエーション(ISOノイズの増加、雨滴によるカメラの視界の遮蔽)、画像取得技術のバリエーション(赤外線照明)、照明品質のバリエーション(反射する水、夜間の画像取得)、降水の有無(雪、雨、霧)、及び関心のある水自体の性質(泥水又は濁った水、泡立った水、物体が沈んでいる水)が含まれる。
【0010】
従って、理想的な水域セグメンテーションモデルは、推論中に実際の分布内(In-Distribution)画像のサブセットにしかアクセスできないにもかかわらず、水が出現する可能性のある全ての分布外(Out-of-Distribution,OoD)シナリオに一般化される必要がある。OoDシナリオを合成的にモデル化するシミュレーション又は拡張は、制御された方法で人工画像を生成することにより、このギャップを埋め、データ不足の懸念に対処するのに役立つ。構造的には実際の画像に似ているが、このような人工画像は、データ生成プロセスが実際のデータと根本的に異なるため、モダリティシフトを示す。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

富士通株式会社
電源装置
16日前
富士通株式会社
車線区分装置及び方法
2日前
富士通株式会社
情報処理装置,プログラムおよび制御方法
2日前
富士通株式会社
分子動力学計算プログラム、方法、及び装置
2日前
富士通株式会社
予測プログラム、予測方法及び情報処理装置
17日前
富士通株式会社
方策学習装置、方策学習方法及び通信システム
17日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
3日前
富士通株式会社
医薬品管理装置、医薬品管理方法、医薬品管理プログラム
3日前
富士通株式会社
業務管理プログラム、業務管理方法、および情報処理装置
9日前
富士通株式会社
タスク制御プログラム、情報処理装置及びタスク制御方法
2日前
富士通株式会社
量子計算支援プログラム、量子計算支援方法、および情報処理装置
10日前
富士通株式会社
歩行訓練支援プログラム、歩行訓練支援方法、および情報処理装置
4日前
富士通株式会社
リソース割当て装置、リソース割当て方法、およびリソース割当てプログラム
16日前
富士通株式会社
基底エネルギー算出プログラム、基底エネルギー算出装置、および基底エネルギー算出方法
11日前
富士通株式会社
サイドリンクリソースの再選択方法及び装置
3日前
富士通株式会社
基地局、移動局、通信システム、及び通信方法
15日前
富士通株式会社
ワイヤーハーネス製造図設計支援プログラム、ワイヤーハーネス製造図設計支援方法、および情報処理装置
2日前
個人
非正規コート
12日前
個人
人物再現システム
9日前
個人
AI飲食最適化プラグイン
2日前
有限会社ノア
データ読取装置
10日前
個人
電話管理システム及び管理方法
3日前
個人
広告提供システムおよびその方法
12日前
株式会社ザメディア
出席管理システム
17日前
個人
日誌作成支援システム
9日前
個人
ポイント還元付き配送システム
10日前
トヨタ自動車株式会社
工程計画装置
17日前
株式会社タクテック
商品取出集品システム
16日前
トヨタ自動車株式会社
作業判定方法
18日前
ミサワホーム株式会社
情報処理装置
16日前
オベック実業株式会社
接続構造
9日前
株式会社村田製作所
動き検知装置
16日前
トヨタ自動車株式会社
情報処理システム
18日前
ゼネラル株式会社
RFIDタグ付き物品
19日前
株式会社実身美
ワーキングシェアリングシステム
10日前
トヨタ自動車株式会社
情報処理方法
18日前
続きを見る