TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024168754
公報種別
公開特許公報(A)
公開日
2024-12-05
出願番号
2023085680
出願日
2023-05-24
発明の名称
情報処理装置、セグメンテーション方法、及びプログラム
出願人
日本電信電話株式会社
,
学校法人早稲田大学
代理人
弁理士法人ITOH
,
個人
,
個人
,
個人
主分類
G06T
7/00 20170101AFI20241128BHJP(計算;計数)
要約
【課題】空中画像に対するセグメンテーションを適切に行うための技術を提供する。
【解決手段】画像に対するセグメンテーションを行う情報処理装置であって、前記画像を入力する入力部と、前記画像から得られた複数のレベルの第1特徴マップのそれぞれに対して、複数のマルチヘッドセルフアテンションモジュールを適用することにより第2特徴マップを生成し、複数のレベルの前記第2特徴マップからセグメンテーション結果を生成する演算部とを備える。
【選択図】図3
特許請求の範囲
【請求項1】
画像に対するセグメンテーションを行う情報処理装置であって、
前記画像を入力する入力部と、
前記画像から得られた複数のレベルの第1特徴マップのそれぞれに対して、複数のマルチヘッドセルフアテンションモジュールを適用することにより第2特徴マップを生成し、複数のレベルの前記第2特徴マップからセグメンテーション結果を生成する演算部と
を備える情報処理装置。
続きを表示(約 770 文字)
【請求項2】
前記複数のマルチヘッドセルフアテンションモジュールは、カスケード接続されている
請求項1に記載の情報処理装置。
【請求項3】
前記複数のマルチヘッドセルフアテンションモジュールにおける各マルチヘッドセルフアテンションモジュールは、入力される特徴マップを複数のウィンドウに分割し、各ウィンドウでセルフアテンションを計算する
請求項1に記載の情報処理装置。
【請求項4】
カスケード接続される前記複数のマルチヘッドセルフアテンションモジュールにおいて、ある段のマルチヘッドセルフアテンションモジュールにおけるウィンドウのサイズは、当該マルチヘッドセルフアテンションモジュールの後段に接続されるマルチヘッドセルフアテンションモジュールにおけるウィンドウのサイズよりも小さい
請求項3に記載の情報処理装置。
【請求項5】
前記演算部は、特徴ピラミッドネットワークを用いて複数のレベルの前記第1特徴マップを生成する
請求項1に記載の情報処理装置。
【請求項6】
画像に対するセグメンテーションを行う情報処理装置が実行するセグメンテーション方法であって、
前記画像を入力するステップと、
前記画像から得られた複数のレベルの第1特徴マップのそれぞれに対して、複数のマルチヘッドセルフアテンションモジュールを適用することにより第2特徴マップを生成し、複数のレベルの前記第2特徴マップからセグメンテーション結果を生成するステップと
を備えるセグメンテーション方法。
【請求項7】
コンピュータを、請求項1ないし5のうちいずれか1項に記載の情報処理装置における各部として機能させるためのプログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、空中画像に対してセグメンテーションを行う技術に関連するものである。
続きを表示(約 1,900 文字)
【背景技術】
【0002】
以下の説明において、参考文献については[1]等の番号で表記し、番号に対応する文献名は明細書の最後に記載した。
【0003】
高空間解像度(HSR: High Spatial Resolution)リモートセンシング技術が知られている。当該技術により得られた画像には、建物、車両、船舶などを含む、興味の対象物の意味と位置情報を提供する地理空間情報が豊富に含まれているという特徴がある。これらの情報を理解することは、都市の監視、環境変化の監視、災害対応、ルート計画など、さまざまな実用的な目的に不可欠である。
【0004】
HSRリモートセンシング画像を効果的に活用するために、空中画像セグメンテーションが重要なコンピュータビジョンのタスクとなる。当該タスクは、空中の視点から見た各画像のピクセルに意味ラベルを割り当てる一方で、前景オブジェクトと背景領域を分離(セグメント化)することを目的としている。
【0005】
近年、多くのVision Transformerベースの手法がセマンティックセグメンテーション分野で提案されている。これらの手法により、微小で曖昧な物体に対して正確な予測を生成することができるが、空中画像における大きなスケール変動の問題を解決できていない。
【0006】
また、非特許文献2に開示された高密度のアフィニティ学習ベースの手法[9]では、そのセグメンテーション結果は複雑な背景とノイズコンテキストによって劣化する。Pointflow [9]は、空中画像セグメンテーション研究分野におけるSoTAセグメンテーション結果を示す最新の研究であり、非特許文献1に開示された特徴ピラミッドネットワーク(FPN)[4]における隣接するスケール特徴間の顕著な点を選択してマッチさせることによるスパースなアフィニティ学習を採用している。当該技術により、複雑な背景やノイズを扱うことができるが、この方法では、小さなオブジェクトが失われたり、大きなオブジェクトの境界の予測が弱くなったりすることがある。
【先行技術文献】
【非特許文献】
【0007】
Tsung-Yi Lin, Piotr Doll´ar, Ross Girshick, Kaiming He, Bharath Hariharan, and Serge Belongie. Feature pyramid networks for object detection. In Proceedings of the IEEE/CVF conference on Computer Vision and Pattern Recognition (CVPR), pages 2117-2125, 2017.
Xiangtai Li, Hao He, Xia Li, Duo Li, Guangliang Cheng, Jianping Shi, Lubin Weng, Yunhai Tong, and Zhouchen Lin. Pointflow: Flowing semantics through points for aerial image segmentation. In Proceedings of the IEEE/CVF conference on Computer Vision and Pattern Recognition (CVPR), 2021
【発明の概要】
【発明が解決しようとする課題】
【0008】
従来のセマンティックセグメンテーション技術では、空中画像に対するセグメンテーション(領域識別)を適切に行うことができないという課題がある。
【0009】
本発明は上記の点に鑑みてなされたものであり、空中画像に対するセグメンテーションを適切に行うための技術を提供することを目的とする。
【課題を解決するための手段】
【0010】
開示の技術によれば、画像に対するセグメンテーションを行う情報処理装置であって、
前記画像を入力する入力部と、
前記画像から得られた複数のレベルの第1特徴マップのそれぞれに対して、複数のマルチヘッドセルフアテンションモジュールを適用することにより第2特徴マップを生成し、複数のレベルの前記第2特徴マップからセグメンテーション結果を生成する演算部と
を備える情報処理装置が提供される。
【発明の効果】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
日本電信電話株式会社
土壌観察装置およびその製造方法
今日
日本電信電話株式会社
走光性測定システムおよび推定方法
今日
日本電信電話株式会社
通信品質予測装置、及び、情報量削減装置
今日
日本電信電話株式会社
送信制御装置、無線通信システム、送信制御方法およびプログラム
2日前
日本電信電話株式会社
植物のKODA蓄積量を増加させるための方法、KODA製造システム、およびストレス耐性が増大した植物の製造方法
今日
個人
物品
14日前
個人
認証システム
28日前
個人
自動精算システム
7日前
個人
保証金管理システム
22日前
個人
救急搬送システム
14日前
個人
鑑定証明システム
28日前
個人
業界地図作成システム
1か月前
個人
人的価値発掘システム
1か月前
アズビル株式会社
防爆装置
2か月前
キヤノン株式会社
印刷装置
7日前
株式会社MRC
集客システム
22日前
個人
技術マッチングシステム
1か月前
個人
生成AIとの常時接続システム
14日前
株式会社宗建
SNSサーバー
2か月前
キヤノン電子株式会社
情報処理装置
1か月前
キヤノン株式会社
印刷管理装置
20日前
個人
コンテンツ開示順位判定システム
9日前
個人
未来型家系図構築システム
2日前
トヨタ自動車株式会社
推定装置
今日
株式会社ネットブリッジ
展示販売装置
29日前
個人
配送システムおよび同包箱
1か月前
株式会社SEKT
文字認識装置
3日前
株式会社COLORS
表示装置
8日前
ミサワホーム株式会社
システム
1か月前
トヨタ自動車株式会社
分析装置
22日前
キヤノン株式会社
印刷制御装置
1か月前
ミサワホーム株式会社
管理装置
1か月前
オムロン株式会社
認証中継サーバ
2か月前
トヨタ自動車株式会社
表認識装置
2日前
ミサワホーム株式会社
プログラム
28日前
アスエネ株式会社
森林管理の方法
2か月前
続きを見る
他の特許を見る