TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025015415
公報種別
公開特許公報(A)
公開日
2025-01-30
出願番号
2024066592
出願日
2024-04-17
発明の名称
オーバーレイ画像を処理するための情報処理装置および情報処理方法
出願人
楽天グループ株式会社
代理人
個人
,
個人
,
個人
主分類
G06T
7/00 20170101AFI20250123BHJP(計算;計数)
要約
【課題】付加情報がオーバーレイされた画像から当該付加情報を適切かつ高精度に消去して再利用可能にする情報処理装置および情報処理方法を提供する。
【解決手段】オーバーレイ画像処理装置1は、オブジェクト及び付加情報を含む第1の画像を領域検出用機械学習モデルに入力し、領域検出用機械学習モデルに、付加情報の領域を検出させる領域検出部と、領域検出部が検出した付加情報の領域の情報から、付加情報の領域に対するマスクを生成するマスク生成部と、マスク生成部が生成したマスクと、第1の画像とを領域検出用機械学習モデルに入力し、領域検出用機械学習モデルに第1の画像と異なる第2の画像を出力させる出力部と、を備える。第2の画像は、第1の画像から付加情報が消去され、付加情報が消去された第1の画像の領域が修復された画像である。
【選択図】図1
特許請求の範囲
【請求項1】
オブジェクトおよび付加情報を含む第1の画像を第1の機械学習モデルに入力して、前記第1の機械学習モデルに、前記付加情報の領域を検出させる領域検出部と、
前記領域検出部により検出された前記付加情報の前記領域の情報から、前記付加情報の前記領域に対するマスクを生成するマスク生成部と、
前記マスク生成部により生成された前記マスクと、前記第1の画像とを第2の機械学習モデルに入力して、前記第2の機械学習モデルに前記第1の画像と異なる第2の画像を出力させる画像出力部と、前記第2の画像は、前記第1の画像から前記付加情報が消去され、前記付加情報が消去された前記第1の画像の領域が修復された画像である、
を備えることを特徴とする情報処理装置。
続きを表示(約 940 文字)
【請求項2】
前記領域検出部は、前記第1の機械学習モデルから出力される前記付加情報のクラスに基づいて、前記付加情報の領域を決定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記マスク生成部は、前記第1の機械学習モデルから出力される前記付加情報のクラスに基づいて、生成されたマスクを調整する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記マスク生成部はさらに、前記オブジェクトと前記付加情報との相対位置に基づいて、生成されたマスクを調整する
ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記第1の機械学習モデルから出力される前記付加情報の前記クラスは、前記付加情報の色、形状、および、前記付加情報の前記領域と前記第1の画像の外周との相対位置のいずれか1つ以上を含む
ことを特徴とする請求項2に記載の情報処理装置。
【請求項6】
前記第1の機械学習モデルは、前記付加情報の前記クラスを入力として学習させたものである
ことを特徴とする請求項2に記載の情報処理装置。
【請求項7】
前記第1の機械学習モデルは、前記付加情報の前記クラスを出力する出力チャネルを備える
ことを特徴とする請求項2に記載の情報処理装置。
【請求項8】
前記オブジェクトと前記付加情報との相対位置に基づいて、前記第2の画像中で前記オブジェクトを調整する画像調整部をさらに備える
ことを特徴とする請求項1に記載の情報処理装置。
【請求項9】
前記画像調整部は、前記付加情報が削除された前記第2の画像において、前記オブジェクトの配置およびサイズのいずれか1つ以上を調整する
ことを特徴とする請求項8に記載の情報処理装置。
【請求項10】
前記第2の機械学習モデルは、第2の画像の敵対的損失および知覚損失を評価する損失関数の損失がより小さくなるよう学習させたものである
ことを特徴とする請求項1に記載の情報処理装置。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明は、オーバーレイ画像を処理するための情報処理装置および情報処理方法に関し、特に、テキストやロゴ等の付加情報がオーバーレイされた画像を再利用するための技術に関する。
続きを表示(約 2,000 文字)
【背景技術】
【0002】
多くの電子商取引(EC)プラットフォームは、ユーザに提供する商品やサービスを可視化する多数の画像に大きく依存している。画像を介して商品やサービスをいかにユーザに対して魅力的に訴求するかは、ECサイトのセールスを大きく左右する。
【0003】
これらECサイトが提供する商品やサービスの画像には、多くの場合、当該商品やサービスの購入を促すための情報として、商品名や商品ロゴ、ブランド名やブランドロゴ、広告キャプション、商品やサービスの説明文、価格情報、キャンペーン情報等の付加情報が、デジタル要素としてオーバーレイされている。ユーザに、ECサイト上に表示される商品やサービスの画像とともにオーバーレイされた付加情報を同時に閲覧させることによって、当該商品やサービスを購入するため必要な情報を当該ユーザに正しく提供することができる。
【0004】
ところで、これらの付加情報がオーバーレイされた画像(以下、「オーバーレイ画像」ともいう)を再利用するためには、多くの場合、オーバーレイされた付加情報を消去することが要求される。オーバーレイ画像を再利用する目的は、多岐に亘るが、例えば、色違いやデザイン違いの商品画像への画像編集、異なる付加情報(異なるキャプション、異なる説明文や価格、異なるキャンペーン等)への置き換え、を含む。オーバーレイ画像から付加情報を消去することは、商品等の画像分類の精度を向上させることにも役立つ。
さらに、付加情報が消去された画像においては、付加情報が消去された領域中の画素が欠損するため、画素が欠損した領域の画像を修復することにより、当該付加情報をオーバーレイする前のオリジナル画像に復元しなければならない。
【0005】
特許文献1は、画像内のオブジェクトを置換するためのコンピュータ実装方法を開示する。
具体的には、特許文献1に開示されるコンピュータ実装方法は、第1の画像内の、ある位置における置換すべきターゲットオブジェクトである第1のオブジェクトを識別し、第1の画像、および第1のオブジェクトの位置に基づいて、ターゲットエリアをマスクして、マスク画像を生成する。
特許文献1に開示されるコンピュータ実装方法はさらに、生成されたマスク画像および修復機械学習モデルに基づいて、ターゲットオブジェクトを含まずかつ当該ターゲットオブジェクトの部分が修復された画像である第2の画像を生成し、マスク画像と第2の画像からさらに第3の画像を生成し、生成された第3の画像に対して、第1のオブジェクトとは異なる新たなオブジェクトを追加する。
【先行技術文献】
【特許文献】
【0006】
特開2023-500203号
【発明の概要】
【発明が解決しようとする課題】
【0007】
特許文献1の技術によれば、画像やビデオ等にオーバーレイされたテキストラベルを検出して、当該テキストラベルとは異なる新たなラベル、例えば、異なる言語に翻訳されたテキスト、に置き換えることができる。
【0008】
しかしながら、オーバーレイ画像から消去されるべき付加情報のみを検出して消去することは容易ではない。
とりわけ、ECサイトでは、1つのWebページ内で多数の商品画像を比較可能な態様で表示させなければならないため、1つの商品画像に割り当て可能な表示サイズが制約されてしまう。このため、多くの場合、画像中の商品オブジェクトに重畳して付加情報がオーバーレイされている。このことは、付加情報のみの正確な消去を困難にするとともに、画像修復の精度を低下させかねない。
【0009】
さらに、オーバーレイされた付加情報と、消去されるべきでない画像中のオブジェクトや背景中の情報とを正確に峻別することも容易ではない。
例えば、画像中の商品オブジェクトが商品パッケージであって商品名等のテキスト情報を含む場合に、当該パッケージ上の商品名等を誤って消去してしまうおそれがあった。他方、付加情報がテキスト以外のロゴ画像であったり、付加情報のテキストが円形状やリボン形状等のフレーム画像上に重畳されていたりする場合には、当該付加情報が正確に消去されずに残ってしまうおそれがあった。
【0010】
本発明は上記課題を解決するためになされたものであり、その目的は、付加情報がオーバーレイされた画像から当該付加情報を適切かつ高精度に消去して再利用可能にすることが可能な情報処理装置および情報処理方法を提供することにある。
【課題を解決するための手段】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
情報提示方法
12日前
個人
自動精算システム
1か月前
個人
プログラム
4日前
個人
自動精算システム
20日前
個人
プログラム
11日前
個人
アカウントマップ
5日前
個人
RFタグ読取装置
29日前
個人
売買システム
26日前
個人
管理サーバ
1か月前
個人
市場受発注システム
18日前
個人
発想支援方法及びシステム
15日前
個人
分類処理プログラム及び方法
15日前
日本精機株式会社
車両用表示装置
28日前
個人
学習装置及び推論装置
4日前
キヤノン株式会社
印刷装置
1か月前
日本精機株式会社
車両用表示装置
28日前
個人
VRによる人体各部位の立体化
1か月前
富士通株式会社
金融システム
12日前
井関農機株式会社
ロボット作業車両
20日前
個人
未来型家系図構築システム
1か月前
株式会社COLORS
表示装置
1か月前
トヨタ自動車株式会社
推定装置
1か月前
株式会社SEKT
文字認識装置
1か月前
個人
コンテンツ開示順位判定システム
1か月前
キヤノン株式会社
情報処理装置
1か月前
株式会社プレニーズ
仲介システム
5日前
キヤノン電子株式会社
業務管理システム
1か月前
トヨタ自動車株式会社
表認識装置
1か月前
村田機械株式会社
人員配置システム
15日前
個人
情報処理装置およびプログラム
1か月前
個人
販売支援システム
20日前
トヨタ自動車株式会社
作業管理装置
18日前
トヨタ自動車株式会社
作業評価装置
27日前
トヨタ自動車株式会社
作業評価装置
1か月前
トヨタ自動車株式会社
記号識別方法
1か月前
富士通株式会社
情報処理プログラム
1か月前
続きを見る
他の特許を見る