TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025096195
公報種別公開特許公報(A)
公開日2025-06-26
出願番号2024213208
出願日2024-12-06
発明の名称広告画像を生成する方法、装置及び記憶媒体
出願人富士通株式会社
代理人弁理士法人ITOH
主分類G06Q 30/0241 20230101AFI20250619BHJP(計算;計数)
要約【課題】本開示は、広告画像を生成する方法、装置及び記憶媒体を提供する。
【解決手段】該方法は、製品の広告画像のテキスト説明に基づいて、AI画像生成モデルのためのテキスト制御パラメータを生成するステップと、前景が製品を示す画像ブロックであり、且つ背景が単一の色である製品画像に基づいて、AI画像生成モデルのための画像空間制御パラメータを生成するステップと、製品画像に基づいて、AI画像生成モデルのためのノイズ画像を生成するステップと、AI画像生成モデルを使用して、テキスト制御パラメータ、画像空間制御パラメータ及びノイズ画像に基づいて、初期製品画像を生成するステップと、初期製品画像における対応する領域を画像ブロックに置き換えることによって、復元製品画像を生成するステップと、復元製品画像に対して前景画像と背景画像とを融合する後処理を実行することによって、製品の広告画像を生成するステップと、を含む。
【選択図】図1

特許請求の範囲【請求項1】
コンピュータが実行する、広告画像を生成する方法であって、
製品の広告画像のテキスト説明に基づいて、AI画像生成モデルのためのテキスト制御パラメータを生成するステップと、
前景が前記製品を示す画像ブロックであり、且つ背景が単一の色である製品画像に基づいて、前記AI画像生成モデルのための画像空間制御パラメータを生成するステップと、
前記製品画像に基づいて、前記AI画像生成モデルのためのノイズ画像を生成するステップと、
前記AI画像生成モデルを使用して、前記テキスト制御パラメータ、前記画像空間制御パラメータ及び前記ノイズ画像に基づいて、初期製品画像を生成するステップと、
前記初期製品画像における対応する領域を前記画像ブロックに置き換えることによって、復元製品画像を生成するステップと、
前記復元製品画像に対して前景画像と背景画像とを融合する後処理を実行することによって、前記製品の広告画像を生成するステップと、を含む、方法。
続きを表示(約 1,900 文字)【請求項2】
AI画像生成モデルのためのテキスト制御パラメータを生成するステップは、
言語モデルを使用して前記テキスト説明を生成するステップと、
テキストエンコーダを使用して、前記テキスト説明の特徴ベクトルを前記テキスト制御パラメータとして生成するステップと、を含む、請求項1に記載の方法。
【請求項3】
前記製品画像を生成する際に、
ユーザにより提供された前記製品の元画像を分割することによって、前記元画像における前記製品を示す前景画像を抽出し、
所定の画像サイズに基づいて前記前景画像をスケーリングすることによって、前記製品の画像ブロックを生成し、
前記画像ブロック、前記単一の色及び前記画像ブロックの所定位置に基づいて前記製品画像を生成し、
前記広告画像は、前記所定の画像サイズを有する、請求項1に記載の方法。
【請求項4】
前記AI画像生成モデルのための画像空間制御パラメータを生成するステップは、
前記製品画像に対してエッジ検出を実行することによって、エッジ画像を生成するステップと、
ニューラルネットワークにより前記エッジ画像を符号化することによって、前記製品画像の特徴を前記画像空間制御パラメータとして生成するステップと、を含む、請求項1に記載の方法。
【請求項5】
前記ノイズ画像を生成するステップは、
前記製品画像にノイズを反復的に漸進的に追加することによって、製品ノイズ画像を生成するステップと、
ランダムノイズ画像を生成するステップと、
前記製品画像における前記画像ブロックのカバレッジ領域を示すマスクに基づいて、前記製品ノイズ画像と前記ランダムノイズ画像とを組み合わせて前記ノイズ画像とするステップと、を含む、請求項1に記載の方法。
【請求項6】
復元製品画像を生成するステップは、
前記製品画像における前記画像ブロックのカバレッジ領域を示すマスクに基づいて、前記製品画像と前記初期製品画像とを組み合わせて復元製品画像とするステップ、を含む、請求項1に記載の方法。
【請求項7】
前記AI画像生成モデルは、前記ノイズ画像からノイズを漸進的に除去することによって前記初期製品画像を生成するように構成される、請求項1に記載の方法。
【請求項8】
前記後処理は、
前記復元製品画像と前記画像ブロックとに対してポアソン画像合成を実行することによってポアソン合成画像を取得することと、
前記製品画像における前記画像ブロックの境界に基づいて前記ポアソン合成画像における前記製品の輪郭線の内側の内側領域に対して境界遷移平滑化を実行することによって、第1の平滑化画像を取得することと、
前記第1の平滑化画像における前記製品の輪郭線近傍の輪郭領域に対してガウスフィルタリング平滑化を実行することによって、第2の平滑化画像を前記製品の広告画像として取得することと、を含む、請求項1に記載の方法。
【請求項9】
広告画像を生成する装置であって、
命令が記憶されたメモリと、
請求項1乃至8の何れかに記載の方法を実現するように前記命令を実行するように構成される少なくとも1つのプロセッサと、を含む、装置。
【請求項10】
プログラムが記憶されたコンピュータ読み取り可能な非一時的な記憶媒体であって、前記プログラムがコンピュータにより実行される際に、前記コンピュータに、
製品の広告画像のテキスト説明に基づいて、AI画像生成モデルのためのテキスト制御パラメータを生成するステップと、
前景が前記製品を示す画像ブロックであり、且つ背景が単一の色である製品画像に基づいて、前記AI画像生成モデルのための画像空間制御パラメータを生成するステップと、
前記製品画像に基づいて、前記AI画像生成モデルのためのノイズ画像を生成するステップと、
前記AI画像生成モデルを使用して、前記テキスト制御パラメータ、前記画像空間制御パラメータ及び前記ノイズ画像に基づいて、初期製品画像を生成するステップと、
前記初期製品画像における対応する領域を前記画像ブロックに置き換えることによって、復元製品画像を生成するステップと、
前記復元製品画像に対して前景画像と背景画像とを融合する後処理を実行することによって、前記製品の広告画像を生成するステップと、を実行させる、記憶媒体。

発明の詳細な説明【技術分野】
【0001】
本開示は、画像処理に関し、具体的には、コンピュータが実行する広告画像を生成する方法、広告画像を生成する装置、及びプログラムが記憶されたコンピュータ読み取り可能な非一時的な記憶媒体に関する。
続きを表示(約 1,900 文字)【背景技術】
【0002】
コンピュータ科学と人工知能の発展に伴い、コンピュータを使用してニューラルネットワークに基づく人工知能(Artificial Intelligence:AI)モデルを実行することで情報処理を実現することは、益々一般的かつ効果的になっている。画像生成は、人工知能モデルの重要な応用分野の1つである。
【0003】
製品画像を含む製品広告は、対象製品の特徴と効果を示し、製品の宣伝に役立ち、製品の認知度を向上させ、さらに製品の売上と利益を向上させる。従来の広告制作では、製品についての広告画像として、該製品の特徴を示す製品画像を手動で作成する必要があった。従来の広告画像の制作では、大量の労力と時間が必要であった。基本テンプレートに基づいて広告画像を作成しても、依然として大量の労力と時間が必要であった。
【0004】
現在、生成的AIモデルに基づいて画像を生成する方法がある。このようなAIモデルは、創造的な画像を生成することができるが、製品の画像の細部を復元することができない。また、特に珍しい製品の場合、既存のAIモデルは、通常、該製品の製品画像内の製品(製品画像ブロック)と一致する広告画像を生成することができない。
【0005】
製品の高品質な広告画像を生成することが望ましい。
【発明の概要】
【発明が解決しようとする課題】
【0006】
以下は、本開示の態様を基本的に理解させるために、本開示の簡単な概要を説明する。なお、この簡単な概要は、本開示を網羅的な概要ではなく、本開示のポイント又は重要な部分を意図的に特定するものではなく、本開示の範囲を意図的に限定するものではなく、後述するより詳細的な説明の前文として、単なる概念を簡単な形で説明することを目的とする。
【0007】
本発明の発明者は、画像生成モデル及び画像処理技術を研究し、効率及び画像品質の利点を期待する、広告画像を生成するための改善された方法を提案する。
【課題を解決するための手段】
【0008】
本開示の1つの態様では、コンピュータが実行する、広告画像を生成する方法であって、製品の広告画像のテキスト説明に基づいて、AI画像生成モデルのためのテキスト制御パラメータを生成するステップと、前景が前記製品を示す画像ブロックであり、且つ背景が単一の色である製品画像に基づいて、前記AI画像生成モデルのための画像空間制御パラメータを生成するステップと、前記製品画像に基づいて、前記AI画像生成モデルのためのノイズ画像を生成するステップと、前記AI画像生成モデルを使用して、前記テキスト制御パラメータ、前記画像空間制御パラメータ及び前記ノイズ画像に基づいて、初期製品画像を生成するステップと、前記初期製品画像における対応する領域を前記画像ブロックに置き換えることによって、復元製品画像を生成するステップと、前記復元製品画像に対して前景画像と背景画像とを融合する後処理を実行することによって、前記製品の広告画像を生成するステップと、を含む、方法を提供する。
【0009】
本開示の1つの態様では、広告画像を生成する装置であって、命令が記憶されたメモリと、上記の広告画像を生成する方法を実現するように前記命令を実行するように構成される少なくとも1つのプロセッサと、を含む、装置を提供する。
【0010】
本開示のもう1つの態様では、プログラムが記憶されたコンピュータ読み取り可能な非一時的な記憶媒体であって、前記プログラムがコンピュータにより実行される際に、前記コンピュータに、製品の広告画像のテキスト説明に基づいて、AI画像生成モデルのためのテキスト制御パラメータを生成するステップと、前景が前記製品を示す画像ブロックであり、且つ背景が単一の色である製品画像に基づいて、前記AI画像生成モデルのための画像空間制御パラメータを生成するステップと、前記製品画像に基づいて、前記AI画像生成モデルのためのノイズ画像を生成するステップと、前記AI画像生成モデルを使用して、前記テキスト制御パラメータ、前記画像空間制御パラメータ及び前記ノイズ画像に基づいて、初期製品画像を生成するステップと、前記初期製品画像における対応する領域を前記画像ブロックに置き換えることによって、復元製品画像を生成するステップと、前記復元製品画像に対して前景画像と背景画像とを融合する後処理を実行することによって、前記製品の広告画像を生成するステップと、を実行させる、記憶媒体を提供する。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
測定装置
1か月前
富士通株式会社
医用画像処理方法
5日前
富士通株式会社
画像変換機器と方法
1か月前
富士通株式会社
データセット特徴タイプ推論
1か月前
富士通株式会社
光伝送装置および光伝送方法
2か月前
富士通株式会社
信号相関量の確定装置と方法
1か月前
富士通株式会社
制御装置及び基地局制御方法
12日前
富士通株式会社
量子ビットデバイスの製造方法
11日前
富士通株式会社
マーキング方法及びプログラム
18日前
富士通株式会社
光伝送装置および光伝送システム
1か月前
富士通株式会社
制御プログラム、および制御方法
2か月前
富士通株式会社
双方向光リンクの異常モニタリング
1か月前
富士通株式会社
バイアスのための生成人工知能の検査
1か月前
富士通株式会社
情報処理プログラムおよび情報処理方法
1か月前
富士通株式会社
大規模言語モデルを使用したデータ調整
1か月前
富士通株式会社
制御プログラム、制御方法及び決済装置
1か月前
富士通株式会社
量子デバイス及び量子デバイスの制御方法
18日前
富士通株式会社
圧縮プログラム、圧縮方法および圧縮装置
1か月前
富士通株式会社
選択プログラム、選択装置、及び選択方法
1か月前
富士通株式会社
光送信機サブ信号光位相差の確定装置と方法
1か月前
富士通株式会社
赤外線センサ、及び赤外線センサの製造方法
1か月前
富士通株式会社
広告画像を生成する方法、装置及び記憶媒体
1か月前
富士通株式会社
無線アクセスネットワークプロビジョニング
1か月前
富士通株式会社
学習プログラム、学習方法および情報処理装置
11日前
富士通株式会社
描画プログラム、描画方法および情報処理装置
7日前
富士通株式会社
データ処理装置、プログラム及びデータ処理方法
6日前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
1か月前
富士通株式会社
演算プログラム、演算方法、および情報処理装置
4日前
富士通株式会社
表示制御プログラム、表示制御方法及び情報処理装置
4日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
6日前
富士通株式会社
情報処理プログラム、情報処理方法、及び情報処理装置
1か月前
富士通株式会社
量子ビットデバイス及び量子ビットデバイスの製造方法
1か月前
富士通株式会社
競争位置表示処理プログラムおよび競争位置表示処理方法
19日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
10日前
富士通株式会社
情報処理プログラム、情報処理装置、および情報処理方法
1か月前
富士通株式会社
カメラ制御プログラム、カメラ制御方法及び情報処理装置
18日前
続きを見る