TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024151939
公報種別公開特許公報(A)
公開日2024-10-25
出願番号2023065778
出願日2023-04-13
発明の名称生成装置、生成方法及び生成プログラム
出願人株式会社ZOZO
代理人弁理士法人酒井国際特許事務所
主分類G06T 11/80 20060101AFI20241018BHJP(計算;計数)
要約【課題】ファッション特有の抽象的な用語を適切に解釈して反映させた画像を提供すること。
【解決手段】本願に係る生成装置は、取得部と、生成部とを備える。取得部は、学習用画像とキーワードとを投影した分散表現空間における複数の学習用画像の差分と所定のキーワードとの類似性に関する情報を取得する。生成部は、取得部により取得された類似性に関する情報に基づき、複数の学習用画像と所定のキーワードとの関係性をモデルに学習させる。
【選択図】図6
特許請求の範囲【請求項1】
学習用画像とキーワードとを投影した分散表現空間における複数の学習用画像の差分と所定のキーワードとの類似性に関する情報を取得する取得部と、
前記取得部により取得された類似性に関する情報に基づき、前記複数の学習用画像と前記所定のキーワードとの関係性をモデルに学習させる生成部と、
を有することを特徴とする生成装置。
続きを表示(約 880 文字)【請求項2】
前記生成部は、
画像とキーワードとを入力すると当該画像に対応する画像を出力する前記モデルを学習させる
ことを特徴とする請求項1に記載の生成装置。
【請求項3】
前記生成部は、
前記モデルの出力結果に基づいて前記モデルを再学習させる
ことを特徴とする請求項1に記載の生成装置。
【請求項4】
前記生成部は、
前記分散表現空間において前記所定のキーワードに基づく所定方向に移動させた画像であるか否かに基づいて前記モデルを再学習させる
ことを特徴とする請求項3に記載の生成装置。
【請求項5】
前記生成部は、
前記分散表現空間において前記所定のキーワードに基づく所定方向に移動させた画像でない場合にのみ前記モデルを再学習させる
ことを特徴とする請求項3に記載の生成装置。
【請求項6】
前記生成部は、
学習データに利用者情報を含めて前記モデルを学習させる
ことを特徴とする請求項1に記載の生成装置。
【請求項7】
コンピュータが実行する生成方法であって、
学習用画像とキーワードとを投影した分散表現空間における複数の学習用画像の差分と所定のキーワードとの類似性に関する情報を取得する取得工程と、
前記取得工程により取得された類似性に関する情報に基づき、前記複数の学習用画像と前記所定のキーワードとの関係性をモデルに学習させる生成工程と、
を含むことを特徴とする生成方法。
【請求項8】
学習用画像とキーワードとを投影した分散表現空間における複数の学習用画像の差分と所定のキーワードとの類似性に関する情報を取得する取得手順と、
前記取得手順により取得された類似性に関する情報に基づき、前記複数の学習用画像と前記所定のキーワードとの関係性をモデルに学習させる生成手順と、
をコンピュータに実行させることを特徴とする生成プログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、生成装置、生成方法及び生成プログラムに関する。
続きを表示(約 2,300 文字)【背景技術】
【0002】
従来、AIを用いて画像を生成する技術が知られている。例えば、画像から抽出した特徴を混合した画像を生成する技術(下記特許文献1)、目標とする特徴の画像に改変した画像を生成する技術(下記特許文献2)、目標画像の特徴を記述したテキストに対応する画像を生成する技術(下記特許文献3)が知られている。
【0003】
また、画像を編集することでよりファッション性の高い画像を生成する技術(下記非特許文献1)、選択した被服を試着させた画像を生成する技術(下記非特許文献2)のようなファッション画像の生成に特化した技術や、変更を所望する画像と生成を所望する画像の説明文とを与えて画像を説明文のように編集した画像を生成する技術(下記非特許文献3)、説明文から画像を生成するモデルに変更したい画像の追加学習を行わせることでその変更対象を呼び出し可能にする技術(下記非特許文献4)のような文章から画像を生成する技術が知られている。
【0004】
また、ファッション用語の解釈にVSE(Visual-Semantic Embedding)の技術を用いた技術が知られている。例えば、ファッション特有の抽象的な用語を全身画像とともに定量化することで種々の角度から各用語の解釈を可能にする技術(下記非特許文献5)が知られている。
【先行技術文献】
【特許文献】
【0005】
特開2020-112907号公報
特開2022-157424号公報
特開2022-172173号公報
【非特許文献】
【0006】
WL. Hsiao, I. Katsman, CY. Wu, D. Parikh, K. Grauman“Fashion++: Minimal Edits for Outfit Improvement”,[online],[令和5年2月6日検索],インターネット<https://arxiv.org/abs/1904.09261>
X. Han, Z. Wu, Z. Wu, R. Yu, L.S. Davis“VITON: An Image-based Virtual Try-on Network”,[online],[令和5年2月6日検索],インターネット<https://arxiv.org/abs/1711.08447>
B. Kawar, S. Zada, O. Lang, O. Tov, H. Chang, T. Dekel, I. Mosseri, M. Irani“Imagic: Text-Based Real Image Editing with Diffusion Models”,[online],[令和5年2月6日検索],インターネット<https://arxiv.org/abs/2210.09276>
N. Ruiz, Y. Li, V. Jampani, Y. Pritch, M. Rubinstein, K. Aberman“DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation”,[online],[令和5年2月6日検索],インターネット<https://arxiv.org/abs/2208.12242>
R. Shimizu, Y. Saito, M. Matsutani, M. Goto“Fashion intelligence system: An outfit interpretation utilizing images and rich abstract tags”,[online],[令和5年2月6日検索],インターネット<https://www.sciencedirect.com/science/article/pii/S0957417422021856?via%3Dihub>
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、従来の技術では、ファッション特有の抽象的な用語を適切に解釈して反映させた画像を提供することができなかった。
【0008】
本願は、上記に鑑みてなされたものであって、ファッション特有の抽象的な用語を適切に解釈して反映させた画像を提供することを目的とする。
【課題を解決するための手段】
【0009】
本願に係る生成装置は、学習用画像とキーワードとを投影した分散表現空間における複数の学習用画像の差分と所定のキーワードとの類似性に関する情報を取得する取得部と、前記取得部により取得された類似性に関する情報に基づき、前記複数の学習用画像と前記所定のキーワードとの関係性をモデルに学習させる生成部と、を有することを特徴とする。
【発明の効果】
【0010】
実施形態の一態様によれば、ファッション特有の抽象的な用語を適切に解釈して反映させた画像を提供することができるという効果を奏する。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

株式会社ZOZO
情報処理装置、情報処理方法及び情報処理プログラム
17日前
株式会社ZOZO
情報処理装置、情報処理方法及び情報処理プログラム
10日前
株式会社ZOZO
情報処理装置、情報処理方法および情報処理プログラム
14日前
株式会社ZOZO
情報処理装置、情報処理方法および情報処理プログラム
14日前
株式会社ZOZO
情報処理装置、情報処理方法および情報処理プログラム
14日前
株式会社ZOZO
情報処理装置、情報処理方法及び情報処理プログラム
10日前
株式会社ZOZO
情報処理装置、情報処理方法及び情報処理プログラム
14日前
株式会社ZOZO
情報処理装置、情報処理方法及び情報処理プログラム
1か月前
個人
情報提示方法
11日前
個人
RFタグ読取装置
28日前
個人
プログラム
3日前
個人
プログラム
10日前
個人
自動精算システム
1か月前
個人
自動精算システム
19日前
個人
アカウントマップ
4日前
個人
売買システム
25日前
個人
管理サーバ
1か月前
個人
市場受発注システム
17日前
個人
発想支援方法及びシステム
14日前
日本精機株式会社
車両用表示装置
27日前
個人
学習装置及び推論装置
3日前
個人
分類処理プログラム及び方法
14日前
日本精機株式会社
車両用表示装置
27日前
井関農機株式会社
ロボット作業車両
19日前
個人
VRによる人体各部位の立体化
1か月前
富士通株式会社
金融システム
11日前
個人
未来型家系図構築システム
1か月前
キヤノン株式会社
情報処理装置
1か月前
トヨタ自動車株式会社
推定装置
1か月前
株式会社SEKT
文字認識装置
1か月前
株式会社プレニーズ
仲介システム
4日前
トヨタ自動車株式会社
表認識装置
1か月前
トヨタ自動車株式会社
情報通知方法
17日前
トヨタ自動車株式会社
記号識別方法
1か月前
トヨタ自動車株式会社
作業評価装置
26日前
ダイハツ工業株式会社
移動支援装置
1か月前
続きを見る