TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025067539
公報種別
公開特許公報(A)
公開日
2025-04-24
出願番号
2023177599
出願日
2023-10-13
発明の名称
情報処理装置、情報処理方法、およびプログラム
出願人
キヤノン株式会社
代理人
個人
,
個人
,
個人
,
個人
,
個人
主分類
G06T
11/80 20060101AFI20250417BHJP(計算;計数)
要約
【課題】 特定の人物や場所に応じた画像を精度よく生成する。
【解決手段】 情報処理装置100の入力部204は、人物を表す人物情報と、場所を表す場所情報とを入力し(S401)、プロンプト生成部201は、入力された情報に基づいてプロンプトを生成し(S402)、画像生成部202は、プロンプトを用いて人物と場所を表す生成画像を取得し(S404)、通信部208は、生成画像を出力する(S407)。
【選択図】 図2
特許請求の範囲
【請求項1】
人物を表す人物情報と、場所を表す場所情報とを入力する入力手段と、
前記入力手段により入力された情報に基づいてプロンプトを生成するプロンプト生成手段と、
前記プロンプト生成手段により生成されたプロンプトを用いて前記人物と場所を表す生成画像を取得する取得手段と、
前記取得手段により取得された生成画像を出力する出力手段と
を有することを特徴とする情報処理装置。
続きを表示(約 1,200 文字)
【請求項2】
前記人物情報は、前記生成画像に含めるべき人物の年齢、身長、性別、服装、髪の色、および姿勢のうち、少なくともいずれか1つを含むことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記場所情報は、前記生成画像によって表される場所の種類、前記生成画像に含まれるべき物体の種類と数、および、前記生成画像に含まれるべき人物の数のうち、少なくともいずれか1つを含むことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記入力手段により入力された前記人物情報と前記場所情報に基づいて前記プロンプト生成手段により生成されたプロンプトをディスプレイ装置に表示させる表示制御手段と、
前記ディスプレイ装置に表示されたプロンプトを変更するための変更指示を受け付ける受付手段と、を有し、
前記取得手段は、前記変更指示に応じて変更されたプロンプトを用いて前記生成画像を取得することを特徴とする請求項1に記載の情報処理装置。
【請求項5】
前記受付手段により前記変更指示が受け付けられた場合、前記表示制御手段は、前記入力手段により入力された前記人物情報と前記場所情報を変更するための変更画面を前記ディスプレイ装置に表示させ、
前記取得手段は、前記変更画面に対する入力に基づいて変更されたプロンプトを用いて前記生成画像を取得することを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記受付手段は、前記表示制御手段により前記ディスプレイ装置に表示されたプロンプトに対する編集操作を変更指示として受け付けることを特徴とする請求項4に記載の情報処理装置。
【請求項7】
前記取得手段により取得された生成画像をディスプレイ装置に表示させる表示制御手段と、
前記ディスプレイ装置において表示された生成画像を変更するための変更指示を受け付ける受付手段と、を有することを特徴とする請求項1に記載の情報処理装置。
【請求項8】
前記取得手段により生成された生成画像に含まれる前記人物の顔画像を、指定された顔画像に置き替える置換手段を有し、
前記出力手段は、前記置換手段により顔画像が置き替えられた生成画像を出力することを特徴とする請求項1乃至7のうちいずれか1項に記載の情報処理装置。
【請求項9】
前記出力手段は、前記取得手段により取得された生成画像を、ディスプレイ装置および/またはプリンタに出力することを特徴とする請求項1乃至7のうちいずれか1項に記載の情報処理装置。
【請求項10】
前記取得手段は、プロンプトに応じた画像を生成するように学習された学習済みプログラムに対して前記プロンプト生成手段により生成されたプロンプトを入力することにより、前記生成画像を取得することを特徴とする請求項1乃至7のうちいずれか1項に記載の情報処理装置。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明は、画像の取得方法に関する。
続きを表示(約 1,200 文字)
【背景技術】
【0002】
近年、いわゆる生成AIと呼ばれるサービスが実用段階に入っている。特許文献1には、画像生成の条件または画像生成のためのテキスト等を含む画像生成リクエストに基づき敵対的生成ネットワーク(GANs)にて画像生成を行うことが記載されている。
【0003】
また、ある人物の顔の画像を他の人物の顔の画像に入れ替えた画像を生成する画像生成技術が提案されており、エイターテインメントやAI開発における学習および評価データなどの用途で利用されている。特許文献2には、第1の顔画像に第2の顔画像をはめ込む際に、第1の顔画像の顔領域に合うように第2の顔画像の顔領域を切り出すことが記載されている。
【先行技術文献】
【特許文献】
【0004】
特開2023-126068号公報
特開2021-73619号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上述の先行技術では特定の人物や場所に応じた画像を精度よく生成することができない恐れがあった。
【0006】
本発明は上述した問題を解決するためになされたものであり、その目的は、特定の人物や場所に応じた画像を精度よく生成できるようにすることである。
【課題を解決するための手段】
【0007】
上記目的を達成するため、本発明の情報処理装置は、例えば以下の構成を有する。すなわち、人物を表す人物情報と、場所を表す場所情報とを入力する入力手段と、前記入力手段により入力された情報に基づいてプロンプトを生成するプロンプト生成手段と、前記プロンプト生成手段により生成されたプロンプトを用いて前記人物と場所を表す生成画像を取得する取得手段と、前記取得手段により取得された生成画像を出力する出力手段とを有する。
【発明の効果】
【0008】
本発明によれば、特定の人物や場所に応じた画像を精度よく生成できるようになる。
【図面の簡単な説明】
【0009】
情報処理装置のハードウェア構成例を示す図である。
情報処理装置の機能構成例を示す図である。
入力画面301の一例を示す図である。
情報処理装置の処理の流れを示すフローチャートである。
画像修正部が行う処理の流れを示すフローチャートである。
画像修正部の処理前と処理後の画像の一例を示す図である。
【発明を実施するための形態】
【0010】
以下、添付の図面を参照して、本発明をその好適な実施形態に基づいて詳細に説明する。なお、以下の実施形態において示す構成は一例に過ぎず、本発明は図示された構成に限定されるものではない。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
キヤノン株式会社
トナー
8日前
キヤノン株式会社
トナー
8日前
キヤノン株式会社
トナー
8日前
キヤノン株式会社
トナー
8日前
キヤノン株式会社
トナー
3日前
キヤノン株式会社
トナー
3日前
キヤノン株式会社
情報機器
16日前
キヤノン株式会社
現像装置
11日前
キヤノン株式会社
撮像装置
16日前
キヤノン株式会社
光学装置
9日前
キヤノン株式会社
現像装置
11日前
キヤノン株式会社
電子機器
1日前
キヤノン株式会社
記録装置
9日前
キヤノン株式会社
定着装置
8日前
キヤノン株式会社
培養装置
8日前
キヤノン株式会社
撮像装置
8日前
キヤノン株式会社
撮像装置
1日前
キヤノン株式会社
培養装置
8日前
キヤノン株式会社
培養装置
8日前
キヤノン株式会社
撮像装置
1日前
キヤノン株式会社
プログラム
3日前
キヤノン株式会社
プログラム
3日前
キヤノン株式会社
プログラム
3日前
キヤノン株式会社
光電変換装置
16日前
キヤノン株式会社
画像形成装置
3日前
キヤノン株式会社
画像形成装置
10日前
キヤノン株式会社
画像形成装置
10日前
キヤノン株式会社
画像形成装置
15日前
キヤノン株式会社
無線通信装置
10日前
キヤノン株式会社
画像形成装置
10日前
キヤノン株式会社
画像形成装置
16日前
キヤノン株式会社
画像読取装置
8日前
キヤノン株式会社
画像形成装置
10日前
キヤノン株式会社
画像形成装置
15日前
キヤノン株式会社
画像形成装置
9日前
キヤノン株式会社
画像表示装置
9日前
続きを見る
他の特許を見る