TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025091701
公報種別
公開特許公報(A)
公開日
2025-06-19
出願番号
2023207114
出願日
2023-12-07
発明の名称
情報処理装置の制御方法、情報処理装置、及びプログラム
出願人
キヤノン株式会社
代理人
個人
主分類
G06T
1/40 20060101AFI20250612BHJP(計算;計数)
要約
【課題】機械学習に基づき構築されたモデルを利用して複数の画像に対して加工を施すためのプロンプトの指示に係るユーザの手間をより好適な態様で削減可能とする。
【解決手段】レイアウトデータDB400は、入力されたプロンプトに基づき入力画像に対して加工を施すように学習がなされた生成モデル415が、第一の画像に加工を施すことで加工後画像を出力する際に入力として受け付けた、当該第一の画像の加工に係る指示を含む第一のプロンプトを保持する。プロンプト流用部404は、第一のプロンプトに基づき、指定された第二の画像の加工に係る指示を少なくとも含む第二のプロンプトを生成する。
【選択図】図4
特許請求の範囲
【請求項1】
情報処理装置の制御方法であって、
入力されたプロンプトに基づき入力画像に対して加工を施すように学習がなされた第一のモデルが、第一の画像に加工を施すことで加工後画像を出力する際に入力として受け付けた、当該第一の画像の加工に係る指示を含む第一のプロンプトを保持する保持ステップと、
前記第一のプロンプトに基づき、指定された第二の画像の加工に係る指示を少なくとも含む第二のプロンプトを生成する生成ステップと、
を含むことを特徴とする、情報処理装置の制御方法。
続きを表示(約 1,400 文字)
【請求項2】
前記第一のプロンプトの流用に係る指示を受け付ける受付ステップを含み、
前記生成ステップは、前記受付ステップが前記第一のプロンプトの流用に係る指示を受け付けた場合に、当該第一のプロンプトに基づき前記第二のプロンプトを生成することを特徴とする、請求項1に記載の情報処理装置の制御方法。
【請求項3】
前記受付ステップは、第一の画像の指定を受け付けたうえで、前記第一のプロンプトの流用に係る指示と、前記第二の画像の指定と、を受け付けることを特徴とする、請求項2に記載の情報処理装置の制御方法。
【請求項4】
前記受付ステップは、第二の画像の指定を受け付けたうえで、前記第一のプロンプトの流用に係る指示と、前記第一の画像の指定と、を受け付けることを特徴とする、請求項2に記載の情報処理装置の制御方法。
【請求項5】
前記生成ステップは、前記第一の画像のメタデータと、前記第二の画像のメタデータと、のうちの少なくともいずれかと、前記第一のプロンプトと、に基づき、前記第二のプロンプトを生成することを特徴とする、請求項1に記載の情報処理装置の制御方法。
【請求項6】
前記生成ステップは、入力された指示に基づきプロンプトを生成する第二のモデルに対して、前記第一のプロンプトと、当該第一のプロンプトの加工に係る指示と、を入力することで、当該第二のモデルに前記第二のプロンプトを生成させることを特徴とする、請求項1に記載の情報処理装置の制御方法。
【請求項7】
前記第一の画像の指定が受け付けられる場合に、当該第一の画像に関連付けて前記第一のプロンプトがユーザに提示されるように制御する第一の出力制御ステップを含むことを特徴とする、請求項1に記載の情報処理装置の制御方法。
【請求項8】
前記保持ステップは、前記第一のプロンプトと前記加工後画像とを関連付けて保持し、
前記第一の画像の指定が受け付けられる場合に、前記第一の画像と、前記加工後画像と、が前記第一のプロンプトに基づく加工前後の画像としてユーザに提示されるように制御する第二の出力制御ステップを含む
ことを特徴とする、請求項1に記載の情報処理装置の制御方法。
【請求項9】
入力されたプロンプトに基づき入力画像に対して加工を施すように学習がなされた第一のモデルが、第一の画像に加工を施すことで加工後画像を出力する際に入力として受け付けた、当該第一の画像の加工に係る指示を含む第一のプロンプトを保持する保持手段と、
前記第一のプロンプトに基づき、指定された第二の画像の加工に係る指示を少なくとも含む第二のプロンプトを生成する生成手段と、
を有することを特徴とする、情報処理装置。
【請求項10】
コンピュータを、
入力されたプロンプトに基づき入力画像に対して加工を施すように学習がなされた第一のモデルが、第一の画像に加工を施すことで加工後画像を出力する際に入力として受け付けた、当該第一の画像の加工に係る指示を含む第一のプロンプトを保持する保持手段と、
前記第一のプロンプトに基づき、指定された第二の画像の加工に係る指示を少なくとも含む第二のプロンプトを生成する生成手段と、
を有することを特徴とする情報処理装置として機能させるためのプログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、情報処理装置の制御方法、情報処理装置、及びプログラムに関する。
続きを表示(約 2,400 文字)
【背景技術】
【0002】
一般的には、ポスターやチラシ等のレイアウトを伴うレイアウトデータの編集がなされる場合には、まず完成イメージにより近いテンプレート素材の選択がなされる。そのうえで、選択されたテンプレートに対して、テキストや画像等のコンテンツの追加や削除が行われ、各コンテンツの位置やサイズの変更が行われることで全体のレイアウトの調整がなされる。
また、近年では、上述したレイアウトデータの編集において、コンテンツの追加や編集が行われる際に、所謂生成系AI技術を利用することも可能となってきている。このような生成系AI技術としては、例えば、Stable Diffusion(登録商標)、ChatGPT(登録商標)、及びGAN(敵対的生成アルゴリズム)等が挙げられる。
【0003】
レイアウトデータの編集に際して、テンプレートのレイアウトを保ったまま、テンプレートに含まれる画像コンテンツの編集がなされる場合がある。例えば、暑い季節の行事案内用ポスターを寒い季節の行事案内用ポスターに変更するようなケースにおいて、ポスター内に存在する人物画像が薄手の服装であれば、寒い季節に適した厚手の服装に変更することが求められる。このような状況下において、ポスター内に複数の人物画像がある場合には、すべての人物の服装を変えることが求められる場合がある。このように複数の画像コンテンツに対して共通の「コンテキスト」に従った編集が求められる状況下では、コンテンツごとに生成系AIの入力となるプロンプトの指示を行うことはユーザにとっては手間となる場合がある。
このような背景から、生成系AIの入力となるプロンプトの指示に係る手間を削減する技術も各種検討されている。特許文献1には、画像コンテンツの被写体のプロフィール情報や画像コンテンツからどのような画像であるかの情報を抽出し、当該情報に基づき画像コンテンツを生成するためのプロンプトを自動で作成する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
特許第7329293号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に開示された技術は、元の画像と類似した画像を生成することは可能であるものの、既に存在する画像に対して、ユーザの意図に沿った加工や編集を施すことは困難である。そのため、対象となる複数の画像それぞれに対してユーザの意図に沿った加工や編集を行うための、生成系AIのような機械学習に基づき構築されたモデルへの入力となるプロンプトの指示に係る手間をより削減可能とする技術の実現が求められている。
【0006】
本発明は上記の問題を鑑み、機械学習に基づき構築されたモデルを利用して複数の画像に対して加工を施すためのプロンプトの指示に係るユーザの手間をより好適な態様で削減可能とすることを目的とする。
【課題を解決するための手段】
【0007】
本発明に係る情報処理装置の制御方法は、入力されたプロンプトに基づき入力画像に対して加工を施すように学習がなされた第一のモデルが、第一の画像に加工を施すことで加工後画像を出力する際に入力として受け付けた、当該第一の画像の加工に係る指示を含む第一のプロンプトを保持する保持ステップと、前記第一のプロンプトに基づき、指定された第二の画像の加工に係る指示を少なくとも含む第二のプロンプトを生成する生成ステップと、を含むことを特徴とする。
【発明の効果】
【0008】
本発明によれば、機械学習に基づき構築されたモデルを利用して複数の画像に対して加工を施すためのプロンプトの指示に係るユーザの手間をより好適な態様で削減することあg可能となる。
【図面の簡単な説明】
【0009】
情報処理システムのシステム構成の一例を示した図である。
画像出力装置のハードウェア構成の一例を示した図である。
情報処理装置のハードウェア構成の一例を示した図である。
情報処理システムの機能構成の一例を示した機能ブロック図である。
レイアウトデータの一例を示した図である。
レイアウトデータ編集画面の一例を示した図である。
生成系AI技術の概要を示した図である。
情報処理システムの処理の一例を示したフローチャートである。
レイアウトデータ編集画面の一例を示した図である。
レイアウトデータ編集画面の一例を示した図である。
レイアウトデータの一例を示した図である。
情報処理システムの処理の一例を示したフローチャートである。
レイアウトデータ編集画面の一例を示した図である。
レイアウトデータ編集画面の一例を示した図である。
情報処理システムの機能構成の一例を示した機能ブロック図である。
情報処理システムの処理の一例を示したフローチャートである。
大規模言語モデルを用いたプロンプト生成の一例を示した図である。
情報処理システムの処理の一例を示したフローチャートである。
レイアウトデータの一例を示した図である。
レイアウトデータ編集画面の一例を示した図である。
【発明を実施するための形態】
【0010】
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
対話装置
20日前
個人
情報処理装置
20日前
個人
記入設定プラグイン
8日前
個人
情報処理装置
16日前
個人
情報入力装置
20日前
個人
不動産売買システム
今日
個人
物価スライド機能付生命保険
20日前
個人
マイホーム非電子入札システム
20日前
株式会社BONNOU
管理装置
13日前
サクサ株式会社
カードの制動構造
22日前
個人
決済手数料0%のクレジットカード
23日前
株式会社ワコム
電子消去具
今日
株式会社東芝
電子機器
1日前
ホシデン株式会社
タッチ入力装置
今日
トヨタ自動車株式会社
情報処理装置
26日前
村田機械株式会社
割当補助システム
26日前
株式会社ライト
情報処理装置
13日前
住友重機械工業株式会社
力覚伝達装置
15日前
Sansan株式会社
組織図生成装置
29日前
株式会社WellGo
個人情報利用方法
16日前
株式会社WellGo
個人情報秘匿方法
16日前
個人
システム、データおよびプログラム
9日前
株式会社半導体エネルギー研究所
会計システム
6日前
株式会社半導体エネルギー研究所
検索支援方法
13日前
株式会社豆蔵
ピッキング装置
22日前
株式会社mov
情報処理システム
20日前
シャープ株式会社
通信装置
20日前
個人
輸送管理装置及び輸送管理方法
20日前
株式会社WellGo
ストレージサービス
16日前
トヨタ自動車株式会社
データ収集システム
14日前
トヨタ自動車株式会社
リスク評価システム
26日前
株式会社Rist
情報処理方法
21日前
トヨタ車体株式会社
荷下ろし支援装置
27日前
株式会社Rist
情報処理方法
21日前
ユニティガードシステム株式会社
警備支援システム
26日前
株式会社デンソーウェーブ
情報読取装置
6日前
続きを見る
他の特許を見る