TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025109013
公報種別公開特許公報(A)
公開日2025-07-24
出願番号2024002654
出願日2024-01-11
発明の名称情報処理方法、情報処理装置及びプログラム
出願人キヤノン株式会社
代理人弁理士法人谷・阿部特許事務所
主分類G06F 16/38 20190101AFI20250716BHJP(計算;計数)
要約【課題】 生成AIで所望のコンテンツを得るための適切なプロンプトを容易に設定することができるようにする。
【解決手段】 生成AIにコンテンツを生成させるための情報処理装置が、ユーザに関して得られた情報に基づいて特定の文字列を導出する導出手段と、前記導出手段で導出された特定の文字列を、前記生成AIに対しどのようなコンテンツを生成すべきでないかを指定するネガティブプロンプトに設定する設定手段と、を備える。
【選択図】 図5
特許請求の範囲【請求項1】
生成AIにコンテンツを生成させるための情報処理装置であって、
ユーザに関して得られた情報に基づいて特定の文字列を導出する導出手段と、
前記導出手段で導出された特定の文字列を、前記生成AIに対しどのようなコンテンツを生成すべきでないかを指定するネガティブプロンプトに設定する設定手段と、
を備えたこと特徴とする情報処理装置。
続きを表示(約 1,200 文字)【請求項2】
前記情報処理装置には、前記生成AIによって生成されたコンテンツを組み込んだ成果物を得るためのソフトウェアがインストールされており、
前記導出手段は、前記成果物について用意されたテンプレートに対する前記ユーザの選択に基づいて、当該選択されたテンプレートに予め対応付けられた特定の文字列を導出する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記複数のテンプレートには、それぞれの特徴に応じた特定の文字列がメタデータとして付与されており、
前記導出手段は、前記ユーザが選択したテンプレートのメタデータを参照して、当該テンプレートに対応付けられた特定の文字列を導出する、
ことを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記導出手段は、前記複数のテンプレートそれぞれとネガティブプロンプト用の文字列とを対応付けたテーブルを参照して、前記ユーザが選択したテンプレートに対応付けられた特定の文字列を導出する、ことを特徴とする請求項2に記載の情報処理装置。
【請求項5】
前記導出手段は、入力されたテンプレートの印象に適さない文字列を推定する学習済みモデルを用いて、前記ユーザが選択したテンプレートの印象に適さない文字列を、前記特定の文字列として導出する、ことを特徴とする請求項1に記載の情報処理装置。
【請求項6】
前記ユーザのためのGUIを制御する制御手段を有し、
前記制御手段は、前記ユーザが選択したテンプレートに対する前記GUI上での前記ユーザによる編集操作に基づいて、前記設定手段が設定したネガティブプロンプトを自動更新する、ことを特徴とする請求項2に記載の情報処理装置。
【請求項7】
前記自動更新は、前記設定手段がネガティブプロンプトに設定した特定の文字列の印象と、前記ユーザが選択したテンプレートに対して前記ユーザが自ら追加したコンテンツの印象とが類似する場合に、当該ネガティブプロンプトを削除する処理である、ことを特徴とする請求項6に記載の情報処理装置。
【請求項8】
前記導出手段は、前記ユーザの属性を示す属性情報に基づいて、前記特定の文字列を導出する、ことを特徴とする請求項1に記載の情報処理装置。
【請求項9】
前記導出手段は、前記特定の文字列を属性毎に登録したデータベースを用いて、前記属性情報によって特定される属性に応じた特定の文字列を導出する、ことを特徴とする請求項8に記載の情報処理装置。
【請求項10】
前記属性情報によって特定される属性は、前記ユーザの性別、年齢、趣味、国籍、当該国籍の国を含む地域、前記ユーザが使用する言語のうちいずれかである、ことを特徴とする請求項9に記載の情報処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本開示は、画像生成AIのプロンプト設定に関する。
続きを表示(約 2,500 文字)【背景技術】
【0002】
ポスターやチラシなどを作成するソフトウェアの機能の1つとして、予め用意された様々なテンプレートの中からユーザが所望のテンプレートを選択し、当該テンプレートに対して任意の文字やユーザ自ら撮影した画像を挿入する機能がある。この点、特許文献1は、テンプレートに含まれているオブジェクトのプロパティ情報から単語を抽出して検索キーワードを作成することで、テンプレートに適した画像を別途用意した画像群から検索できるようにする技術を開示している。
【先行技術文献】
【特許文献】
【0003】
特開2017-37557号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
例えばポスター等の作成ソフトウェアの中には生成AI(Artificial Intelligence)を用いて画像を生成する機能を有するものが登場している。この画像生成機能は、ユーザが単語や文章をプロンプトとして生成AIに入力すると、AIが、当該入力されたプロンプト(単語や文章)に基づいて画像を自動生成する、という機能である。ここで、例えば使用予定のポスターのテンプレートがイラスト調であったとする。イラスト調のテンプレートに画像を挿入する場合、同じくイラスト調の画像をユーザは期待して生成AIに任意のプロンプトを入力することになる。しかし、ユーザが入力したプロンプトが適切なものでないと生成AIは例えば写実的な画像を生成するなどしてしまい、使用予定のテンプレートのスタイル・雰囲気に合わない、といったことが起こる。このような場合、ユーザは、別のプロンプトの入力を試す等して生成AIによる画像生成を繰り返す必要があり、ユーザの手間が掛かってしまっていた。このように所望のコンテンツを得るための適切なプロンプトを考えて生成AIに入力することはユーザにとって困難で手間の掛かる作業であった。
【課題を解決するための手段】
【0005】
本開示に係る情報処理装置は、生成AIにコンテンツを生成させるための情報処理装置であって、ユーザに関して得られた情報に基づいて特定の文字列を導出する導出手段と、前記導出手段で導出された特定の文字列を、前記生成AIに対しどのようなコンテンツを生成すべきでないかを指定するネガティブプロンプトに設定する設定手段と、を備えたこと特徴とする。
【発明の効果】
【0006】
本開示によれば、所望のコンテンツを得るための適切なプロンプトを容易に設定することができる。
【図面の簡単な説明】
【0007】
本実施形態に係る、クライアントサーバシステムの構成例を示す図。
情報処理装置のハードウェア構成の一例を示す図。
フロントエンドアプリケーション及びバックエンドアプリケーションのソフトウェア構成の一例を示す機能ブロック図。
ネガティブプロンプトの一例を示す図。
クライアントにおける動作の流れを示すフローチャート。
(a)及び(b)は、ポスター編集画面の一例を示す図。
(a)及び(b)は、ポスター編集画面の一例を示す図。
(a)及び(b)は、ポスター編集画面の一例を示す図。
サーバにおける動作の流れを示すフローチャート。
(a)及び(b)は、ポスター編集画面の一例を示す図。
(a)はネガティブプロンプトの文字列を導出する様子を説明する図、(b)は導出された文字列群からネガティブプロンプトを設定するUI画面の一例を示す図。
(a)~(c)は、学習済みモデルを用いて画像の印象を得る様子を説明する図。
(a)及び(b)は、ネガティブプロンプトの自動更新を説明する図。
【発明を実施するための形態】
【0008】
以下、添付図面を参照して本発明の好適な実施の形態を詳しく説明する。尚、以下の実施の形態は特許請求の範囲に係る本発明を限定するものでなく、また本実施の形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
【0009】
[実施形態1]
<システム構成>
図1は、本実施形態に係る、クライアントサーバシステムの構成例を示す図である。本システムは、コンテンツ生成サービスを提供するサーバ101と当該サービスを利用するクライアント102とで構成される。サーバ101とクライアント102は各々のネットワーク103からインターネット104を経由して互いに通信する。サーバ101はバックエンドアプリケーション105を有する。クライアント102は、オペレーションシステム106、フロントエンドアプリケーション107を有する。
【0010】
<ハードウェア構成>
図2は、情報処理装置であるサーバ101及びクライアント102に共通するハードウェア構成の一例を示す図である。ユーザインターフェース201は、ディスプレイ、キーボード、マウス、ボタン、タッチパネルなどで構成される、情報や信号の入出力を行う操作表示部である。ネットワークインターフェース202は、LANなどのネットワークに接続して、他のコンピュータやネットワーク機器との通信を行う。通信の方式としては、有線・無線のいずれでもよい。CPU203は、ROM204、RAM205、二次記憶装置206などから読み込んだプログラムを実行する中央演算処理装置である。ROM204は、組込済みプログラム及びデータが記録されている不揮発性メモリである。RAM205は、一時メモリ領域を提供する揮発性メモリである。二次記憶装置206は、HDDやフラッシュメモリに代表される大容量記憶装置である。これらのハードウェアを備えないコンピュータは、リモートデスクトップやリモートシェルなどにより、他のコンピュータから接続・操作することも可能である。各部は入出力インターフェース207を介して接続されている。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

キヤノン株式会社
トナー
1か月前
キヤノン株式会社
トナー
1か月前
キヤノン株式会社
トナー
27日前
キヤノン株式会社
移動体
1か月前
キヤノン株式会社
トナー
1か月前
キヤノン株式会社
トナー
1か月前
キヤノン株式会社
トナー
1か月前
キヤノン株式会社
トナー
27日前
キヤノン株式会社
顕微鏡
1か月前
キヤノン株式会社
トナー
1か月前
キヤノン株式会社
トナー
1か月前
キヤノン株式会社
トナー
1か月前
キヤノン株式会社
トナー
1か月前
キヤノン株式会社
トナー
1か月前
キヤノン株式会社
測距装置
1か月前
キヤノン株式会社
電源装置
5日前
キヤノン株式会社
撮像装置
1か月前
キヤノン株式会社
電源装置
1か月前
キヤノン株式会社
記録装置
1か月前
キヤノン株式会社
電子部品
1か月前
キヤノン株式会社
記録装置
1か月前
キヤノン株式会社
電子機器
1か月前
キヤノン株式会社
記録装置
1か月前
キヤノン株式会社
通信端末
27日前
キヤノン株式会社
撮像装置
1か月前
キヤノン株式会社
記録装置
1か月前
キヤノン株式会社
撮像装置
28日前
キヤノン株式会社
撮像装置
1か月前
キヤノン株式会社
記録装置
1か月前
キヤノン株式会社
撮像装置
10日前
キヤノン株式会社
電子機器
18日前
キヤノン株式会社
撮像装置
1か月前
キヤノン株式会社
現像装置
今日
キヤノン株式会社
記憶装置
1か月前
キヤノン株式会社
記録装置
1か月前
キヤノン株式会社
記録装置
1か月前
続きを見る