TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025169106
公報種別
公開特許公報(A)
公開日
2025-11-12
出願番号
2024074137
出願日
2024-04-30
発明の名称
サービス情報提供システム
出願人
個人
代理人
主分類
G06Q
50/10 20120101AFI20251105BHJP(計算;計数)
要約
【課題】ユーザからの単一メディアの入力データから、応答結果として2種類以上のメディア、生成モデルでの出力結果をユーザに提示することにより、異なった視点での結果を与えることによりユーザがより感覚的に深く出力結果を得るサービス情報提供システムを提供する。
【解決手段】ユーザ端末1、サーバ2と4つの生成モデル3の3種類の構成要素がネットワークで接続されているサービス情報提供システムにおいて、サーバは、言語生成モデル、画像生成モデル、音声生成モデル、映像生成モデルなどの少なくとも2種類以上のメディアの生成モデルシステムを利用可能で、ユーザの与える単一メディアの入力情報に対し、複数メディアで出力結果を提示する一対多の関係にすることで、アイデア創出に役に立つ異なった視点で出力結果を得ることができる。
【選択図】図1
特許請求の範囲
【請求項1】
ユーザ端末からネットワーク経由で接続してデータを受信するための受信機能、ユーザ端末にデータを送信するための送信機能と情報処理機能を持つサーバを有し、
前記サーバは少なくとも言語生成の言語生成モデル、画像生成の画像生成モデル、音生成の音生成モデル、音楽生成の音楽生成モデル、映像生成の映像生成モデルなどの複数の生成モデルの少なくとも2種類以上の生成モデルを有し、
前記ユーザ端末に入力したテキスト、画像、音、音楽、映像等のいずれか1種類のデータと保存している生成モデルへの入力用ベースから生成モデルへの入力データを作成する情報処理機能を前記ユーザ端末、もしくは、前記サーバに有し、
前記言語生成モデル、前記画像生成モデル、前記音生成モデル、前記音楽生成モデル、前記映像生成モデルの中の2種類以上の生成モデルに対し、それぞれの前記生成モデル用の入力データを質問文としてそれぞれの生成モデル送信し、それぞれの生成モデルから回答を受け取り、それらの結果をユーザ端末に送信し、その生成結果を前記ユーザ端末に提示する機能を持つことで、
ユーザがアイディアや発想を求めて生成モデルを活用する際、異なった複数の視点での結果を提供することでイメージや発想の手助けをすることを特徴とするサービス情報提供システム。
続きを表示(約 900 文字)
【請求項2】
前記サーバで処理されているユーザの入力データと保存している生成モデルへの入力用ベースから生成モデルへの入力データを作成する情報処理機能を前記ユーザ端末にもち、前記ユーザ端末内に保存した生成モデルで情報処理することを特徴とする、請求項1に記載のサービス情報提供システム。
【請求項3】
ユーザの入力データがテキスト、画像、音声のいずれか1種類あり、その内容に明確な指示が含まれないこと特徴とする請求項1または2に記載のサービス情報提供システム。
【請求項4】
ユーザの入力データの内容が、感情や感覚を表す複数の言葉であり、これらの言葉だけでは生成モデルの入力データには不十分であることを特徴とする請求項1または2に記載のサービス情報提供システム。
【請求項5】
前記ユーザ端末から前記サーバへ送信される内容が感情や感覚を表す複数の言葉であることにより、異なる生成モデルの入力テンプレートを作成することを容易にしていることを特徴とする請求項1に記載のサービス情報提供システム。
【請求項6】
ユーザ端末にテキストを入力することのできる入力欄、および、ユーザがテキスト入力完了時に入力したテキストを送信するボタンを備えた画面と、前記ユーザ端末から送信されたテキストデータを受信して処理する前記サーバを有し、
前記サーバには、言語を理解して言語を生成する前記言語生成モデルと言語を理解して理解した言語から画像を生成する前記画像生成モデルとを有し、
前記ユーザ入力のテキストデータと前記サーバに保存している生成モデル入力素材から前記言語生成モデルへの入力データを作成し、この入力データを用いて前記言語生成モデルを実行して得られた生成結果と、前記ユーザ入力のテキストデータと前記サーバ日本している画像生成モデル入力素材用からの入力データを作成して前記画像生成モデルを実行して得られた生成結果の2つの生成結果をユーザの端末に返信して、ユーザ端末に提示することを特徴とする請求項1に記載のサービス情報提供システム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、ユーザにネットワーク経由でサービス情報提供システムに関する。
続きを表示(約 2,400 文字)
【背景技術】
【0002】
近年、英語や日本語など多言語に対応した言語モデルチャットシステム(非特許文献1など)や、キーワードを入力して画像を生成することができる画像生成システム(非特許文献2など)など人工知能を利用したシステムが多く提供されており、ブラウザからも利用できるようになり一般ユーザも利用できるようになってきている。
【0003】
このように生成AIがブラウザで提供されることで一般ユーザが利用しやすい環境が整ってきた。この流れで企業、会社などでも社内用、および商用で生成AIを利用する環境が整ってきている。特許文献1には生成AIの言語モデルを利用して、音声の会話を入力し精度よく要約文を生成させる技術が開示されている。ここでは、音声の会話の音源である音声データをテキスト化して、「はい」などのようにテキストにした時に同じ文字列でも怒っている場合、怒っていない場合があり、その音声データの感情状態を分析すること精度よく要約文を生成する方法を開示している。
【0004】
特許文献2では、ユーザが作成したい画像のキーワードを生成AIの画像生成モデルに入力して、新規性のある画風の画像を生成する技術が開示されている。ユーザが入力したキーワードから生成した画像のN次元の特徴データと蓄積されている画像のN次元の特徴データを利用し、ある特徴データの分布で疎な領域の特徴データを考慮することで新規性のある画風を生成する方法を示している。
【0005】
また、特許文献3では、音声チャットボットにおいて認識結果の自動学習装置において効率よく認識精度を上げる方法として、AIチャットボットで話者からの発話内容をAIチャットボットでの認識結果を復唱し、話者の反応により認識内容の正誤を判断し、初めの段階で「誤」と判断され、後になって「正」と判断されたものの認識結果の差分に基づいて学習させる学習方法を有することで認識精度を上げること示している
【先行技術文献】
【特許文献】
【0006】
特許第6513869号
特許第7270894号
特開2021-56392
【非特許文献】
【0007】
OpenAI ChatGPT 令和6年4月12日検索インターネットURL https://chat.openai.com/
Stability AI SDXL 令和6年4月12日検索インターネットURL https://ja.stability.ai/stable-diffusion
OpenAI Sora 令和6年4月12日検索インターネットURL https://www.ciciai.com/
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、ChatGPTなどでは、ブラウザ上で質問内容をテキスト入力すると質問内容の後に生成された回答内容が追記される。また、スマートスピーカと言われるAI機能と通信機能を備えたAIチャットボットでは、話者とチャットボットのマイク、スピーカにより会話することで質問内容に対してスピーカから回答することができる。このようなスマートスピーカでは、天気や株価のチェックといった一般的な受け答えから、ニュースを聞いたり、タイマーを設定したり、音楽再生といった作業も依頼することが可能である。これらの対話はChatGPTでは、ブラウザでのテキストメディアの入力に対し、テキストメディアで、スマートスピーカについては、話者の話しかけ(音声)に対しスマートスピーカから発せされる音声で回答がされる。ここでは、対話のやり取りがテキストや音声であり、質問と回答が同じテキストメディア、音声メディアであり、質問に対して回答内容が1つ示される一対一の関係である。
【0009】
上記の各特許文献に開示されている技術は、特許文献1に示されている音声をテキストに変換して要約文を作成することや、特許文献2に示されているユーザが入力するキーワードから新規性のある画風の画像を生成するなど、ChatGPTやスマートスピーカの場合とは異なり、質問と回答のメディアが音声からテキスト、テキストから画像などのメディア変換されている。しかしながらそれらの質問に対する出力結果は、一対一の関係でありChatGPTやスマートスピーカと同じである。
【0010】
ChatGPTやスマートスピーカなどは生成AIの生成モデルを用いて質問に対する回答を生成している。一例ではあるが、「認知症について説明してください。」、「今日の天気は?」、「以下の文を要約してください。」、「あなたはプロのライターです。次の商品について、ターゲットに刺さるキャッチコピーを作成してください。」、「テキストをneutral、negative、またはpositiveに分類してください。テキスト:この食べ物はまずまずでした。」などのような質問文が言語生成モデルに入力情報として与えられ回答が得られる。画像生成モデルに対しては、「夕方に公園で遊ぶ子どもたち」、「最高品質、美しい1人の女性、長髪、茶髪、キャミソールとスカートを着ている、照れ笑い、日光のライティング、背景は街並み」などのように1つの回答を得るための説明であり、より求めているものに近いものを得るために詳細な質問文が用いられている。ここでも質問と回答の関係は、言語生成モデルでは、入力のテキストに対し出力のテキスト、画像生成モデルの入力のテキストに対して出力の画像という一対一の関係にある。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
個人
詐欺保険
29日前
個人
縁伊達ポイン
29日前
個人
5掛けポイント
5日前
個人
RFタグシート
16日前
個人
ペルソナ認証方式
13日前
個人
地球保全システム
1か月前
個人
QRコードの彩色
1か月前
個人
情報処理装置
8日前
個人
自動調理装置
15日前
個人
為替ポイント伊達夢貯
2か月前
個人
冷凍食品輸出支援構造
2か月前
個人
表変換編集支援システム
2か月前
個人
残土処理システム
1か月前
個人
農作物用途分配システム
28日前
個人
知的財産出願支援システム
1か月前
個人
サービス情報提供システム
今日
個人
インターネットの利用構造
12日前
個人
タッチパネル操作指代替具
22日前
個人
知財出願支援AIシステム
2か月前
個人
スケジュール調整プログラム
21日前
個人
行動時間管理システム
2か月前
個人
携帯端末障害問合せシステム
21日前
個人
パスワード管理支援システム
2か月前
個人
システム及びプログラム
1か月前
個人
AIキャラクター制御システム
2か月前
個人
エリアガイドナビAIシステム
13日前
個人
海外支援型農作物活用システム
1か月前
株式会社キーエンス
受発注システム
1か月前
株式会社キーエンス
受発注システム
1か月前
株式会社キーエンス
受発注システム
1か月前
個人
食品レシピ生成システム
1か月前
キヤノン株式会社
情報処理装置
6日前
個人
人格進化型対話応答制御システム
2か月前
株式会社ワコム
電子ペン
7日前
キヤノン株式会社
印刷システム
21日前
株式会社ワコム
電子ペン
7日前
続きを見る
他の特許を見る