TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025080932
公報種別
公開特許公報(A)
公開日
2025-05-27
出願番号
2023194324
出願日
2023-11-15
発明の名称
情報処理装置及びそれを用いた機器システム
出願人
株式会社ダイヘン
代理人
個人
,
個人
,
個人
,
個人
,
個人
主分類
G10L
15/10 20060101AFI20250520BHJP(楽器;音響)
要約
【課題】ユーザが発話した音声が認識し難い騒音環境下であっても、大規模言語モデルを用いて、当該ユーザが発話した音声に基づいて所定機器に対する適切なコマンドを生成する情報処理装置及びそれを用いた機器システムを提供することである。
【解決手段】情報処理装置100は、ユーザの音声に基づいて生成された入力データに、所定機器10を制御可能な複数のコマンドで構成されるコマンドデータ50を合わせてプロンプトを生成するプロンプト生成手段130と、プロンプトを大規模言語モデル40に送信するプロンプト送信手段140と、大規模言語モデル40からの回答を受信する回答受信手段150と、回答に基づいて、所定機器10を制御するコマンドを生成するコマンド生成手段160と、を備える。
【選択図】図3
特許請求の範囲
【請求項1】
所定機器を制御するコマンドを処理する情報処理装置であって、
ユーザの音声に基づいて生成された入力データに、前記所定機器を制御可能な複数のコマンドで構成されるコマンドデータを合わせてプロンプトを生成するプロンプト生成手段と、
前記プロンプトを大規模言語モデルに送信するプロンプト送信手段と、
前記大規模言語モデルからの回答を受信する回答受信手段と、
前記回答に基づいて、前記所定機器を制御するコマンドを生成するコマンド生成手段と、を備える、
情報処理装置。
続きを表示(約 630 文字)
【請求項2】
前記コマンドデータは、前記所定機器に応じて予め設定されている、
請求項1に記載の情報処理装置。
【請求項3】
前記プロンプトは、前記所定機器を制御可能な複数のコマンドのうち前記入力データに対応する1つのコマンドを選択させる内容を含む、
請求項1に記載の情報処理装置。
【請求項4】
前記回答に基づいて生成されるコマンドについて、程度を示す詳細情報が必要か否かを判定する判定手段を、さらに備え、
前記詳細情報が必要であると判定された場合、
前記プロンプト生成手段は、前記入力データから詳細情報が得られる内容を含む第2プロンプトを生成し、
前記プロンプト送信手段は、前記第2プロンプトを前記大規模言語モデルに送信し、
前記回答受信手段は、前記大規模言語モデルからの第2回答を受信し、
前記コマンド生成手段は、前記回答及び前記第2回答に基づいて、前記所定機器を制御する、前記詳細情報を含むコマンドを生成する、
請求項1に記載の情報処理装置。
【請求項5】
前記詳細情報は、数値情報を含む、
請求項4に記載の情報処理装置。
【請求項6】
請求項1から5のいずれか一項に記載の情報処理装置と、
前記情報処理装置によって生成されたコマンドを受け付けて動作する所定機器と、を備える、
機器システム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、情報処理装置及びそれを用いた機器システムに関する。
続きを表示(約 1,400 文字)
【背景技術】
【0002】
一般的に、ユーザが機器に対するコマンドを音声で入力して、当該機器を動作させるシステムが普及しており、このようなシステムでは、ユーザが発話した音声を適切に認識することが重要となる。
【0003】
また、製造装置や機械などの機器が稼働する工場においても、ユーザが発話した音声を認識することによって機器の動作を制御するシステムが知られている。工場では、製造設備の機器においてモータ音や機械音などが発生しており、さらには、部材や機材が衝突する衝突音など突発的に発生する騒音もあるため、このような騒音環境下で、ユーザが発話した音声を適切に認識することは困難な場合がある。
【先行技術文献】
【特許文献】
【0004】
特許第7313757号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところで、近年では、質問(プロンプト)を入力して、それに対する回答を得るという、大規模言語モデルを活用したAI(Artificial Intelligence)技術が急速に発展している。例えば、特許文献1では、適切な回答文を得られやすくするために、文字数制限の範囲内で、入力された質問文に対して有効な文章を参考情報として加えたプロンプトを生成するという技術が開示されている。
【0006】
上述したような騒音環境下においても、ユーザが発話した音声に基づいて適切に機器を動作させるという目的で、このような大規模言語モデルを用いることが考えられる。
【0007】
そこで、本発明は、ユーザが発話した音声が認識し難い騒音環境下であっても、大規模言語モデルを用いて、当該ユーザが発話した音声に基づいて所定機器に対する適切なコマンドを生成する情報処理装置及びそれを用いた機器システムを提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の一態様に係る情報処理装置は、所定機器を制御するコマンドを処理する情報処理装置であって、ユーザの音声に基づいて生成された入力データに、所定機器を制御可能な複数のコマンドで構成されるコマンドデータを合わせてプロンプトを生成するプロンプト生成手段と、プロンプトを大規模言語モデルに送信するプロンプト送信手段と、大規模言語モデルからの回答を受信する回答受信手段と、回答に基づいて、所定機器を制御するコマンドを生成するコマンド生成手段と、を備える。
【0009】
この態様によれば、プロンプト生成手段は、ユーザの音声に基づいて生成された入力データに、所定機器を制御可能な複数のコマンドで構成されるコマンドデータを合わせてプロンプトを生成する。プロンプト送信手段は、プロンプトを大規模言語モデルに送信し、回答受信手段は、大規模言語モデルから回答を受信する。そして、コマンド生成手段は、回答に基づいて、所定機器を制御するコマンドを生成する。これにより、ユーザが発話した音声が認識し難い騒音環境下であっても、大規模言語モデルを用いて、当該ユーザが発話した音声に基づいて所定機器に対する適切なコマンドを生成することができる。その結果、所定機器は、適切なコマンドに従って適切に動作することができる。
【0010】
上記態様において、コマンドデータは、所定機器に応じて予め設定されていてもよい。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
株式会社ダイヘン
移動体
1日前
株式会社ダイヘン
端末装置
16日前
株式会社ダイヘン
搬送装置
1日前
株式会社ダイヘン
充電装置
11日前
株式会社ダイヘン
溶接システム
16日前
株式会社ダイヘン
電圧調整装置
11日前
株式会社ダイヘン
プラズマ処理装置
9日前
株式会社ダイヘン
ロボット制御システム
1日前
株式会社ダイヘン
2重シールドティグ溶接方法
10日前
株式会社ダイヘン
移動体、及び誘導線検出装置
1日前
株式会社ダイヘン
移動体、及び誘導線検出装置
1日前
株式会社ダイヘン
移動体、及び誘導線検出装置
1日前
株式会社ダイヘン
搬送車及びインターロック解除方法
12日前
株式会社ダイヘン
処理装置、プログラム、及び処理方法
2日前
株式会社ダイヘン
サブマージアーク溶接の溶接終了制御方法
10日前
株式会社ダイヘン
情報処理装置及びそれを用いた機器システム
4日前
株式会社ダイヘン
安定度可視化装置及び安定度可視化プログラム
3日前
株式会社ダイヘン
全体コントローラ、プログラム、及び処理方法
2日前
株式会社ダイヘン
サブマージアーク溶接システム、および、サブマージアーク溶接方法
11日前
個人
メガホン
12日前
個人
10デジタルサラウンドラジオ
29日前
個人
音鳴らし具
2日前
三井化学株式会社
遮音構造体
17日前
合同会社Bootstrap
弦楽器
9日前
個人
補助譜面台及び補助譜面台セット
1日前
株式会社イノアックコーポレーション
防音材
3日前
三菱電機株式会社
吸音体
11日前
旭化成株式会社
内装吸音材
12日前
矢崎総業株式会社
車両用対話システム
23日前
矢崎総業株式会社
車両用対話システム
23日前
ヤマハ株式会社
情報処理方法
10日前
矢崎総業株式会社
車両用対話システム
23日前
ヤマハ株式会社
情報処理方法
10日前
矢崎総業株式会社
車両用対話システム
23日前
矢崎総業株式会社
車両用対話システム
23日前
矢崎総業株式会社
車両用対話システム
23日前
続きを見る
他の特許を見る