TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024082673
公報種別公開特許公報(A)
公開日2024-06-20
出願番号2022196684
出願日2022-12-08
発明の名称情報処理装置、情報処理システム、情報処理方法及びプログラム
出願人株式会社アドバンスト・メディア
代理人個人
主分類G10L 15/32 20130101AFI20240613BHJP(楽器;音響)
要約【課題】情報処理装置に対する情報の入力をより高速に行う。
【解決手段】情報処理装置1は、第1音声認識部54-1と、第2音声認識部54-2と、実行制御部55と、を備える。第1音声認識部54-1は、情報を入力するための画面における入力対象位置に情報を入力するための第1の発話を第1の音声認識エンジンによって音声認識する。実行制御部55は、第1音声認識部54-1によって音声認識された第1の発話が表す情報の入力内容に基づいて、当該情報の入力内容に関するプロセスを設定する。第2音声認識部54-2は、実行制御部55によって設定されたプロセス毎に、当該プロセスで入力される情報に対応する第2の音声認識エンジンによって第2の発話を音声認識する。
【選択図】図3
特許請求の範囲【請求項1】
情報を入力するための画面における入力対象位置に情報を入力するための第1の発話を第1の音声認識エンジンによって音声認識する第1音声認識手段と、
前記第1音声認識手段によって音声認識された前記第1の発話が表す情報の入力内容に基づいて、当該情報の入力内容に関するプロセスを設定するプロセス設定手段と、
前記プロセス設定手段によって設定されたプロセス毎に、当該プロセスで入力される情報に対応する第2の音声認識エンジンによって第2の発話を音声認識する第2音声認識手段と、
を備えることを特徴とする情報処理装置。
続きを表示(約 1,600 文字)【請求項2】
前記第1音声認識手段による音声認識結果及び前記第2音声認識手段による音声認識結果に基づいて、前記入力対象位置に対する情報の入力を実行する実行制御手段を備えることを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記プロセスには、前記入力対象位置にカーソルを移動させるアクション、当該プロセスで入力される情報に対応する前記第2の音声認識エンジンに切り替えるアクション、及び、当該プロセスで入力される情報の発話を待機するアクションが含まれることを特徴とする請求項1または2に記載の情報処理装置。
【請求項4】
前記第1の発話が表す情報の入力内容に関する前記プロセスが完了した場合に、前記第1音声認識手段が前記第1の音声認識エンジンによって音声認識を行う待機状態に移行することを特徴とする請求項1または2に記載の情報処理装置。
【請求項5】
前記プロセスには、複数の入力対象位置に情報を入力するアクションが含まれ、
前記第2音声認識手段は、前記複数の入力対象位置に情報を入力するアクションそれぞれにおいて、当該入力対象位置に対応する前記第2音声認識エンジンに切り替えて音声認識を行うことを特徴とする請求項1または2に記載の情報処理装置。
【請求項6】
ユーザによって使用される端末装置と、音声認識処理を実行するサーバとを含む情報処理システムであって、
前記端末装置は、
情報を入力するための画面を表示する表示手段と、
音声による発話の入力を受け付け、受け付けた発話のデータを前記サーバに送信する音声入力手段と、
を備え、
前記サーバは、
前記端末装置の前記画面における入力対象位置に情報を入力するための第1の発話を第1の音声認識エンジンによって音声認識する第1音声認識手段と、
前記第1音声認識手段によって音声認識された前記第1の発話が表す情報の入力内容に基づいて、当該情報の入力内容に関するプロセスを設定するプロセス設定手段と、
前記プロセス設定手段によって設定されたプロセス毎に、当該プロセスで入力される情報に対応する第2の音声認識エンジンによって第2の発話を音声認識する第2音声認識手段と、
を備えることを特徴とする情報処理システム。
【請求項7】
情報処理装置が実行する情報処理方法であって、
情報を入力するための画面における入力対象位置に情報を入力するための第1の発話を第1の音声認識エンジンによって音声認識する第1音声認識ステップと、
前記第1音声認識ステップにおいて音声認識された前記第1の発話が表す情報の入力内容に基づいて、当該情報の入力内容に関するプロセスを設定するプロセス設定ステップと、
前記プロセス設定ステップにおいて設定されたプロセス毎に、当該プロセスで入力される情報に対応する第2の音声認識エンジンによって第2の発話を音声認識する第2音声認識ステップと、
を含むことを特徴とする情報処理方法。
【請求項8】
コンピュータに、
情報を入力するための画面における入力対象位置に情報を入力するための第1の発話を第1の音声認識エンジンによって音声認識する第1音声認識機能と、
前記第1音声認識機能によって音声認識された前記第1の発話が表す情報の入力内容に基づいて、当該情報の入力内容に関するプロセスを設定するプロセス設定機能と、
前記プロセス設定機能によって設定されたプロセス毎に、当該プロセスで入力される情報に対応する第2の音声認識エンジンによって第2の発話を音声認識する第2音声認識機能と、
を実現させることを特徴とするプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、情報処理装置、情報処理システム、情報処理方法及びプログラムに関する。
続きを表示(約 2,300 文字)【背景技術】
【0002】
従来、PC(Personal Computer)等の情報処理装置に対する情報の入力は、主としてキーボードやマウス操作による入力を前提としていた。
情報処理装置に入力を行うための入力装置においては、種々の観点から改良が行われている。
例えば、特許文献1には、クリック感として感得される疑似的な触感を発生させることを目的とする技術が記載されている。
【先行技術文献】
【特許文献】
【0003】
特開2022-087321号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術においては、コンピュータプログラムに対して、主に人の手によってキーボードやマウス操作を行っているため、入力に要する時間の短縮には限界があると考えられる。
例えば、画面において入力対象となる位置をマウスでクリックした後、キーボードで文字を入力するといった動作を繰り返す場合、実際に情報を入力する動作に加えて、マウスを移動させる動作や、マウスとキーボードとの間で手を移動させる動作等が必要となり、これらの動作は情報の入力において無駄な時間となる可能性が高い。
【0005】
本発明の課題は、情報処理装置に対する情報の入力をより高速に行うことである。
【課題を解決するための手段】
【0006】
上記目的を達成するため、本発明の一態様の情報処理装置は、
情報を入力するための画面における入力対象位置に情報を入力するための第1の発話を第1の音声認識エンジンによって音声認識する第1音声認識手段と、
前記第1音声認識手段によって音声認識された前記第1の発話が表す情報の入力内容に基づいて、当該情報の入力内容に関するプロセスを設定するプロセス設定手段と、
前記プロセス設定手段によって設定されたプロセス毎に、当該プロセスで入力される情報に対応する第2の音声認識エンジンによって第2の発話を音声認識する第2音声認識手段と、
を備えることを特徴とする。
【発明の効果】
【0007】
本発明によれば、情報処理装置に対する情報の入力をより高速に行うことができる。
【図面の簡単な説明】
【0008】
本実施形態に係る情報処理装置の情報入力方法を示す模式図である。
情報処理装置1のハードウェア構成を示す模式図である。
情報処理装置1の機能的構成を示すブロック図である。
情報処理装置1が実行する情報入力処理の流れを示すフローチャートである。
情報入力処理によって情報の入力が行われるアプリケーションの入力画面例を示す模式図である。
対象項目として「報告日」が発話された場合の処理手順を示す模式図である。
対象項目として「利用者情報」が発話された場合の処理手順を示す模式図である。
本発明を適用した情報処理システムSのシステム構成を示す模式図である。
【発明を実施するための形態】
【0009】
以下、本発明の実施形態について、図面を用いて説明する。
[第1実施形態]
図1は、本実施形態に係る情報処理装置の情報入力方法を示す模式図である。
図1に示すように、本実施形態に係る情報処理装置は、情報入力のために発声された発話1を第1の音声認識エンジン(以下、「第1エンジン」と称する。)で音声認識し、この音声認識結果に対応する処理(以下、「結果処理1」と称する。)を実行する。結果処理1では、音声認識された処理内容に応じた一連のプロセスが設定される。次に、結果処理1の設定に応じて、次の情報入力に対応する第2の音声認識エンジン(以下、「第2エンジン」と称する。)を起動し、発話2の待機状態となる。そして、発話2が発声されると、発話2を第2エンジンで音声認識し、この音声認識結果に対応する処理(以下、「結果処理2」と称する。)を実行する。同様に、結果処理1の設定に応じて、次の情報入力に対応する第3の音声認識エンジンを起動し、発話3の待機状態となる。この後、発話3の発生に対応して、同様の処理が繰り返され、第Nエンジン(Nは自然数)によって結果処理Nが得られると、結果処理1で設定された一連のプロセスが完了する(以下、第2の音声認識エンジン、第3の音声認識エンジン、そして、第Nエンジンまでを総称して、「第2エンジン」と称する。)このような処理を情報入力の対象項目毎に実行することで、音声によって全ての対象項目に対する情報入力を行うことができる。
したがって、適時に適所で適切な音声認識エンジンを使用して情報の入力を行うことができるため、情報処理装置に対する情報の入力をより高速に行うことが可能となる。
以下、本実施形態に係る情報処理装置を具体的に説明する。
【0010】
[ハードウェア構成]
図2は、情報処理装置1のハードウェア構成を示す模式図である。
図2に示すように、情報処理装置1は、CPU(Central Processing Unit)11と、ROM(Read Only Memory)12と、RAM(Random Access Memory)13と、バス14と、入力部15と、出力部16と、記憶部17と、通信部18と、ドライブ19と、撮像部20と、を備えている。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
三味線の部品
23日前
株式会社エフノート
電子打楽器
21日前
株式会社大貴
吸音材の施工方法
22日前
株式会社エフノート
電子ドラム
21日前
株式会社小泉製作所
ベル装置
25日前
エイドス セラピューティクス,インコーポレイティド
AG10の製剤
7日前
エイドス セラピューティクス,インコーポレイティド
AG10を使用するTTRアミロイドーシスの治療方法
25日前
ヤマハ株式会社
楽器用ナット
25日前
株式会社総合車両製作所
吸音パネル
21日前
オンキヨー株式会社
音声認識システム、及び、音声認識方法
3日前
オンキヨー株式会社
音声認識システム、及び、音声認識方法
3日前
株式会社レゾナック
吸音材及び車両部材
4日前
ヤマハ株式会社
プログラム
18日前
株式会社第一興商
カラオケ端末
28日前
トヨタ自動車株式会社
情報処理装置
8日前
カシオ計算機株式会社
鍵盤楽器
1か月前
住友理工株式会社
防音放熱カバー
1か月前
株式会社イノアックコーポレーション
防音材及び車両構造
18日前
日本放送協会
音場評価装置、音場評価システム、及びプログラム
4日前
株式会社レゾナック
吸音構造体及び吸音構造体の製造方法
8日前
株式会社第一興商
カラオケ装置、カラオケシステム
18日前
沖電気工業株式会社
音声処理装置、音声処理プログラム及び音声処理方法
22日前
ローランド株式会社
鍵盤装置および駆動装置の冷却方法
28日前
株式会社スクウェア・エニックス
音声生成プログラム及び音声生成システム
1か月前
株式会社HOWA
吸遮音断熱部材、建築用壁部材及び自動車用ルーフサイレンサー
1日前
ブラザー工業株式会社
カラオケ装置、カラオケ再生方法及びカラオケ用プログラム
1か月前
株式会社竹中工務店
情報処理装置及び情報処理プログラム
15日前
日産自動車株式会社
車両の情報提示方法及び情報提示装置
1か月前
学校法人立命館
叫び声検知システム、音声分類方法、及び、音声分類モデルの生成方法
22日前
キヤノン株式会社
情報処理装置、情報処理方法、及びプログラム
1か月前
三菱重工業株式会社
音声認識装置、音声認識方法及びプログラム
9日前
トヨタ自動車株式会社
情報処理装置、情報処理方法、及び、プログラム
8日前
日本放送協会
音声認識モデルに用いる学習データを作成する学習データ作成装置及びプログラム
25日前
株式会社アドバンスト・メディア
情報処理装置、情報処理システム、情報処理方法及びプログラム
8日前
日本電信電話株式会社
対話システム、発話生成方法、およびプログラム
1か月前
LINEヤフー株式会社
信号処理装置、信号処理方法、および信号処理プログラム
4日前
続きを見る