TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025020383
公報種別公開特許公報(A)
公開日2025-02-12
出願番号2024198001,2022112362
出願日2024-11-13,2022-07-13
発明の名称情報処理装置、情報処理方法及びプログラム
出願人カシオ計算機株式会社
代理人個人
主分類G10L 15/22 20060101AFI20250204BHJP(楽器;音響)
要約【課題】ユーザが機器に指示を出す際のウェイクワードの発声を省略することを可能にする。
【解決手段】情報処理装置100は、音声信号を取得する音声取得部と、制御部110と、を備え、制御部110は、音声信号から導出される第1認識データにウェイクワードが含まれていると判定した場合、ウェイクワードの後の音声信号から導出される第2認識データに制御処理に関する情報である制御情報が含まれていると判定したら、制御情報に応じた第1制御処理を実行し、所定の条件を満たした後の第1期間の間又は前記第1制御処理の実行中に、音声取得部で取得された音声信号から導出される第3認識データに制御情報が含まれていると判定した場合、第3認識データに含まれる制御情報に応じた第2制御処理を実行する、ことを特徴とする。
【選択図】図1
特許請求の範囲【請求項1】
音声信号を取得する音声取得部と、
制御部と、を備え、
前記制御部は、
前記音声信号から導出される第1認識データにウェイクワードが含まれていると判定した場合、
前記ウェイクワードの後の前記音声信号から導出される第2認識データに制御処理に関する情報である制御情報が含まれていると判定したら、前記制御情報に応じた第1制御処理を実行し、
所定の条件を満たした後の第1期間の間又は前記第1制御処理の実行中に、前記音声取得部で取得された音声信号から導出される第3認識データに前記制御情報が含まれていると判定した場合、 前記第3認識データに含まれる制御情報に応じた第2制御処理を実行する、
ことを特徴とする情報処理装置。
続きを表示(約 1,900 文字)【請求項2】
前記制御部は、前記音声信号から導出される前記第3認識データに前記制御情報が含まれていると判定した場合、前記第3認識データに前記ウェイクワードが含まれていなくても前記第2制御処理を実行する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記所定の条件は、前記第1制御処理の実行が完了すると満たされる、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記制御部は、
前記第1制御処理を実行したことによって出力された第1出力情報に制御処理に関する制御パラメータが含まれていると判定した場合、
前記制御パラメータを前記第2制御処理の実行時に適用する、
ことを特徴とする請求項2に記載の情報処理装置。
【請求項5】
前記制御部は、
前記第1出力情報に含まれる情報と、パラメータテーブルに含まれる情報との間の関連性があるか否かを判定し、
前記関連性があると判定した場合に、前記第1出力情報に前記制御パラメータが含まれていると判定する、
ことを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記制御部は、
前記第2制御処理に基づいて、その後のユーザの行動を推定し、
前記所定の条件は、前記第1制御処理の実行が完了するか、又は前記推定した行動を検知すると満たされ、
前記制御部はさらに、
前記第2制御処理の実行が完了した後の第2期間の間に前記推定した行動を前記ユーザが行ったことを検知したら、検知後の前記第1期間の間に前記音声取得部で取得された音声信号から導出される前記第3認識データに前記制御情報が含まれていると判定した場合、前記第3認識データに含まれる制御情報に応じた新たな第2制御処理を実行する、
ことを特徴とする請求項1に記載の情報処理装置。
【請求項7】
前記制御部は、
前記第2制御処理と行動テーブルとに基づいて前記ユーザの行動を推定し、
前記第2制御処理の実行が完了した後の第2期間の間に前記推定した行動を前記ユーザが行ったことを検知したら、検知後の前記第1期間の間に前記音声取得部で取得された音声信号から導出される前記第3認識データに含まれる制御情報と前記行動テーブルに含まれる情報との間の関連性があるか否かを判定し、
前記関連性があると判定した場合に、前記第3認識データに含まれる制御情報に応じた新たな第2制御処理を実行する、
ことを特徴とする請求項6に記載の情報処理装置。
【請求項8】
前記制御部は、
前記第1期間が開始してから終了するまでの、時間の経過量を出力する、
ことを特徴とする請求項1から7のいずれか1項に記載の情報処理装置。
【請求項9】
音声信号を取得する音声取得部と制御部とを備える情報処理装置の制御部が、
前記音声信号から導出される第1認識データにウェイクワードが含まれていると判定した場合、
前記ウェイクワードの後の前記音声信号から導出される第2認識データに制御処理に関する情報である制御情報が含まれていると判定したら、前記制御情報に応じた第1制御処理を実行し、
所定の条件を満たした後の第1期間の間又は前記第1制御処理の実行中に、前記音声取得部で取得された音声信号から導出される第3認識データに前記制御情報が含まれていると判定した場合、
前記第3認識データに含まれる制御情報に応じた第2制御処理を実行する、
ことを特徴とする情報処理方法。
【請求項10】
音声信号を取得する音声取得部と制御部とを備える情報処理装置の制御部に、
前記音声信号から導出される第1認識データにウェイクワードが含まれていると判定した場合、
前記ウェイクワードの後の前記音声信号から導出される第2認識データに制御処理に関する情報である制御情報が含まれていると判定したら、前記制御情報に応じた第1制御処理を実行し、
所定の条件を満たした後の第1期間の間又は前記第1制御処理の実行中に、前記音声取得部で取得された音声信号から導出される第3認識データに前記制御情報が含まれていると判定した場合、
前記第3認識データに含まれる制御情報に応じた第2制御処理を実行する、
処理を実行させることを特徴とするプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
続きを表示(約 1,800 文字)【背景技術】
【0002】
スマートスピーカやスマートフォンのような音声を認識する機器においては、ユーザからいわゆるウェイクワードが発せられると、その後のユーザの音声による指示に対して応答をすることができる。例えば、そのユーザの音声に返答したり、ユーザの指示に従って様々なアプリケーションプログラムを起動したりすることができる。また、特許文献1には、複数のウェイクワードを用いて複数のクラウドサービスを使い分けることが可能な技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
特開2019-86535号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に開示されている技術は、第1ウェイクワードの後の音声データを第1プラットフォームに、第2ウェイクワードの後の音声データを第2プラットフォームに、それぞれ送信させることにより、複数のクラウドサービスを使い分けることができるようにしている。しかし、特許文献1に開示されている技術を含め、従来の技術では、ユーザがこれらの機器に音声で指示をするためには、常にウェイクワードを発声する必要があった。
【0005】
本発明は上記実情に鑑みてなされたものであり、ユーザが機器に指示を出す際のウェイクワードの発声を省略することを可能にする情報処理装置、情報処理方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するため、本発明に係る情報処理装置の一態様は、
音声信号を取得する音声取得部と、
制御部と、を備え、
前記制御部は、
前記音声信号から導出される第1認識データにウェイクワードが含まれていると判定した場合、
前記ウェイクワードの後の前記音声信号から導出される第2認識データに制御処理に関する情報である制御情報が含まれていると判定したら、前記制御情報に応じた第1制御処理を実行し、
所定の条件を満たした後の第1期間の間又は前記第1制御処理の実行中に、前記音声取得部で取得された音声信号から導出される第3認識データに前記制御情報が含まれていると判定した場合、
前記第3認識データに含まれる制御情報に応じた第2制御処理を実行する、
ことを特徴とする。
【発明の効果】
【0007】
本発明によれば、ユーザが機器に指示を出す際のウェイクワードの発声を省略することを可能にする。
【図面の簡単な説明】
【0008】
実施の形態1に係る情報処理装置の機能構成の一例を示すブロック図である。
実施の形態1に係る情報処理装置に対してユーザが音声で指示したときの動作の例を示す図である。
実施の形態1に係る情報処理装置に対してユーザが音声で指示したときの動作の別の例を示す図である。
実施の形態1に係る情報処理装置における時間の経過量の表示例を示す図である。
実施の形態1に係る音声コマンド認識処理のフローチャートの一例である。
実施の形態2に係る情報処理装置に対してユーザが音声で指示したときの動作の例を示す図である。
実施の形態2に係る抽出パラメータテーブルの一例を示す図である。
実施の形態2に係る音声コマンド認識処理のフローチャートの一例である。
実施の形態3に係る情報処理装置に対してユーザが音声で指示したときの動作の例を示す図である。
実施の形態3に係る行動テーブルの一例を示す図である。
実施の形態3に係る音声コマンド認識処理のフローチャートの第1の部分の一例である。
実施の形態3に係る音声コマンド認識処理のフローチャートの第2の部分の一例である。
【発明を実施するための形態】
【0009】
実施の形態に係る情報処理装置等について、図面を参照して説明する。なお、図中同一又は相当する部分には同一符号を付す。
【0010】
(実施の形態1)
実施の形態1に係る情報処理装置は、ユーザが音声で様々な指示(様々なアプリケーションプログラムの起動等)を行うことができる電子機器であり、例えばスマートフォンである。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

ブラザー工業株式会社
カラオケ装置
25日前
ヤマハ株式会社
ヘルムホルツ共鳴器
21日前
ヤマハ株式会社
電子楽器
25日前
大和ハウス工業株式会社
音再現設備
1日前
ブラザー工業株式会社
カラオケ装置
25日前
セイコーエプソン株式会社
吸音ボード
15日前
日産自動車株式会社
防音構造体
15日前
株式会社第一興商
カラオケ装置
1日前
株式会社第一興商
カラオケ装置
21日前
京セラ株式会社
音出力装置及び音出力方法
15日前
コスモネクスト株式会社
入力支援プログラム及び入力支援方法
8日前
トヨタ自動車株式会社
制御装置及び制御方法
25日前
日本放送協会
音声認識装置およびプログラム
15日前
本田技研工業株式会社
能動型騒音低減装置
15日前
本田技研工業株式会社
能動型騒音低減装置
21日前
株式会社アナザーウェア
鍵盤画面表示プログラム及びそのシステム
21日前
トヨタ自動車株式会社
異音診断システム
21日前
株式会社コルグ
音波生成装置、音波生成方法、プログラム
8日前
株式会社SOKEN
遮音部
25日前
ソフトバンクグループ株式会社
行動制御システム
8日前
株式会社イノアックコーポレーション
ダクト
25日前
永楽電気株式会社
放送音声文字化システム及び放送設備における故障診断方法
15日前
本田技研工業株式会社
音声認識装置、音声認識方法、およびプログラム
今日
アルプスアルパイン株式会社
オーディオ信号処理装置及び遠隔制御システム
25日前
ヤマハ株式会社
響板、その製造方法および響板を備える楽器
今日
東日本電信電話株式会社
演奏補助装置、演奏補助方法、及び、演奏補助プログラム
今日
パイオニア株式会社
情報処理装置
2日前
ドーナッツロボティクス株式会社
音声処理システム、音声処理方法
8日前
三菱重工業株式会社
サイレンサ
21日前
国立研究開発法人情報通信研究機構
音声認識システム、音声認識方法およびプログラム
25日前
ソフトバンクグループ株式会社
データ処理装置、データ処理方法、及びプログラム
15日前
株式会社アナザーウェア
鍵盤画面表示プログラム及びそのシステム
21日前
カシオ計算機株式会社
情報処理装置、情報処理方法及びプログラム
2日前
カシオ計算機株式会社
楽音制御システム
今日
ローランド株式会社
電子打楽器、制御装置、ベロシティ算出プログラム及びベロシティ算出方法
今日
日産自動車株式会社
シート状防音構造体、並びにこれを用いた自動車用部品およびダクト閉塞用蓋部品
9日前
続きを見る