TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025127546
公報種別公開特許公報(A)
公開日2025-09-02
出願番号2024024305
出願日2024-02-21
発明の名称音声処理装置、音声処理方法およびプログラム
出願人パナソニックオートモーティブシステムズ株式会社
代理人弁理士法人酒井国際特許事務所
主分類G10L 17/00 20130101AFI20250826BHJP(楽器;音響)
要約【課題】登録されている複数のユーザの音声情報が類似する場合における音声認識の誤認識を軽減すること。
【解決手段】一実施形態の音声処理装置は、複数のユーザのそれぞれの音声情報が登録される登録情報から、ユーザ同士で音声情報の特徴が類似するユーザグループごとのグループ情報を算出するグループ情報算出部と、ユーザの発話履歴に基づいてユーザごとに発話履歴係数を算出する発話履歴係数算出部と、発話履歴係数に基づいてユーザの中から所定の数のユーザを音声情報の認識対象に選択する選択部と、選択部により選択された認識対象の認識対象者情報を出力する出力部と、を有し、出力部は、選択部により選択された認識対象の中にユーザグループが同一の複数のユーザが含まれる場合において、認識対象者情報およびユーザグループが同一の複数のユーザが含まれることを示す情報を出力することを特徴とする。
【選択図】図3
特許請求の範囲【請求項1】
複数のユーザのそれぞれの音声情報が登録される登録情報から、ユーザ同士で前記音声情報の特徴が類似するユーザグループのグループ情報を算出するグループ情報算出部と、
前記ユーザの発話履歴に基づいて前記ユーザごとに発話履歴係数を算出する発話履歴係数算出部と、
前記発話履歴係数に基づいて前記ユーザの中から所定の数のユーザを前記音声情報の認識対象に選択する選択部と、
前記選択部により選択された前記認識対象の認識対象者情報を出力する出力部と、
を有し、
前記出力部は、
前記選択部により選択された前記認識対象の中に前記ユーザグループが同一の複数のユーザが含まれる場合において、前記認識対象者情報およびユーザグループが同一の複数のユーザが含まれることを示す情報を出力する、
音声処理装置。
続きを表示(約 1,600 文字)【請求項2】
前記発話履歴係数算出部は、登録されている前記ユーザの前記音声情報のうち、過去に発話として認識された回数が多い前記音声情報に対応するユーザほど、前記発話履歴係数の値が高くなるように算出する、
請求項1に記載の音声処理装置。
【請求項3】
前記発話履歴係数算出部は、登録されている前記ユーザの前記音声情報のうち、過去に発話として認識された回数が所定の期間内において多い前記音声情報ほど、前記発話履歴係数の値が高くなるように算出する、
請求項1に記載の音声処理装置。
【請求項4】
前記発話履歴係数算出部は、登録されている前記ユーザの前記音声情報のうち、過去に発話が認識された回数が多い曜日または時間帯と現在の曜日または時間帯とが近い前記音声情報に対応するユーザほど、前記発話履歴係数の値が高くなるように算出する、
請求項1に記載の音声処理装置。
【請求項5】
前記選択部は、選択する前記認識対象の中に前記ユーザグループが同一の複数のユーザが含まれる場合、前記ユーザグループが同一の複数のユーザのそれぞれの発話履歴係数に基づいて前記ユーザグループが同一の複数のユーザのうち前記発話履歴係数が所定の条件を満たすユーザを前記認識対象から削除する、
請求項1乃至請求項4のうちの何れか一項に記載の音声処理装置。
【請求項6】
前記出力部により出力された前記認識対象者情報に対して認識対象者の追加または削除の選択をユーザから受け付けるユーザ選択部をさらに有する、
請求項1乃至請求項4のうちの何れか一項に記載の音声処理装置。
【請求項7】
話者の音声を入力する音声入力部と、
前記音声入力部から入力される音声の話者を、前記認識対象の認識対象者に対応するそれぞれの前記音声情報に基づいて認識する話者認識部と、
をさらに有する請求項1乃至4のうちの何れか一項に記載の音声処理装置。
【請求項8】
前記音声入力部から入力される音声信号に基づいて前記音声情報を算出して前記登録情報に登録する音声情報算出部をさらに有する請求項7に記載の音声処理装置。
【請求項9】
複数のユーザのそれぞれの音声情報が登録される登録情報から、ユーザ同士で前記音声情報の特徴が類似するユーザグループごとのグループ情報を算出するステップと、
前記ユーザの発話履歴に基づいて前記ユーザごとに発話履歴係数を算出するステップと、
前記発話履歴係数に基づいて前記ユーザの中から所定の数のユーザを前記音声情報の認識対象に選択するステップと、
選択された前記認識対象の認識対象者情報を出力するステップと
選択された前記認識対象の中に前記ユーザグループが同一の複数のユーザが含まれる場合において、前記認識対象者情報およびユーザグループが同一の複数のユーザが含まれることを示す情報を出力するステップと、
を含む音声処理方法。
【請求項10】
コンピュータに、
複数のユーザのそれぞれの音声情報が登録される登録情報から、ユーザ同士で前記音声情報の特徴が類似するユーザグループごとのグループ情報を算出するグループ情報算出部と、
前記ユーザの発話履歴に基づいて前記ユーザごとに発話履歴係数を算出する発話履歴係数算出部と、
前記発話履歴係数に基づいて前記ユーザの中から所定の数のユーザを前記音声情報の認識対象に選択する選択部と、
前記選択部により選択された前記認識対象の認識対象者情報を出力する出力部と、
として機能させ、
前記選択部により選択された前記認識対象の中に前記ユーザグループが同一の複数のユーザが含まれる場合において、前記認識対象者情報およびユーザグループが同一の複数のユーザが含まれることを示す情報を前記出力部に出力させる、
プログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、音声処理装置、音声処理方法およびプログラムに関する。
続きを表示(約 1,600 文字)【背景技術】
【0002】
従来、発話されたコマンドを認識して処理を実行する処理装置がある。車載機器などの場合には、車両にユーザ以外の同乗者がいると、同乗者が意図せず発話したワードがコマンドとして認識されるため、ユーザの音声の特徴を登録しておくことで音声情報の話者認識も合わせて行う。
【0003】
特許文献1には、マイクが利用者の発話以外に他人の発話や周囲のノイズなどを全て収集することによる音声認識の誤認識を抑制することを目的とした技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
特開2009-86132号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
本開示は、登録されている複数のユーザの音声情報が類似する場合における音声認識の誤認識を軽減することが可能な音声処理装置、音声処理方法およびプログラムを提供することである。
【課題を解決するための手段】
【0006】
本開示に係る音声処理装置は、複数のユーザのそれぞれの音声情報が登録される登録情報から、ユーザ同士で前記音声情報の特徴が類似するユーザグループごとのグループ情報を算出するグループ情報算出部と、前記ユーザの発話履歴に基づいて前記ユーザごとに発話履歴係数を算出する発話履歴係数算出部と、前記発話履歴係数に基づいて前記ユーザの中から所定の数のユーザを前記音声情報の認識対象に選択する選択部と、前記選択部により選択された前記認識対象の認識対象者情報を出力する出力部と、を有し、前記出力部は、前記選択部により選択された前記認識対象の中に前記ユーザグループが同一の複数のユーザが含まれる場合において、前記認識対象者情報およびユーザグループが同一の複数のユーザが含まれることを示す情報を出力することを特徴とする。
【発明の効果】
【0007】
本開示によれば、登録されている複数のユーザの音声情報が類似する場合における音声認識の誤認識を軽減することができる。
【図面の簡単な説明】
【0008】
図1は、実施の形態にかかる音声処理装置の適用対象の一例について説明する図である。
図2は、実施の形態にかかる音声処理装置のハードウェアブロックの構成の一例を示す図である。
図3は、実施の形態にかかる音声処理装置の機能ブロックの構成の一例を示す図である。
図4は、認識対象者選択部が生成した登録情報テーブルの一例を示す図である。
図5は、認識対象者を選択する手順の説明図である。
図6は、認識対象者の出力例を示す図である。
図7は、認識対象者の選択を手動で修正する操作例を示す図である。
図8は、選択された認識対象者の中にグループ番号が同じメンバが複数いるケース2の説明図である。
図9は、ケース2におけるUI画面の出力例と、修正用のUI画面の操作例とを示す図である。
図10は、認識対象者の選択フローの一例を示す図である。
【発明を実施するための形態】
【0009】
以下に添付図面を参照しながら、本開示に係る音声処理装置、音声処理方法およびプログラムの実施の形態について詳細に説明する。
【0010】
(実施の形態)
図1は、実施の形態にかかる音声処理装置の適用対象の一例について説明する図である。まず、音声認識の処理の概念について説明する。図1には、音声認識を行う処理の概念図を示している。音声認識の処理は、コマンド認識を行うコマンド認識1-1と話者認識を行う話者認識1-2とがある。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

個人
破裂爆発波動体感バルーン
10日前
株式会社白鳩
音漏れ抑制マスク
4日前
株式会社白鳩
音漏れ抑制マスク
4日前
株式会社イシダ
商品処理装置
24日前
日本音響エンジニアリング株式会社
騒音低減装置
9日前
川崎重工業株式会社
表面材
6日前
株式会社フジタ
環境音快音化システム
9日前
個人
歌唱技術表示装置および歌唱技術表示方法
12日前
NOK株式会社
吸音構造体
23日前
株式会社第一興商
カラオケ装置
6日前
個人
楽曲検索装置、楽曲検索方法、及び楽曲検索プログラム
13日前
マツダ株式会社
内燃機関の吸気音増幅装置
19日前
ローランド株式会社
打楽器および打面の形成方法
5日前
宮澤フル-ト製造株式会社
タンポ及び木管楽器
17日前
カシオ計算機株式会社
演奏装置、方法およびプログラム
13日前
ローランド株式会社
打楽器および取付部材の取付方法
5日前
株式会社SOKEN
吸音構造体
13日前
本田技研工業株式会社
能動型効果音発生装置及び能動型効果音生成方法
20日前
株式会社東芝
異常要因推定システム、方法及びプログラム
17日前
公立大学法人広島市立大学
音質改善装置、音質改善方法及びプログラム
16日前
セイコーエプソン株式会社
音声出力方法、プロジェクター及びプログラム
12日前
トヨタ自動車株式会社
車両制御方法及び車両制御装置
6日前
トヨタ自動車株式会社
車両管理システム及び電気自動車
18日前
デジタルヒューマン株式会社
情報処理システム、情報処理方法及びプログラム
4日前
ヤマハ株式会社
情報処理装置、及びその制御方法
3日前
ThinkX株式会社
発話終端検出を不要とする音声対話システム、Webサイト埋め込み型音声対話Q&Aシステム
6日前
株式会社日立システムズ
対話制御装置、対話制御システム、対話制御方法及び対話制御プログラム
4日前
株式会社日立システムズ
対話制御装置、対話制御システム、対話制御方法及び対話制御プログラム
4日前
株式会社日立システムズ
対話制御装置、対話制御システム、対話制御方法及び対話制御プログラム
4日前
株式会社日立システムズ
対話制御装置、対話制御システム、対話制御方法及び対話制御プログラム
4日前
ヤマハ株式会社
楽器用検出システムおよび楽器
3日前
NTT株式会社
音声抽出装置及び音声抽出方法
10日前
パナソニックオートモーティブシステムズ株式会社
音声処理装置、音声処理方法およびプログラム
5日前
エーアイエムアイ インコーポレイテッド
音楽コンテンツの生成
23日前
NTTテクノクロス株式会社
音声認識システム、音声認識方法及びプログラム
18日前
ヤマハ株式会社
楽器用ペダルユニットおよび電子鍵盤装置
16日前
続きを見る