TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025079377
公報種別
公開特許公報(A)
公開日
2025-05-22
出願番号
2023191954
出願日
2023-11-10
発明の名称
音声処理装置、音声処理方法、プログラム及び記憶媒体
出願人
パイオニア株式会社
代理人
個人
主分類
G10L
15/20 20060101AFI20250515BHJP(楽器;音響)
要約
【課題】音声認識の認識精度を向上させることが可能な音声処理装置等を提供する。
【解決手段】音声処理装置は、推定部と、設定部と、を有する。推定部は、マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する。設定部は、エコー成分の推定に係るステップサイズを、マイク音声及びエコー成分の相関性に応じて異なるサイズに設定する。
【選択図】図3
特許請求の範囲
【請求項1】
マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部と、
前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定部と、
を有する音声処理装置。
続きを表示(約 1,000 文字)
【請求項2】
前記設定部は、前記マイク音声及び前記エコー成分の相関性が高い場合に、前記ステップサイズを相対的に大きい第1のサイズに設定し、前記マイク音声及び前記エコー成分の相関性が低い場合に、前記ステップサイズを相対的に小さい第2のサイズに設定する請求項1に記載の音声処理装置。
【請求項3】
前記マイク音声及び前記エコー成分の相関性を示す相関係数を算出する算出部をさらに有し、
前記設定部は、前記相関係数が所定の閾値よりも大きい場合に、前記ステップサイズを前記第1のサイズに設定し、前記相関係数が前記所定の閾値以下である場合に、前記ステップサイズを前記第2のサイズに設定する請求項2に記載の音声処理装置。
【請求項4】
前記マイク音声から前記エコー成分を差し引くことにより、前記マイク音声に含まれる前記システム音声を抑制する抑制部と、
前記抑制された前記システム音声を含む前記マイク音声を減衰させる減衰部と、をさらに有する請求項1に記載の音声処理装置。
【請求項5】
前記設定部は、前記ステップサイズとして、前記エコー成分の推定に用いられるフィルタにおけるフィルタ係数の可変幅を設定する請求項1に記載の音声処理装置。
【請求項6】
前記設定部は、前記エコー成分の推定に係るステップサイズを、複数のステップサイズのうちの一のステップサイズに設定する請求項1に記載の音声処理装置。
【請求項7】
コンピュータが実行する音声処理方法であって、
マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定工程と、
前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定工程と、
を有する音声処理方法。
【請求項8】
コンピュータにより実行されるプログラムであって、
マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部、及び、
前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定部として前記コンピュータを機能させるプログラム。
【請求項9】
請求項8に記載のプログラムを記憶した記憶媒体。
発明の詳細な説明
【技術分野】
【0001】
本開示は、音声を処理する技術に関する。
続きを表示(約 1,100 文字)
【背景技術】
【0002】
音声に含まれるエコー成分を除去するエコーキャンセルに係る技術が従来知られている。
【0003】
具体的には、例えば、特許文献1には、マイクに入力されたユーザの発話音声と、当該マイクに入力されたエコーと、を含む音声から当該エコーに相当する成分を除去する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
特開2009-109536号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
例えば、スマートスピーカ等のような、音声認識を利用した対話型の装置に入力された音声に対してエコーキャンセルを適用した場合には、音声の劣化により音声認識の認識精度が低下してしまう、という問題点が生じる。
【0006】
これに対し、特許文献1には、前述の問題点を解消するための方法について特に開示等されていない。そのため、特許文献1に開示された技術によれば、前述の問題点に応じた課題が生じている。
【0007】
本開示は、上記の課題を鑑み、音声認識の認識精度を向上させることが可能な音声処理装置を提供することを主な目的とする。
【課題を解決するための手段】
【0008】
請求項に記載の発明は、音声処理装置であって、マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部と、前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定部と、を有する。
【0009】
請求項に記載の発明は、コンピュータが実行する音声処理方法であって、マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定工程と、前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定工程と、を有する。
【0010】
請求項に記載の発明は、コンピュータにより実行されるプログラムであって、マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部、及び、前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定部として前記コンピュータを機能させる。
【図面の簡単な説明】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
パイオニア株式会社
評価装置
28日前
パイオニア株式会社
表示装置
16日前
パイオニア株式会社
ドライブレコーダ
21日前
パイオニア株式会社
監視装置、監視方法および監視プログラム
28日前
パイオニア株式会社
監視装置、監視方法および監視プログラム
1か月前
パイオニア株式会社
監視装置、監視方法および監視プログラム
28日前
パイオニア株式会社
判定装置、判定方法および判定プログラム
14日前
パイオニア株式会社
監視装置、監視方法、および監視プログラム
24日前
パイオニア株式会社
監視装置、監視方法、および監視プログラム
24日前
パイオニア株式会社
情報処理装置、情報処理方法及び情報処理用プログラム
29日前
パイオニア株式会社
情報処理装置、情報処理方法及び情報処理用プログラム
29日前
パイオニア株式会社
情報処理装置、情報処理方法及び情報処理用プログラム
29日前
パイオニア株式会社
保持装置
9日前
パイオニア株式会社
光反射体
1か月前
パイオニア株式会社
情報処理装置、情報処理方法、および、情報処理プログラム
28日前
パイオニア株式会社
生体センサ
14日前
パイオニア株式会社
映像制御装置
14日前
パイオニア株式会社
情報処理装置
9日前
パイオニア株式会社
情報処理装置
21日前
パイオニア株式会社
段差検出装置
1か月前
パイオニア株式会社
地図データ生成装置
7日前
パイオニア株式会社
地図データ生成方法
9日前
パイオニア株式会社
ドライブレコーダ、ドライブレコーダの制御方法、及び制御プログラム
21日前
パイオニア株式会社
ドライブレコーダ、ドライブレコーダの制御方法、及び制御プログラム
21日前
パイオニア株式会社
情報処理装置及び情報生成装置、情報処理方法並びに情報処理用プログラム
29日前
パイオニア株式会社
表示制御装置、表示制御方法及びプログラム
28日前
パイオニア株式会社
情報処理装置、方法、プログラム及び記憶媒体
1か月前
パイオニア株式会社
推定装置、制御方法、プログラム及び記憶媒体
1か月前
パイオニア株式会社
撮影装置、制御方法、プログラム及び記憶媒体
1か月前
パイオニア株式会社
情報処理装置、制御方法、プログラム及び記憶媒体
14日前
パイオニア株式会社
画像制御プログラム、画像制御装置及び画像制御方法
14日前
パイオニア株式会社
情報処理装置、情報処理方法及び情報処理用プログラム
1日前
パイオニア株式会社
情報処理装置、情報出力方法、プログラム及び記憶媒体
1か月前
パイオニア株式会社
情報処理装置、情報処理方法、プログラム及び記憶媒体
1か月前
パイオニア株式会社
映像送信装置、映像送信方法、プログラム及び記録媒体
28日前
パイオニア株式会社
携帯端末装置、情報処理方法、プログラム及び記録媒体
1日前
続きを見る
他の特許を見る