TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025079377
公報種別
公開特許公報(A)
公開日
2025-05-22
出願番号
2023191954
出願日
2023-11-10
発明の名称
音声処理装置、音声処理方法、プログラム及び記憶媒体
出願人
パイオニア株式会社
代理人
個人
主分類
G10L
15/20 20060101AFI20250515BHJP(楽器;音響)
要約
【課題】音声認識の認識精度を向上させることが可能な音声処理装置等を提供する。
【解決手段】音声処理装置は、推定部と、設定部と、を有する。推定部は、マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する。設定部は、エコー成分の推定に係るステップサイズを、マイク音声及びエコー成分の相関性に応じて異なるサイズに設定する。
【選択図】図3
特許請求の範囲
【請求項1】
マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部と、
前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定部と、
を有する音声処理装置。
続きを表示(約 1,000 文字)
【請求項2】
前記設定部は、前記マイク音声及び前記エコー成分の相関性が高い場合に、前記ステップサイズを相対的に大きい第1のサイズに設定し、前記マイク音声及び前記エコー成分の相関性が低い場合に、前記ステップサイズを相対的に小さい第2のサイズに設定する請求項1に記載の音声処理装置。
【請求項3】
前記マイク音声及び前記エコー成分の相関性を示す相関係数を算出する算出部をさらに有し、
前記設定部は、前記相関係数が所定の閾値よりも大きい場合に、前記ステップサイズを前記第1のサイズに設定し、前記相関係数が前記所定の閾値以下である場合に、前記ステップサイズを前記第2のサイズに設定する請求項2に記載の音声処理装置。
【請求項4】
前記マイク音声から前記エコー成分を差し引くことにより、前記マイク音声に含まれる前記システム音声を抑制する抑制部と、
前記抑制された前記システム音声を含む前記マイク音声を減衰させる減衰部と、をさらに有する請求項1に記載の音声処理装置。
【請求項5】
前記設定部は、前記ステップサイズとして、前記エコー成分の推定に用いられるフィルタにおけるフィルタ係数の可変幅を設定する請求項1に記載の音声処理装置。
【請求項6】
前記設定部は、前記エコー成分の推定に係るステップサイズを、複数のステップサイズのうちの一のステップサイズに設定する請求項1に記載の音声処理装置。
【請求項7】
コンピュータが実行する音声処理方法であって、
マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定工程と、
前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定工程と、
を有する音声処理方法。
【請求項8】
コンピュータにより実行されるプログラムであって、
マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部、及び、
前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定部として前記コンピュータを機能させるプログラム。
【請求項9】
請求項8に記載のプログラムを記憶した記憶媒体。
発明の詳細な説明
【技術分野】
【0001】
本開示は、音声を処理する技術に関する。
続きを表示(約 1,100 文字)
【背景技術】
【0002】
音声に含まれるエコー成分を除去するエコーキャンセルに係る技術が従来知られている。
【0003】
具体的には、例えば、特許文献1には、マイクに入力されたユーザの発話音声と、当該マイクに入力されたエコーと、を含む音声から当該エコーに相当する成分を除去する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
特開2009-109536号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
例えば、スマートスピーカ等のような、音声認識を利用した対話型の装置に入力された音声に対してエコーキャンセルを適用した場合には、音声の劣化により音声認識の認識精度が低下してしまう、という問題点が生じる。
【0006】
これに対し、特許文献1には、前述の問題点を解消するための方法について特に開示等されていない。そのため、特許文献1に開示された技術によれば、前述の問題点に応じた課題が生じている。
【0007】
本開示は、上記の課題を鑑み、音声認識の認識精度を向上させることが可能な音声処理装置を提供することを主な目的とする。
【課題を解決するための手段】
【0008】
請求項に記載の発明は、音声処理装置であって、マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部と、前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定部と、を有する。
【0009】
請求項に記載の発明は、コンピュータが実行する音声処理方法であって、マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定工程と、前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定工程と、を有する。
【0010】
請求項に記載の発明は、コンピュータにより実行されるプログラムであって、マイクに入力されたマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部、及び、前記エコー成分の推定に係るステップサイズを、前記マイク音声及び前記エコー成分の相関性に応じて異なるサイズに設定する設定部として前記コンピュータを機能させる。
【図面の簡単な説明】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
メガホン
6日前
個人
リアルタイム翻訳システム
1か月前
個人
10デジタルサラウンドラジオ
23日前
合同会社Bootstrap
弦楽器
3日前
三井化学株式会社
遮音構造体
1か月前
三井化学株式会社
遮音構造体
11日前
三菱電機株式会社
吸音体
5日前
旭化成株式会社
内装吸音材
6日前
矢崎総業株式会社
車両用対話システム
17日前
矢崎総業株式会社
車両用対話システム
17日前
矢崎総業株式会社
車両用対話システム
17日前
矢崎総業株式会社
車両用対話システム
17日前
矢崎総業株式会社
車両用対話システム
17日前
ヤマハ株式会社
情報処理方法
4日前
ヤマハ株式会社
情報処理方法
4日前
トヨタ自動車株式会社
音声制御装置
1か月前
矢崎総業株式会社
車両用対話システム
17日前
株式会社第一興商
カラオケ装置
13日前
トヨタ自動車株式会社
車両
5日前
ヤマハ株式会社
鍵盤楽器
1か月前
ヤマハ株式会社
鍵盤装置
12日前
株式会社しくみ
音声翻訳プログラム
1か月前
日本放送協会
音声認識装置およびプログラム
17日前
株式会社Gottsu
サキソフォーン向けねじ込み式スクリュー
25日前
学校法人 工学院大学
音響拡散パネル
12日前
国立研究開発法人産業技術総合研究所
実況音声生成システム
9日前
個人
メガホン
6日前
株式会社エクシング
携帯端末用プログラム、及び、カラオケシステム
17日前
株式会社田中
防音材を充填した金属パイプ
1か月前
株式会社JVCケンウッド
情報処理装置、情報処理方法、及びプログラム
10日前
カシオ計算機株式会社
電子楽器、方法およびプログラム
25日前
株式会社 一歩
和音発生方法並びにそれに用いる単音発生具及び和音発生具
2日前
パイオニア株式会社
音声処理装置、音声処理方法、プログラム及び記憶媒体
3日前
パイオニア株式会社
音声処理装置、音声処理方法、プログラム及び記憶媒体
3日前
パイオニア株式会社
音声処理装置、音声処理方法、プログラム及び記憶媒体
3日前
アルプスアルパイン株式会社
音場制御システム及び音場制御方法
12日前
続きを見る
他の特許を見る