TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025079373
公報種別公開特許公報(A)
公開日2025-05-22
出願番号2023191950
出願日2023-11-10
発明の名称音声処理装置、音声処理方法、プログラム及び記憶媒体
出願人パイオニア株式会社
代理人個人
主分類G10L 15/20 20060101AFI20250515BHJP(楽器;音響)
要約【課題】音声認識における誤認識を抑制することが可能な音声処理装置等を提供する。
【解決手段】音声処理装置は、推定部と、抑制部と、制御部と、を有する。推定部は、マイクから入力された第1のマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する。抑制部は、第1のマイク音声からエコー成分を差し引くことにより、第1のマイク音声に含まれるシステム音声を抑制した第2のマイク音声を出力する。制御部は、第1のマイク音声及びエコー成分の相関性に応じ、第2のマイク音声を減衰させない期間に相当する非減衰期間を設定する。
【選択図】図3
特許請求の範囲【請求項1】
マイクから入力された第1のマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部と、
前記第1のマイク音声から前記エコー成分を差し引くことにより、前記第1のマイク音声に含まれる前記システム音声を抑制した第2のマイク音声を出力する抑制部と、
前記第1のマイク音声及び前記エコー成分の相関性に応じ、前記第2のマイク音声を減衰させない期間に相当する非減衰期間を設定する制御部と、
を有する音声処理装置。
続きを表示(約 960 文字)【請求項2】
前記制御部は、前記第1のマイク音声及び前記エコー成分の相関性が高い状態から低い状態へ遷移したタイミングから所定時間が経過するまでの期間を、前記非減衰期間として設定する請求項1に記載の音声処理装置。
【請求項3】
前記第1のマイク音声及び前記エコー成分の相関性を示す相関係数を算出する算出部をさらに有し、
前記制御部は、前記相関係数が所定の閾値より大きい値から当該所定の閾値以下の値へ遷移したタイミングから所定時間が経過するまでの期間を、前記非減衰期間として設定する請求項1に記載の音声処理装置。
【請求項4】
前記制御部は、前記第2のマイク音声に含まれる発話内容を認識する音声認識エンジンを起動させるための音声コマンドの発話に要する時間を前記所定時間として設定する請求項2または3に記載の音声処理装置。
【請求項5】
コンピュータが実行する音声処理方法であって、
マイクから入力された第1のマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定工程と、
前記第1のマイク音声から前記エコー成分を差し引くことにより、前記第1のマイク音声に含まれる前記システム音声を抑制した第2のマイク音声を出力する抑制工程と、
前記第1のマイク音声及び前記エコー成分の相関性に応じ、前記第2のマイク音声を減衰させない期間に相当する非減衰期間を設定する制御工程と、
を有する音声処理方法。
【請求項6】
コンピュータにより実行されるプログラムであって、
マイクから入力された第1のマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部、
前記第1のマイク音声から前記エコー成分を差し引くことにより、前記第1のマイク音声に含まれる前記システム音声を抑制した第2のマイク音声を出力する抑制部、及び、
前記第1のマイク音声及び前記エコー成分の相関性に応じ、前記第2のマイク音声を減衰させない期間に相当する非減衰期間を設定する制御部として前記コンピュータを機能させるプログラム。
【請求項7】
請求項6に記載のプログラムを記憶した記憶媒体。

発明の詳細な説明【技術分野】
【0001】
本開示は、音声を処理する技術に関する。
続きを表示(約 1,400 文字)【背景技術】
【0002】
音声に含まれるエコー成分を除去するエコーキャンセルに係る技術が従来知られている。
【0003】
具体的には、例えば、特許文献1には、マイクに入力されたユーザの発話音声と、当該マイクに入力されたエコーと、を含む音声から当該エコーに相当する成分を除去する技術が開示されている。また、特許文献1には、閾値を超える音圧を有する音声部分をユーザの発話区間として検出する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
特開2009-109536号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
例えば、スマートスピーカ等のような、音声認識を利用した対話型の装置に入力された音声に対してエコーキャンセルを適用した場合には、当該装置自身から発せられた音声がエコー成分として十分に除去されず、誤った認識結果が得られてしまう、という問題点が生じる。
【0006】
そして、特許文献1に開示された技術によれば、例えば、閾値が頻繁に変動するような状況において、前述の問題点が生じる場合がある。そのため、特許文献1に開示された技術によれば、前述の問題点に応じた課題が生じている。
【0007】
本開示は、上記の課題を鑑み、音声認識における誤認識を抑制することが可能な音声処理装置を提供することを主な目的とする。
【課題を解決するための手段】
【0008】
請求項に記載の発明は、音声処理装置であって、マイクから入力された第1のマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部と、前記第1のマイク音声から前記エコー成分を差し引くことにより、前記第1のマイク音声に含まれる前記システム音声を抑制した第2のマイク音声を出力する抑制部と、前記第1のマイク音声及び前記エコー成分の相関性に応じ、前記第2のマイク音声を減衰させない期間に相当する非減衰期間を設定する制御部と、を有する。
【0009】
請求項に記載の発明は、コンピュータが実行する音声処理方法であって、マイクから入力された第1のマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定工程と、前記第1のマイク音声から前記エコー成分を差し引くことにより、前記第1のマイク音声に含まれる前記システム音声を抑制した第2のマイク音声を出力する抑制工程と、前記第1のマイク音声及び前記エコー成分の相関性に応じ、前記第2のマイク音声を減衰させない期間に相当する非減衰期間を設定する制御工程と、を有する。
【0010】
請求項に記載の発明は、コンピュータにより実行されるプログラムであって、マイクから入力された第1のマイク音声に含まれるシステム音声に対応する成分をエコー成分として推定する推定部、前記第1のマイク音声から前記エコー成分を差し引くことにより、前記第1のマイク音声に含まれる前記システム音声を抑制した第2のマイク音声を出力する抑制部、及び、前記第1のマイク音声及び前記エコー成分の相関性に応じ、前記第2のマイク音声を減衰させない期間に相当する非減衰期間を設定する制御部として前記コンピュータを機能させる。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
メガホン
6日前
個人
リアルタイム翻訳システム
1か月前
個人
10デジタルサラウンドラジオ
23日前
合同会社Bootstrap
弦楽器
3日前
三井化学株式会社
遮音構造体
11日前
三井化学株式会社
遮音構造体
1か月前
三菱電機株式会社
吸音体
5日前
旭化成株式会社
内装吸音材
6日前
矢崎総業株式会社
車両用対話システム
17日前
矢崎総業株式会社
車両用対話システム
17日前
矢崎総業株式会社
車両用対話システム
17日前
トヨタ自動車株式会社
音声制御装置
1か月前
矢崎総業株式会社
車両用対話システム
17日前
矢崎総業株式会社
車両用対話システム
17日前
ヤマハ株式会社
情報処理方法
4日前
ヤマハ株式会社
情報処理方法
4日前
矢崎総業株式会社
車両用対話システム
17日前
トヨタ自動車株式会社
情報処理装置
1か月前
株式会社第一興商
カラオケ装置
13日前
トヨタ自動車株式会社
車両
5日前
ヤマハ株式会社
鍵盤楽器
1か月前
ヤマハ株式会社
鍵盤装置
12日前
株式会社しくみ
音声翻訳プログラム
1か月前
学校法人 工学院大学
音響拡散パネル
12日前
日本放送協会
音声認識装置およびプログラム
17日前
株式会社Gottsu
サキソフォーン向けねじ込み式スクリュー
25日前
国立研究開発法人産業技術総合研究所
実況音声生成システム
9日前
ソフトバンクグループ株式会社
システム
1か月前
ソフトバンクグループ株式会社
システム
1か月前
株式会社SCALER
カラオケ管理システム
1か月前
個人
メガホン
6日前
株式会社エクシング
携帯端末用プログラム、及び、カラオケシステム
17日前
株式会社田中
防音材を充填した金属パイプ
1か月前
株式会社JVCケンウッド
情報処理装置、情報処理方法、及びプログラム
10日前
カシオ計算機株式会社
電子楽器、方法およびプログラム
25日前
株式会社 一歩
和音発生方法並びにそれに用いる単音発生具及び和音発生具
2日前
続きを見る