TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024076433
公報種別公開特許公報(A)
公開日2024-06-06
出願番号2022187925
出願日2022-11-25
発明の名称音声処理装置、音声処理プログラム及び音声処理方法
出願人沖電気工業株式会社
代理人個人,個人
主分類G10L 21/0272 20130101AFI20240530BHJP(楽器;音響)
要約【課題】 ユーザへの音声出力処理及びユーザの音声収音処理に対応しつつ、ダブルトーク状態等となった場合でも、音声収音処理においてエコーの混入を防止する。
【解決手段】 本発明は音声出力及びエリア収音を行う音声処理装置に関する。そして、本発明の音声処理装置は、出力音声信号に基づく音声をスピーカから出力する手段と、複数のマイクロホンアレイから入力された入力信号に基づいて目的エリアを音源とする目的エリア音を取得する手段と、少なくとも入力信号を含む混合用信号を所定の音量レベルに調整し、目的エリア音に混合させる信号混合処理を行い、信号混合処理により生成される混合後目的エリア音を生成して出力する手段と、出力音声信号に音声が含まれる有音区間を検出する手段と、少なくとも出力音声信号が有音区間となる特定区間を検出する手段と、特定区間において、信号混合処理を制限するように制御する手段とを有することを特徴とする。
【選択図】 図1
特許請求の範囲【請求項1】
出力音声信号に基づく音声をスピーカから出力する出力手段と、
複数のマイクロホンアレイから入力された入力信号について、目的エリア方向以外の方向に指向性を形成した第1の非目的エリア音と、目的エリア方向に指向性を形成した目的エリア方向音とを取得する指向性形成手段と、
前記目的エリア方向音を用いて目的エリア方向からの第2の非目的エリア音を抽出し、さらに、前記第2の非目的エリア音と前記目的エリア方向音とを用いて、目的エリアを音源とする目的エリア音を取得する目的エリア音抽出手段と、
少なくとも前記入力信号を含む混合用信号を所定の音量レベルに調整し、前記目的エリア音に混合させる信号混合処理を行い、前記信号混合処理により生成される混合後目的エリア音を生成して出力する信号混合手段と、
前記出力音声信号に音声が含まれる有音区間を検出する有音区間検出手段と、
少なくとも前記出力音声信号が有音区間となる特定区間を検出する特定区間検出手段と、
前記特定区間において、前記信号混合処理を制限するように制御する混合制御手段と
を有することを特徴とする音声処理装置。
続きを表示(約 1,500 文字)【請求項2】
前記混合制御手段は、前記特定区間において、前記信号混合処理を停止させることを特徴とする請求項1に記載の音声処理装置。
【請求項3】
前記混合制御手段は、前記特定区間の前記信号混合処理において、前記目的エリア音に混合させる前記混合用信号の音量レベルを低減させることを特徴とする請求項1に記載の音声処理装置。
【請求項4】
前記混合制御手段は、前記出力音声信号が有音区間から無音区間となった後、所定のハングオーバ期間の間前記特定区間の状態を延長するハングオーバ処理を行うことを特徴とする請求項1に記載の音声処理装置。
【請求項5】
前記ハングオーバ期間は、前記スピーカから出力される音声がエコーとして前記マイクロホンアレイに入力される際のエコーパスの遅延に基づく期間であることを特徴とする請求項4に記載の音声処理装置。
【請求項6】
コンピュータを、
出力音声信号に基づく音声をスピーカから出力する出力手段と、
複数のマイクロホンアレイから入力された入力信号について、目的エリア方向以外の方向に指向性を形成した第1の非目的エリア音と、目的エリア方向に指向性を形成した目的エリア方向音とを取得する指向性形成手段と、
前記目的エリア方向音を用いて目的エリア方向からの第2の非目的エリア音を抽出し、さらに、前記第2の非目的エリア音と前記目的エリア方向音とを用いて、目的エリアを音源とする目的エリア音を取得する目的エリア音抽出手段と、
少なくとも前記入力信号を含む混合用信号を所定の音量レベルに調整し、前記目的エリア音に混合させる信号混合処理を行い、前記信号混合処理により生成される混合後目的エリア音を生成して出力する信号混合手段と、
前記出力音声信号に音声が含まれる有音区間を検出する有音区間検出手段と、
少なくとも前記出力音声信号が有音区間となる特定区間を検出する特定区間検出手段と、
前記特定区間において、前記信号混合処理を制限するように制御する混合制御手段と
して機能させることを特徴とする音声処理プログラム。
【請求項7】
音声処理装置が行う音声処理方法において、
前記音声処理装置は、出力手段、指向性形成手段、目的エリア音抽出手段、信号混合手段、有音区間検出手段、特定区間検出手段及び混合制御手段を備え、
前記出力手段は、出力音声信号に基づく音声をスピーカから出力し、
前記指向性形成手段は、複数のマイクロホンアレイから入力された入力信号について、目的エリア方向以外の方向に指向性を形成した第1の非目的エリア音と、目的エリア方向に指向性を形成した目的エリア方向音とを取得し、
前記目的エリア音抽出手段は、前記目的エリア方向音を用いて目的エリア方向からの第2の非目的エリア音を抽出し、さらに、前記第2の非目的エリア音と前記目的エリア方向音とを用いて、目的エリアを音源とする目的エリア音を取得し、
前記信号混合手段は、少なくとも前記入力信号を含む混合用信号を所定の音量レベルに調整し、前記目的エリア音に混合させる信号混合処理を行い、前記信号混合処理により生成される混合後目的エリア音を生成して出力し、
前記有音区間検出手段は、前記出力音声信号に音声が含まれる有音区間を検出し、
前記特定区間検出手段は、少なくとも前記出力音声信号が有音区間となる特定区間を検出し、
前記混合制御手段は、前記特定区間において、前記信号混合処理を制限するように制御する
ことを特徴とする音声処理方法。

発明の詳細な説明【技術分野】
【0001】
本発明は、音声処理装置、音声処理プログラム及び音声処理方法に関し、例えば、特定のエリアの音を強調し、それ以外のエリアの音を抑圧する処理に適用し得るものである。
続きを表示(約 1,600 文字)【背景技術】
【0002】
複数の音源が存在する環境下において、ある特定の方向の音のみ分離し収音する技術として、マイクロホンアレイを用いたビームフォーマ(Beam Former;以下、「BF」と呼ぶものとする)がある。BFとは、各マイクロホンに到達する信号の時間差を利用して指向性を形成する技術である(非特許文献1参照)。BFは、加算型と減算型の大きく2つの種類に分けられる。特に減算型BFは、加算型BFに比べ、少ないマイクロホン数で指向性を形成できるという利点がある。図6は、マイクロホン数が2個の場合の従来の減算型BFを適用した収音装置PSに係る構成を示すブロック図である。従来の減算型BFを適用した収音装置PSは、まず遅延器により目的とする方向に存在する音(以下、「目的音」と呼ぶ)がマイクロホンM1、M2に到来する信号の時間差を算出し、遅延を加えることにより目的音の位相を合わせる。
【0003】
収音装置PSにおいて、時間差は下記(1)式により算出される。(1)式においてdはマイクロホン間の距離、cは音速、τ
ι
は遅延量である。また、(1)式において、θ

は、各マイクロホンを結んだ直線に対する垂直方向から目的方向への角度である。
【0004】
τ

=(dsinθ

)/c …(1)
【0005】
ここで、収音装置PSは、死角がマイクロホンM1とマイクロホンM2の中心に対し、マイクロホンM1の方向に存在する場合、マイクロホンM1の入力信号χ

(τ)に対し遅延処理を行う。その後、収音装置PSは、(2)式に従い減算器により信号処理を行う。
【0006】
m(t)=x

(t)-x

(t-τ

)…(2)
【0007】
収音装置PSにおいて、減算処理は周波数領域でも同様に行うことができ、その場合(2)式は以下の(3)式のように変更される。
【0008】
TIFF
2024076433000002.tif
19
136
【0009】
θ

=±π/2の場合、収音装置PSにおいて形成される指向性は図7(A)に示すように、カージオイド型の単一指向性となる。また、θ

=0,πの場合、収音装置PSにおいて形成される指向性は、図7(B)のような8の字型の双指向性となる。なお、以下では、入力信号から単一指向性を形成するフィルタを「単一指向性フィルタ」と呼び、双指向性を形成するフィルタを「双指向性フィルタ」と呼ぶものとする。
【0010】
また、収音装置PSでは、スペクトル減算法(Spectral Subtraction;以下、「SS」と呼ぶ)を用いることで、双指向性の死角に強い指向性を形成することもできる。SSによる指向性は、(4)式に従い全周波数、もしくは指定した周波数帯域で形成される。(4)式では、マイクロホンM1の入力信号Χ

を用いているが、マイクロホンM2の入力信号Χ

でも同様の効果を得ることができる。(4)式において、βはSSの強度を調節するための係数である。収音装置PSでは、SSの処理(減算処理)の際に値がマイナスになった場合は、0または元の値を小さくした値に置き換えるフロアリング処理を行う。収音装置PSでは、SSの処理を適用することにより、双指向性フィルタにより目的方向以外に存在する音(以下、「非目的音」と呼ぶ)を抽出し、抽出した非目的音の振幅スペクトルを入力信号の振幅スペクトルから減算することで、目的音を強調することができる。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
三味線の部品
19日前
株式会社大貴
吸音材の施工方法
18日前
株式会社エフノート
電子打楽器
17日前
株式会社エフノート
電子ドラム
17日前
株式会社小泉製作所
ベル装置
21日前
エイドス セラピューティクス,インコーポレイティド
AG10の製剤
3日前
エイドス セラピューティクス,インコーポレイティド
AG10を使用するTTRアミロイドーシスの治療方法
21日前
ヤマハ株式会社
楽器用ナット
21日前
株式会社総合車両製作所
吸音パネル
17日前
ヤマハ株式会社
プログラム
14日前
株式会社レゾナック
吸音材及び車両部材
今日
トヨタ自動車株式会社
情報処理装置
4日前
株式会社第一興商
カラオケ端末
24日前
住友理工株式会社
防音放熱カバー
1か月前
株式会社イノアックコーポレーション
防音材及び車両構造
14日前
株式会社レゾナック
吸音構造体及び吸音構造体の製造方法
4日前
株式会社第一興商
カラオケ装置、カラオケシステム
14日前
日本放送協会
音場評価装置、音場評価システム、及びプログラム
今日
沖電気工業株式会社
音声処理装置、音声処理プログラム及び音声処理方法
18日前
ローランド株式会社
鍵盤装置および駆動装置の冷却方法
24日前
ブラザー工業株式会社
カラオケ装置、カラオケ再生方法及びカラオケ用プログラム
1か月前
株式会社スクウェア・エニックス
音声生成プログラム及び音声生成システム
1か月前
日産自動車株式会社
車両の情報提示方法及び情報提示装置
1か月前
株式会社竹中工務店
情報処理装置及び情報処理プログラム
11日前
学校法人立命館
叫び声検知システム、音声分類方法、及び、音声分類モデルの生成方法
18日前
三菱重工業株式会社
音声認識装置、音声認識方法及びプログラム
5日前
キヤノン株式会社
情報処理装置、情報処理方法、及びプログラム
28日前
トヨタ自動車株式会社
情報処理装置、情報処理方法、及び、プログラム
4日前
日本放送協会
音声認識モデルに用いる学習データを作成する学習データ作成装置及びプログラム
21日前
株式会社アドバンスト・メディア
情報処理装置、情報処理システム、情報処理方法及びプログラム
4日前
日本電信電話株式会社
対話システム、発話生成方法、およびプログラム
1か月前
LINEヤフー株式会社
信号処理装置、信号処理方法、および信号処理プログラム
今日
株式会社デンソーテン
評価装置、評価方法、音響システムおよび評価用信号生成方法
26日前
株式会社日立ビルシステム
昇降機の保守作業結果入力システム及び昇降機の保守作業結果入力方法
11日前
岐阜プラスチック工業株式会社
吸音構造体及びその製造方法
13日前
カシオ計算機株式会社
信号処理装置、方法、及びプログラム、電子楽器
13日前
続きを見る