TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024066473
公報種別公開特許公報(A)
公開日2024-05-15
出願番号2023179988
出願日2023-10-19
発明の名称半適応性ビームフォーマ
出願人シナプティクス インコーポレイテッド
代理人個人,個人
主分類G10L 21/0208 20130101AFI20240508BHJP(楽器;音響)
要約【課題】半適応性ビームフォーミングの方法、デバイスおよびシステムを提供する。
【解決手段】半適応性ビームフォーマ300は、マイクロフォンアレイを介して受信したオーディオ信号302に基づき相対伝達関数(RTF)ベクトル(瞬時RTFベクトル304)を決定し、さらに瞬時RTFベクトルと固定RTFベクトル305との合成に基づきマイクロフォンアレイ用の最小分散無歪応答(MVDR)ビームフォーミングフィルタを決定する。固定RTFベクトルは、マイクロフォンアレイの任意のユーザ用の比較的精度の高いMVDRビームフォーミングフィルタを生成する既知のRTFセットを含んでもよい。また、瞬時RTFベクトルと固定RTFベクトルの重み付け平均に基づきMVDRビームフォーミングフィルタを決定する。重み付けは、受信したオーディオ信号の品質又は様々な他の条件に基づいて動的に調整される。
【選択図】図3
特許請求の範囲【請求項1】
複数のマイクロフォンを介してオーディオ信号を受信し、前記オーディオ信号が各自の音声成分と各自の雑音成分とをそれぞれ有する複数のフレームを含むことと、
前記複数のフレームの第1フレームに基づき、前記複数のマイクロフォンに関する複数の第1相対伝達関数(RTF)をそれぞれに決定することと、
前記複数の第1RTFと、前記複数のマイクロフォンに関する複数の固定RTFと、前記第1フレームの前記雑音成分の共分散との少なくとも一部分に基づき、前記第1フレームにおいて、前記音声成分をゆがませずに、前記雑音成分のパワーを減少する第1最小分散無歪応答(MVDR)ビームフォーミングフィルタを決定することと、
を含むオーディオ信号を処理する方法。
続きを表示(約 1,200 文字)【請求項2】
前記複数のマイクロフォンを介して、音声成分と雑音成分とを有するトレーニング信号を受信することと、
前記トレーニング信号の前記音声成分の共分散と、前記トレーニング信号の前記雑音成分の共分散とに関する信号対雑音比(SNR)を増加する一般化固有値(GEV)ビームフォーミングフィルタを決定することと、
前記GEVビームフォーミングフィルタの少なくとも一部分に基づき、前記複数の固定RTFを決定することと、
をさらに含む請求項1の方法。
【請求項3】
前記複数の第1RTFを決定することは、
前記第1フレームの前記音声成分の共分散と、前記第1フレームの前記雑音成分の前記共分散とに関するSNRを増加する第1GEVビームフォーミングフィルタを決定すること
を含む請求項1の方法。
【請求項4】
前記複数の固定RTFと、前記複数の第1RTFと、第1相関係数とに基づき、複数の第1合成RTFを決定すること
をさらに含む請求項3の方法。
【請求項5】
前記複数の固定RTFと前記複数の第1RTFとの相関関係の少なくとも一部分に基づき、前記第1相関係数を決定すること
をさらに含む請求項4の方法。
【請求項6】
前記第1フレームの前記音声成分の前記共分散に関するSNRの少なくとも一部分に基づき、前記第1相関係数を決定すること
をさらに含む請求項4の方法。
【請求項7】
前記複数のフレームの第2フレームに基づき、前記複数のマイクロフォンに関する複数の第2RTFをそれぞれに決定することと、
前記複数の固定RTFと、前記複数の第2RTFと、第2相関係数とに基づき、複数の第2合成RTFを決定することと、
前記複数の第2合成RTFと、前記第2フレームの前記雑音成分の共分散とに基づき、第2MVDRビームフォーミングフィルタを決定することと、
をさらに含む請求項4の方法。
【請求項8】
前記複数の第2RTFを決定することは、
前記第2フレームの前記音声成分の共分散と、前記第2フレームの前記雑音成分の前記共分散とに関するSNRを増加する第2GEVビームフォーミングフィルタを決定すること
を含む請求項7の方法。
【請求項9】
前記第2フレームの前記音声成分の前記共分散に関する前記SNRは前記第1フレームの前記音声成分の前記共分散に関するSNRより高く、前記第2相関係数は前記第1相関係数より小さい
請求項8の方法。
【請求項10】
前記第2フレームの前記音声成分の前記共分散に関する前記SNRは前記第1フレームの前記音声成分の前記共分散に関する前記SNRより低く、前記第2相関係数は前記第1相関係数より大きい
請求項8の方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本実装は、一般に信号処理に関するものであり、特に、信号処理のための半適応性ビームフォーマに関する。
続きを表示(約 2,000 文字)【背景技術】
【0002】
ビームフォーミングは、送受信される信号のエネルギーを空間方向に集束できる信号処理技術である。例えば、ビームフォーマは、マイクロフォンアレイによって検出される音声の品質をマイクロフォン出力での信号合成を通して向上できる。より具体的には、ビームフォーマは、オーディオ信号を合成するとき、信号強度が音声の方向において強化されるように(または、雑音の方向において抑制されるように)、マイクロフォンアレイの各マイクロフォンにより出力されるオーディオ信号に各々の重みを適用する場合がある。適応性ビームフォーマは、合成されたオーディオ信号の品質、または、信号対雑音比(SNR)を最適化するために、マイクロフォン出力の重みを動的に調整する能力がある。このように、適応性ビームフォーマは環境の変化に適応できる。適応性ビームフォーミング技術の例は、数ある他の例のうち、最小平均二乗誤差(MMSE)ビームフォーミング、最小分散無歪応答(MVDR)ビームフォーミング、一般化固有値(GEV)ビームフォーミングを含む。
【0003】
適応性ビームフォーマは、最適な重みセットに収束するための時間を要する。収束前、適応性ビームフォーマは、音声が到来する方向においてオーディオ信号をゆがませ、さらには抑制する場合がある。さらに、低SNR環境において、適応性ビームフォーマは、音声の方向以外の方向に(例えば主要な雑音源の方向に)収束する場合がある。したがって、ビームフォーマが間違った方向に収束することを防ぎつつ、適応性ビームフォーマが収束するために要求される遅延を減少する必要がある。
【発明の概要】
【0004】
この概要において、選択したコンセプトを簡略化された形式で紹介し、以下の詳細な説明でさらに説明する。この概要は、請求された主題の主な機能や不可欠な機能を同一のものとみなすことを意図せず、また請求された主題の範囲を限定することを意図しない。
【0005】
この開示における主題の革新的な一態様を、オーディオ信号処理の方法で実装できる。方法は、複数のマイクロフォンを介してオーディオ信号を受信し、オーディオ信号が、各自の音声成分と各自の雑音成分とをそれぞれ有する複数のフレームを含むことと、複数のフレームの第1フレームに基づき、複数のマイクロフォンに関する複数の第1相対伝達関数(RTF)をそれぞれに決定することと、複数の第1RTFと、複数のマイクロフォンに関する複数の固定RTFと、第1フレームの雑音成分の共分散との少なくとも一部分に基づき、第1フレームにおいて、音声成分をゆがめずに雑音成分のパワーを減少する第1最小分散無歪応答(MVDR)ビームフォーミングフィルタを決定することとを含む。
【0006】
この開示における主題の他の革新的な態様は、処理システムとメモリとを含むビームフォーマに実装され得る。メモリは、処理システムにより実行されるとき、ビームフォーマに、複数のマイクロフォンを介してオーディオ信号を受信させ、オーディオ信号が各自の音声成分と各自の雑音成分とをそれぞれ有する複数のフレームを含み、複数のフレームの第1フレームに基づき、複数のマイクロフォンに関する複数の第1RTFをそれぞれに決定させ、複数の第1RTFと、複数のマイクロフォンに関する複数の固定RTFと、第1フレームの雑音成分の共分散との少なくとも一部分に基づき、第1フレームにおいて、音声成分をゆがませずに雑音成分のパワーを減少する第1MVDRビームフォーミングフィルタを決定させる命令を格納する。
【0007】
この開示における主題の他の革新的な態様は、複数のマイクロフォンとビームフォーマとを含むヘッドセットに実装され得る。ビームフォーマは、複数のマイクロフォンを介してオーディオ信号を受信し、オーディオ信号が各自の音声成分と各自の雑音成分とをそれぞれ有する複数のフレームを含み、複数のフレームの第1フレームに基づき、複数のマイクロフォンに関する複数のRTFをそれぞれに決定し、複数のRTFと、複数のマイクロフォンに関する複数の固定RTFと、第1フレームの雑音成分の共分散との少なくとも一部分に基づき、第1フレームにおいて、音声成分をゆがめずに雑音成分のパワーを減少するMVDRビームフォーミングフィルタを決定するように構成されている。
【図面の簡単な説明】
【0008】
本実装は、例として示されており、添付図面の図によって限定されることを意図するものではない。
【0009】
図1は、ビームフォーミングを実装し得る環境の一例を示す。
【0010】
図2は、いくつかの実装による、ビームフォーミングとして構成可能なオーディオ受信器の一例を示す。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
三味線の部品
19日前
株式会社エフノート
電子打楽器
17日前
株式会社大貴
吸音材の施工方法
18日前
株式会社エフノート
電子ドラム
17日前
株式会社小泉製作所
ベル装置
21日前
エイドス セラピューティクス,インコーポレイティド
AG10の製剤
3日前
エイドス セラピューティクス,インコーポレイティド
AG10を使用するTTRアミロイドーシスの治療方法
21日前
ヤマハ株式会社
楽器用ナット
21日前
株式会社総合車両製作所
吸音パネル
17日前
ヤマハ株式会社
プログラム
14日前
株式会社レゾナック
吸音材及び車両部材
今日
トヨタ自動車株式会社
情報処理装置
4日前
株式会社第一興商
カラオケ端末
24日前
株式会社イノアックコーポレーション
防音材及び車両構造
14日前
日本放送協会
音場評価装置、音場評価システム、及びプログラム
今日
株式会社第一興商
カラオケ装置、カラオケシステム
14日前
株式会社レゾナック
吸音構造体及び吸音構造体の製造方法
4日前
ローランド株式会社
鍵盤装置および駆動装置の冷却方法
24日前
沖電気工業株式会社
音声処理装置、音声処理プログラム及び音声処理方法
18日前
株式会社竹中工務店
情報処理装置及び情報処理プログラム
11日前
学校法人立命館
叫び声検知システム、音声分類方法、及び、音声分類モデルの生成方法
18日前
キヤノン株式会社
情報処理装置、情報処理方法、及びプログラム
28日前
三菱重工業株式会社
音声認識装置、音声認識方法及びプログラム
5日前
トヨタ自動車株式会社
情報処理装置、情報処理方法、及び、プログラム
4日前
日本放送協会
音声認識モデルに用いる学習データを作成する学習データ作成装置及びプログラム
21日前
株式会社アドバンスト・メディア
情報処理装置、情報処理システム、情報処理方法及びプログラム
4日前
LINEヤフー株式会社
信号処理装置、信号処理方法、および信号処理プログラム
今日
株式会社デンソーテン
評価装置、評価方法、音響システムおよび評価用信号生成方法
26日前
株式会社日立ビルシステム
昇降機の保守作業結果入力システム及び昇降機の保守作業結果入力方法
11日前
岐阜プラスチック工業株式会社
吸音構造体及びその製造方法
13日前
カシオ計算機株式会社
信号処理装置、方法、及びプログラム、電子楽器
13日前
ヤマハ株式会社
鍵盤装置及び操作装置
24日前
ヤマハ株式会社
鍵盤装置及び操作装置
24日前
日立GEニュークリア・エナジー株式会社
作業支援システム、作業支援装置、および、作業支援方法
14日前
ヤマハ株式会社
オブジェクトの配置方法、音声の再生方法、オブジェクトの配置装置、音声の再生装置および演奏装置
6日前
ソニーグループ株式会社
信号処理装置および方法、並びにプログラム
20日前
続きを見る