TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025066148
公報種別公開特許公報(A)
公開日2025-04-22
出願番号2025012461,2022577952
出願日2025-01-28,2021-01-29
発明の名称信号処理装置、信号処理方法及び信号処理プログラム
出願人日本電信電話株式会社
代理人弁理士法人酒井国際特許事務所
主分類H04R 3/00 20060101AFI20250415BHJP(電気通信技術)
要約【課題】信号に対する明示的な仮定を置くことなく、仮想的に配置されたマイクの信号を推定することができる。
【解決手段】推定装置10は、実マイクの観測信号の振幅及び位相成分に対応する時間領域信号の入力を受け付け、仮想的に配置された仮想マイクの観測信号の振幅及び位相成分に対応する時間領域信号を出力する推定部を有し、推定部は、一つのニューラルネットワーク11を有し、一つのニューラルネットワーク11は、深層学習モデルであり、入力された実マイクの観測信号の振幅及び位相成分に対応する時間領域信号から、仮想的に配置された仮想マイクの観測信号の振幅及び位相成分に対応する時間領域信号を推定し、推定結果を出力する。
【選択図】図1
特許請求の範囲【請求項1】
音響信号を処理する信号処理装置であって、
実マイクの観測信号の振幅及び位相成分に対応する時間領域信号の入力を受け付け、仮想的に配置された仮想マイクの観測信号の振幅及び位相成分に対応する時間領域信号を出力する推定部
を有し、
前記推定部は、一つのニューラルネットワークを有し、
前記一つのニューラルネットワークは、深層学習モデルであり、入力された前記実マイクの観測信号の振幅及び位相成分に対応する時間領域信号から、前記仮想的に配置された仮想マイクの観測信号の振幅及び位相成分に対応する時間領域信号を推定し、推定結果を出力することを特徴とする信号処理装置。
続きを表示(約 620 文字)【請求項2】
前記一つのニューラルネットワークのパラメータは、学習データである、実マイクの観測信号の時間領域信号と、前記仮想的に配置された仮想マイクの位置において実際に観測された観測信号の時間領域信号とを基に、前記前記ニューラルネットワークによって前記実マイクの観測信号の時間領域信号から推定された前記仮想マイクの観測信号の時間領域信号が、前記仮想マイクの位置において実際に観測された観測信号の時間領域信号に近づくよう、更新されたことを特徴とする請求項1に記載の信号処理装置。
【請求項3】
信号処理装置が実行する信号処理方法であって、
実マイクの観測信号の振幅及び位相成分に対応する時間領域信号の入力を受け付け、仮想的に配置された仮想マイクの観測信号の振幅及び位相成分に対応する時間領域信号を出力する工程
を含み、
前記出力する工程は、一つのニューラルネットワークを用い、
前記一つのニューラルネットワークは、深層学習モデルであり、入力された前記実マイクの観測信号の振幅及び位相成分に対応する時間領域信号から、前記仮想的に配置された仮想マイクの観測信号の振幅及び位相成分に対応する時間領域信号を推定し、推定結果を出力することを特徴とする信号処理方法。
【請求項4】
コンピュータを、請求項1または2に記載の信号処理装置として機能させるための信号処理プログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、信号処理装置、信号処理方法及び信号処理プログラムに関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
音声強調、音源分離、音源方向推定等、様々なアプリケーションにおいて、マイクロホンアレイ(複数のマイク)を用いるアレイ信号処理技術が広く利用されている。
【0003】
アレイ信号処理の性能は,基本的にマイクの数に依存するが、実際に運用する場合、デバイスの多くには制約があり、マイクの数を増やすことが難しい場合が多い。このため、マイクの数が少ない場合におけるマイクロホンアレイ技術の性能を向上させることが望まれている。
【0004】
これに対し、従来、実際にはマイクが設定されていない位置に仮想的に配置された仮想マイクの信号を推定して、仮想的に観測マイクの数を増やすことを可能とするような方法が研究されている。例えば、物理モデルに基づき仮想マイク信号の位相成分を推定する方法がある。物理モデルは、平面波仮定、音声のスパース性、十分に間隔の狭いマイクアレイ等を仮定するモデルである。
【先行技術文献】
【非特許文献】
【0005】
Hiroki Katahira, “Nonlinear speech enhancement by virtual increase of channels and maximum SNR beamformer”, [online],[令和3年1月25日検索]、インターネット<URL:https://asp-eurasipjournals.springeropen.com/track/pdf/10.1186/s13634-015-0301-3.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0006】
従来の研究では、物理モデルに基づいて仮想マイクの信号の推定を行っていたが、この物理モデルが必ずしも成り立つとは限らず、仮想マイクの信号(特に位相)を推定することが難しいという問題があった。
【0007】
本発明は、上記に鑑みてなされたものであって、信号に対する明示的な仮定を置くことなく、仮想的に配置されたマイクの信号を推定することができる信号処理装置、信号処理方法及び信号処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上述した課題を解決し、目的を達成するために、本発明に係る信号処理装置は、音響信号を処理する信号処理装置であって、実マイクの観測信号の振幅及び位相成分に対応する時間領域信号の入力を受け付け、仮想的に配置された仮想マイクの観測信号の振幅及び位相成分に対応する時間領域信号を出力する推定部を有し、前記推定部は、一つのニューラルネットワークを有し、前記一つのニューラルネットワークは、深層学習モデルであり、入力された前記実マイクの観測信号の振幅及び位相成分に対応する時間領域信号から、前記仮想的に配置された仮想マイクの観測信号の振幅及び位相成分に対応する時間領域信号を推定し、推定結果を出力することを特徴とする。
【0009】
また、本発明に係る信号処理方法は、信号処理装置が実行する信号処理方法であって、実マイクの観測信号の振幅及び位相成分に対応する時間領域信号の入力を受け付け、仮想的に配置された仮想マイクの観測信号の振幅及び位相成分に対応する時間領域信号を出力する工程を含み、前記出力する工程は、一つのニューラルネットワークを用い、前記一つのニューラルネットワークは、深層学習モデルであり、入力された前記実マイクの観測信号の振幅及び位相成分に対応する時間領域信号から、前記仮想的に配置された仮想マイクの観測信号の振幅及び位相成分に対応する時間領域信号を推定し、推定結果を出力することを特徴とする。
【発明の効果】
【0010】
本発明によれば、信号に対する明示的な仮定を置くことなく、仮想的に配置されたマイクの信号を推定することができる。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
防犯AIプラグイン
19日前
個人
音声による制御装置
1か月前
個人
コメント配信システム
1か月前
個人
電気音響変換装置
29日前
個人
テレビ会議拡張システム
14日前
株式会社SEtech
撮像装置
1か月前
キヤノン株式会社
撮像装置
1か月前
日本放送協会
無線通信装置
19日前
キヤノン電子株式会社
画像処理装置
1か月前
キヤノン電子株式会社
画像処理装置
20日前
個人
無線中継赤外線コピーリモコン
16日前
キヤノン電子株式会社
画像読取装置
9日前
TOA株式会社
音響システム
15日前
キヤノン電子株式会社
画像処理装置
26日前
キヤノン株式会社
画像読取装置
6日前
船井電機株式会社
表示装置
1か月前
BoCo株式会社
骨伝導聴音装置
1か月前
理想科学工業株式会社
連絡システム
14日前
株式会社ニコン
撮像装置
14日前
株式会社ユピテル
撮像装置等
14日前
株式会社ニコン
カメラボディ
6日前
二幸産業株式会社
建物設備の管理装置
1日前
キヤノン株式会社
冷却装置と電子機器
15日前
シャープ株式会社
頭部装着装置
1か月前
個人
海洋のセキュリティーと可視化システム
1か月前
17LIVE株式会社
サーバ及び方法
7日前
株式会社JVCケンウッド
映像記録装置
15日前
株式会社国際電気
カメラシステム
28日前
キヤノン株式会社
撮像装置
1か月前
キヤノン株式会社
撮像装置
14日前
日本放送協会
音場再現装置及びプログラム
1か月前
株式会社国際電気
無線通信システム
19日前
株式会社国際電気
通信局及び通信システム
29日前
ニッタン株式会社
引率支援システム
14日前
アズビル株式会社
超音波トランスデューサ
1か月前
株式会社デンソー
通信装置
1か月前
続きを見る