TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025040359
公報種別
公開特許公報(A)
公開日
2025-03-24
出願番号
2023147244
出願日
2023-09-11
発明の名称
雑音抑制処理方法及び聴取装置
出願人
リオン株式会社
代理人
個人
,
個人
主分類
G10L
21/0208 20130101AFI20250314BHJP(楽器;音響)
要約
【課題】各種場面に応じて適切に動作する雑音抑制処理を実現可能な技術を提供する。
【解決手段】雑音抑制処理方法は、雑音を含んだ所望音声信号32に基づく情報及び雑音抑制に関する各種の抑制目標値α1を含め学習した深層ニューラルネットワーク34を用いた雑音抑制処理方法であって、深層ニューラルネットワーク34に対して特徴量抽出部33が抽出した特徴量(実環境における入力信号32A(被雑音抑制対象信号)に基づく情報)及び雑音抑制に関する任意の抑制設定値α2を入力し、特徴量及び任意の抑制設定値α2に基づいて深層ニューラルネットワーク34がマスク35を出力し、マスク35に基づく所定の処理により実環境における入力信号32Aの雑音を抑制する。
【選択図】図2
特許請求の範囲
【請求項1】
雑音を含んだ所望音声信号に基づく情報及び雑音抑制に関する各種の抑制目標値を含め学習した深層ニューラルネットワークを用いた雑音抑制処理方法であって、
前記深層ニューラルネットワークに対して被雑音抑制対象信号に基づく情報及び雑音抑制に関する任意の抑制設定値を入力し、
前記被雑音抑制対象信号に基づく情報及び前記任意の抑制設定値に基づいて前記深層ニューラルネットワークが推定情報を出力し、
前記推定情報に基づく所定の処理により前記被雑音抑制対象信号の雑音を抑制することを特徴とする雑音抑制処理方法。
続きを表示(約 980 文字)
【請求項2】
請求項1に記載の雑音抑制処理方法において、
前記深層ニューラルネットワークは、前記被雑音抑制対象信号に基づく情報として、前記被雑音抑制対象信号に関する所定の特徴量及び前記任意の抑制設定値を入力とし、前記推定情報に基づいて所定の処理を行うことを特徴とする雑音抑制処理方法。
【請求項3】
請求項1に記載の雑音抑制処理方法において、
前記抑制目標値又は前記抑制設定値は、前記深層ニューラルネットワークの入力段の標準化工程の後で結合されることを特徴とする雑音抑制処理方法。
【請求項4】
請求項1に記載の雑音抑制処理方法において、
前記深層ニューラルネットワークは、雑音の種類に応じた抑制目標値を含め学習し、
前記被雑音抑制対象信号の雑音は、雑音の種類に応じて抑制されることを特徴とする雑音抑制処理方法。
【請求項5】
請求項1に記載の雑音抑制処理方法において、
前記各種の抑制目標値は、雑音の種類に応じて複数あり、又は、前記任意の抑制設定値は、雑音の種類に応じて複数あることを特徴とする雑音抑制処理方法。
【請求項6】
請求項1に記載の雑音抑制処理方法において、
前記任意の抑制設定値は、前記被雑音抑制対象信号の信号対雑音比により制御されることを特徴とする雑音抑制処理方法。
【請求項7】
請求項1に記載の雑音抑制処理方法において、
前記深層ニューラルネットワークは、前記推定情報として、前記被雑音抑制対象信号に作用させるマスク、又は、前記被雑音抑制対象信号に作用させるフィルタを生成するためのフィルタ用情報を出力することを特徴とする雑音抑制処理方法。
【請求項8】
請求項1~7のいずれかに記載の雑音抑制処理方法を実行可能な聴取装置。
【請求項9】
請求項8に記載の聴取装置において、
前記任意の抑制設定値は、聴取装置の使用者により任意に設定可能であることを特徴とする聴取装置。
【請求項10】
請求項8に記載の聴取装置において、
前記任意の抑制設定値は、聴取装置の使用者の生体情報に基づいて動的に設定可能であることを特徴とする聴取装置。
発明の詳細な説明
【技術分野】
【0001】
本発明は、雑音抑制処理方法及び聴取装置に関する。
続きを表示(約 1,500 文字)
【背景技術】
【0002】
音声信号処理分野では、深層学習を用いた音声処理の各種研究開発が進められている。例えば音声認識分野において認識率を最適にするために、推定された目標SNRi(Signal-to-Noise Ratio Improvement)を音声強調モデルへ補助的に入力することでSNRiを制御する手法とその学習方法が知られている(例えば、非特許文献1)。
【0003】
また、従来の技術として、サブプロセスにおいて実行する処理に依存して及び/又は環境状況に依存して及び/又は聴取システムのユーザーによるユーザー入力に依存して、ディープニューラルネットワークのトポロジーを確定する、及び/又は、ディープニューラルネットワークの個々のニューロン間の重みを選択する方法が知られている(例えば、特許文献1)。
【先行技術文献】
【特許文献】
【0004】
特開2022-98490号公報
【非特許文献】
【0005】
Y. Koizumi et al., Interspeech 2022, pp.1173-1177 2022.
【発明の概要】
【発明が解決しようとする課題】
【0006】
一般的に深層ニューラルネットワーク(DNN)を用いた雑音抑制(音声強調)では、処理後の出力とクリーン音声の損失関数を最小化するように重みを学習するため、処理後の出力音声には雑音成分がほとんど残らない。
しかし一方で、聴きたい音声自体も劣化してしまう恐れや、周囲の音環境など残したい音も消えてしまう恐れもある。
【0007】
特に補聴器ユーザーである難聴者では、雑音の抑制に伴い音声に歪みが生じることで音声の聴き取りに悪影響を及ぼす場合もあると考えられる。雑音の抑制は、難聴の程度や環境、対象となる音源などによっても変化するため、最適な雑音抑制量を一意に決めることは難しく、各種場面に応じて適切に動作する雑音抑制(音声強調)処理が望まれている。
【0008】
そこで本発明は、各種場面に応じて適切に動作する雑音抑制処理を実現可能な技術を提供することを課題とする。
【課題を解決するための手段】
【0009】
本発明は、上記の課題を解決するため以下の解決手段を採用する。なお、以下の解決手段はあくまで例示であり、本発明はこれに限定されるものではない。また、本発明は、以下の解決手段に示す各発明特定事項を少なくとも1つ含む発明とすることができる。さらに、以下の解決手段に示す各発明特定事項には、発明特定事項を限定する要素を追加して下位概念化することができ、発明特定事項を限定する要素を削除して上位概念化することもできる。
【0010】
解決手段1:本解決手段の雑音抑制処理方法は、雑音を含んだ所望音声信号に基づく情報及び雑音抑制に関する各種の抑制目標値を含め学習した深層ニューラルネットワークを用いた雑音抑制処理方法であって、前記深層ニューラルネットワークに対して被雑音抑制対象信号に基づく情報及び雑音抑制に関する任意の抑制設定値を入力し、前記被雑音抑制対象信号に基づく情報及び前記任意の抑制設定値に基づいて前記深層ニューラルネットワークが推定情報を出力し、前記推定情報に基づく所定の処理により前記被雑音抑制対象信号の雑音を抑制することを特徴とする雑音抑制処理方法である。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
株式会社SOU
保護具
6日前
三井化学株式会社
防音構造
今日
三井化学株式会社
防音構造体
1日前
三井化学株式会社
遮音構造体
7日前
東レ・セラニーズ株式会社
混繊不織布
6日前
スマートライフサプライ合同会社
楽器スタンド
6日前
中強光電股ふん有限公司
電子システム及びその制御方法
6日前
ドリックス株式会社
消音パネル
3日前
株式会社第一興商
カラオケ装置
2日前
カシオ計算機株式会社
電子機器
6日前
株式会社JVCケンウッド
聴音装置、聴音方法及びプログラム
6日前
カシオ計算機株式会社
電子鍵盤楽器
6日前
ソフトバンクグループ株式会社
システム
3日前
ソフトバンクグループ株式会社
システム
6日前
ソフトバンクグループ株式会社
システム
3日前
ソフトバンクグループ株式会社
システム
6日前
ソフトバンクグループ株式会社
システム
3日前
ソフトバンクグループ株式会社
システム
6日前
ソフトバンクグループ株式会社
システム
6日前
ソフトバンクグループ株式会社
システム
6日前
ソフトバンクグループ株式会社
システム
3日前
ソフトバンクグループ株式会社
システム
9日前
ソフトバンクグループ株式会社
システム
6日前
ソフトバンクグループ株式会社
システム
6日前
ソフトバンクグループ株式会社
システム
7日前
ソフトバンクグループ株式会社
システム
9日前
ソフトバンクグループ株式会社
システム
9日前
ソフトバンクグループ株式会社
システム
8日前
ソフトバンクグループ株式会社
システム
8日前
ソフトバンクグループ株式会社
システム
8日前
ソフトバンクグループ株式会社
システム
8日前
ソフトバンクグループ株式会社
システム
7日前
ソフトバンクグループ株式会社
システム
7日前
ソフトバンクグループ株式会社
システム
3日前
ソフトバンクグループ株式会社
システム
7日前
ソフトバンクグループ株式会社
システム
7日前
続きを見る
他の特許を見る