TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025155320
公報種別
公開特許公報(A)
公開日
2025-10-14
出願番号
2024059097
出願日
2024-04-01
発明の名称
収音装置、収音方法、およびプログラム
出願人
株式会社JVCケンウッド
代理人
個人
主分類
G10L
21/0388 20130101AFI20251006BHJP(楽器;音響)
要約
【課題】帯域が制限された音声信号の音質を改善できる技術を提供する。
【解決手段】収音装置100において、音素情報取得部(短時間音素分析部16)は、学習済みモデルを用いて、音声信号に含まれる音素に関する情報を取得する。帯域拡張部34は、音素に関する情報に基づいて音声信号の高域周波数成分を生成し、高域周波数成分によって音声信号の帯域を拡張する。
【選択図】図1
特許請求の範囲
【請求項1】
学習済みモデルを用いて、音声信号に含まれる音素に関する情報を取得する音素情報取得部と、
前記音素に関する情報に基づいて前記音声信号の高域周波数成分を生成し、前記高域周波数成分によって前記音声信号の帯域を拡張する帯域拡張部と、
を備えることを特徴とする収音装置。
続きを表示(約 590 文字)
【請求項2】
前記帯域拡張部は、前記音素に関する情報が母音の情報を含む場合、前記母音に応じた高次フォルマントの特徴を再現した倍音成分を含む前記高域周波数成分を生成する、
ことを特徴とする請求項1に記載の収音装置。
【請求項3】
前記帯域拡張部は、前記音素に関する情報が子音の情報を含む場合、前記子音に応じた周波数特性の雑音成分であって、前記音声信号の音圧に基づいて調整された大きさの雑音成分を含む前記高域周波数成分を生成する、
ことを特徴とする請求項1または2に記載の収音装置。
【請求項4】
コンピュータが、
学習済みモデルを用いて、音声信号に含まれる音素に関する情報を取得するステップと、
前記音素に関する情報に基づいて前記音声信号の高域周波数成分を生成し、前記高域周波数成分によって前記音声信号の帯域を拡張するステップと、
を実行することを特徴とする収音方法。
【請求項5】
コンピュータに、
学習済みモデルを用いて、音声信号に含まれる音素に関する情報を取得するステップと、
前記音素に関する情報に基づいて前記音声信号の高域周波数成分を生成し、前記高域周波数成分によって前記音声信号の帯域を拡張するステップと、
を実行させることを特徴とするプログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、狭帯域の音声信号の周波数帯域を拡大する技術に関する。
続きを表示(約 1,300 文字)
【背景技術】
【0002】
特許文献1には、周波数帯域が制限された狭帯域の信号に対し、非線形処理を施す非線形処理手段を有し、周波数帯域が拡張された信号を形成する帯域拡張装置が開示されている。この装置は、周波数帯域が拡張された信号のスペクトル概形を求め、求めたスペクトル概形を平坦化した特性を白色雑音に対して付与した信号を生成し、周波数帯域が拡張された信号に重畳する。
【先行技術文献】
【特許文献】
【0003】
特開2012-27255号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1のLPC分析は人の声である音声の成り立ちである喉、口元の音導管を表現したものであり、帯域が制限された段階での分析では高次のフォルマントに相当する情報が欠落することとなり、誤った広帯域の音声成分が復元される恐れがある。また、特許文献1の技術では、白色雑音を元に無声音をLPC雑音合成により生成しているが、上記同様に拡大帯域に相当するLPC情報が正確ではないため、無声音の種類、すなわち音素の種類によっては、意図しない雑音成分が付加される恐れがある。
【0005】
本発明はこうした状況に鑑みてなされたものであり、その目的は、帯域が制限された音声信号の音質を改善できる技術を提供することである。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明のある態様の収音装置は、学習済みモデルを用いて、音声信号に含まれる音素に関する情報を取得する音素情報取得部と、前記音素に関する情報に基づいて音声信号の高域周波数成分を生成し、前記高域周波数成分によって前記音声信号の帯域を拡張する帯域拡張部と、を備えることを特徴とする。
【0007】
本発明の別の態様は、収音方法である。この方法は、コンピュータが、学習済みモデルを用いて、音声信号に含まれる音素に関する情報を取得するステップと、前記音素に関する情報に基づいて音声信号の高域周波数成分を生成し、前記高域周波数成分によって音声信号の帯域を拡張するステップと、を実行することを特徴とする。
【0008】
本発明の別の態様は、プログラムである。このプログラムは、コンピュータに、学習済みモデルを用いて、音声信号に含まれる音素に関する情報を取得するステップと、前記音素に関する情報に基づいて前記音声信号の高域周波数成分を生成し、前記高域周波数成分によって前記音声信号の帯域を拡張するステップと、を実行させることを特徴とする。
【0009】
なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。
【発明の効果】
【0010】
本発明によれば、帯域が制限された音声信号の音質を改善できる技術を提供できる。
【図面の簡単な説明】
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
個人
遮音材
今日
個人
歌唱補助器具
9日前
個人
音声出力装置
今日
大和ハウス工業株式会社
音低減設備
10日前
DIC株式会社
吸音材及び吸音部品
11日前
NOK株式会社
吸音構造体
2日前
矢崎総業株式会社
車両用対話システム
1日前
横浜ゴム株式会社
多層空洞音響材
今日
株式会社第一興商
カラオケ装置
1日前
有限会社 宮脇工房
モーター挙動音発生装置
9日前
株式会社コルグ
楽音信号変換装置、楽音信号変換方法、プログラム
3日前
株式会社枚方技研
方向付き楽器固定具
1日前
株式会社デンソー
制御装置、ロボットシステム、制御方法、及び制御プログラム
8日前
パイオニア株式会社
効果音出力装置
10日前
エムケイ無線事業協同組合
音声応答システム、及びそれを利用した応答方法
10日前
ピクシーダストテクノロジーズ株式会社
遮音ユニット、遮音構造体、および区画設備
2日前
ヤマハ株式会社
音響信号処理装置、楽器、音響信号処理方法および音響信号処理プログラム
11日前
カシオ計算機株式会社
電子鍵盤楽器
2日前
株式会社トランストロン
アクティブノイズ制御装置、アクティブノイズ制御方法及びアクティブノイズ制御プログラム
8日前
パナソニックオートモーティブシステムズ株式会社
能動騒音低減装置、移動体装置、及び、能動騒音低減方法
1日前
AlphaTheta株式会社
情報処理装置
8日前
Fillgoo株式会社
楽曲配信システム、プログラム及びサーバ
10日前
ドルビー・インターナショナル・アーベー
マルチチャネル・オーディオ・コンテンツの符号化
10日前
華為技術有限公司
チャネル間位相差パラメータ符号化方法および装置
今日
フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
符号化されたオーディオ信号を復号するためのデコーダおよびオーディオ信号を符号化するためのエンコーダ
10日前
個人
血液中の赤血球に結合したエンドトキシン測定のための試料作製法
1日前
サン電子工業株式会社
電解コンデンサ
14日前
他の特許を見る