TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025063024
公報種別公開特許公報(A)
公開日2025-04-15
出願番号2024210542,2022199629
出願日2024-12-03,2019-10-23
発明の名称オーディオ特性の解析に基づいてオーディオ再生設定を調節するための方法及び装置
出願人グレースノート インコーポレイテッド
代理人個人,個人,個人
主分類G10L 21/0364 20130101AFI20250408BHJP(楽器;音響)
要約【課題】オーディオ特性の解析に基づいてオーディオ再生設定を調節するための方法、コンピューティングシステム及び非一時的コンピュータ可読記憶媒体を提供する。
【解決手段】車両のメディアユニット106は、ニューラルネットワークへの、オーディオ信号のサンプルの表現を含む等化(EQ)照会を生成するためのEQモデル照会ジェネレータと、EQ照会に基づいて、ニューラルネットワークによって決定された複数のオーディオ再生設定にアクセスし、複数のオーディオ再生設定に基づいて、オーディオ信号に適用するためのEQフィルタ係数を決定するためのEQフィルタ設定アナライザと、第1の持続時間にオーディオ信号に前記フィルタ係数を適用するためのEQ調節インプリメンタと、を含む。
【選択図】図2
特許請求の範囲【請求項1】
コンピューティングシステムであって、
プロセッサと、
前記プロセッサにより実行されたときに、動作のセットの実行をさせるプログラム命令を記憶した非一時的コンピュータ可読記憶媒体と、を含み、
前記動作のセットは、
等化調節をオーディオ信号に適用して等化後オーディオ信号を生成することと、
前記等化後オーディオ信号の周波数表現における不規則性を検出することであって、前記不規則性はしきい値を超える周波数値のセット間の音量の変化に対応する、検出することと、
前記不規則性を低減するために前記周波数値のセットの第1の周波数値における音量を調整することと、
コンピューティングシステム。
続きを表示(約 1,500 文字)【請求項2】
前記周波数値のセットは、隣り合う周波数値を含む、請求項1に記載のコンピューティングシステム。
【請求項3】
前記動作のセットは、
前記オーディオ信号の前記周波数表現のセットにおける前記隣り合う周波数値を選択することと、
前記隣り合う周波数値に関連付けられた音量値を決定することと、
前記隣り合う周波数値の間の前記音量の変化を決定することと、
前記音量の変化の絶対値が前記しきい値を超えると決定したことに応じて、前記隣り合う周波数値のうちの前記第1の周波数値における音量を調整して、前記不規則性を低減することと、を含む、
請求項2に記載のコンピューティングシステム。
【請求項4】
前記音量の変化は、前記周波数値のセットにわたる音量の2次導関数の値により表される、
請求項1に記載のコンピューティングシステム。
【請求項5】
前記第1の周波数値は、前記周波数値のセットの中心値であり、前記動作のセットは、
前記第1の周波数値における前記音量を、前記周波数値のセットの他の周波数値における音量レベル間の中間点になるように調整すること、を含む、
請求項1に記載のコンピューティングシステム。
【請求項6】
前記不規則性は、前記オーディオ信号内に知覚可能なアーチファクトをもたらし得る、前記周波数値のセットにわたる音量値の短期ピークまたは短期ディップのうちの少なくとも一つに対応する、
請求項1に記載のコンピューティングシステム。
【請求項7】
前記しきい値は第1のしきい値であり、前記動作のセットは、
前記オーディオ信号の前記周波数表現における残りの不規則性の数が第2のしきい値を満たすまで、前記オーディオ信号の前記周波数表現における少なくとも一つの追加の不規則性を検出および低減することと、を含む、
請求項1に記載のコンピューティングシステム。
【請求項8】
プロセッサにより実行されたときに、動作のセットの実行をさせるプログラム命令を記憶した非一時的コンピュータ可読記憶媒体であって、
前記動作のセットは、
等化調節をオーディオ信号に適用して等化後オーディオ信号を生成することと、
前記等化後オーディオ信号の周波数表現における不規則性を検出することであって、前記不規則性はしきい値を超える周波数値の間の音量の変化に対応する、検出することと、
前記不規則性を低減するために前記周波数値の第1の周波数値における音量を調整することと、を含む、
非一時的コンピュータ可読記憶媒体。
【請求項9】
前記周波数値のセットは、隣り合う周波数値を含む、請求項8に記載の非一時的コンピュータ可読記憶媒体。
【請求項10】
前記命令が実行されたときに、前記動作のセットは、
前記オーディオ信号の前記周波数表現における前記隣り合う周波数値を選択することと、
前記隣り合う周波数値に関連付けられた音量値を決定することと、
前記音量の変化を決定することと、
前記音量の変化の絶対値が前記しきい値を超えると決定したことに応じて、前記隣り合う周波数値のうちの前記第1の周波数値における音量を調整して、前記不規則性を低減することと、を含む、
請求項9に記載の非一時的コンピュータ可読記憶媒体。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
[0002]本開示は、一般にはオーディオ再生設定に関し、より詳細には、オーディオ特性の解析に基づいてオーディオ再生設定を調節するための方法及び装置に関する。
続きを表示(約 4,900 文字)【関連出願】
【0002】
[0001]本特許は、2018年10月24日に出願された米国特許仮出願第62/750,113号、2019年3月11日に出願された米国特許仮出願第62/816,813号、2019年3月11日に出願された米国特許仮出願第62/816,823号及び2019年5月20日に出願された米国特許仮出願第62/850,528号の特典を主張する出願から生じるものである。米国特許仮出願第62/750,113号、米国特許仮出願第62/816,813号、米国特許仮出願第62/816,823号及び米国特許仮出願第62/850,528号は、参照によりその全体が本明細書に組み込まれる。米国特許仮出願第62/750,113号、米国特許仮出願第62/816,813号、米国特許仮出願第62/816,823号、米国特許仮出願第62/850,528号の優先権が本明細書によって主張される。
【背景技術】
【0003】
[0003]近年、様々な特性の多数のメディアが、ますます多くのチャネルを使用して配信されている。メディアは、従来のチャネル(たとえば、ラジオ、携帯電話など)を使用して、又はインターネット接続されたストリーミングデバイスを使用するなど、最近開発されたチャネルを使用して受信することができる。これらのチャネルが開発されるにつれて、複数のソースからのオーディオを処理し、出力することのできるシステムも開発されてきた。これらのオーディオ信号は様々な特性(たとえば、ダイナミックレンジ、音量など)を有することがある。たとえば、ある自動車メディアシステムは、コンパクトディスク(CD)、ブルートゥース(Bluetooth)(登録商標)接続デバイス、ユニバーサルシリアルバス(USB)接続デバイス、Wi-Fi接続デバイス、補助入力及び他のソースからメディアを配信することができる。
【図面の簡単な説明】
【0004】
メディア特性のリアルタイム解析に基づく動的再生設定調節のための本開示の教示に従って構築された例示的環境を示すブロック図である。
本開示の教示の少なくとも第1の実装、第2の実装及び第3の実装によるオーディオ等化のための技法を実施するための、図1のメディアユニットの追加の詳細を示すブロック図である。
第2の実装による、図1のコンテンツプロファイルエンジンの追加の詳細を示すブロック図である。
図1のオーディオ等化(EQ)エンジンの追加の詳細を示すブロック図である。
第1の実装による、メディア特性のリアルタイム解析に基づいてメディア再生設定を動的に調節するように図1及び2のメディアユニットを実装するために実行することのできる例示的機械可読命令を表すフローチャートである。
等化設定をパーソナライズするように図1及び2のメディアユニット106を実装するために実行することのできる例示的機械可読命令を表すフローチャートである。
第1の実装による、EQニューラルネットワークをトレーニングするようにオーディオEQエンジンを実装するために実行することのできる例示的機械可読命令を表すフローチャートである。
第1の実装による、オーディオ特性のリアルタイム解析に基づく動的オーディオ再生設定調節を受けたが、平滑化フィルタを用いていないオーディオ信号の第1のスペクトログラムである。
図8Aの第1のスペクトログラムについての周波数値に対する平均利得値を示すプロットである。
第1の実装による、平滑化フィルタを含む、オーディオ特性のリアルタイム解析に基づく動的オーディオ再生設定調節を受けたオーディオ信号の第2のスペクトログラムである。
図9Aの第2のスペクトログラムの周波数値に対する平均利得値を示すプロットである。
第2の実装による、再生デバイスにコンテンツのストリームと共にプロファイル情報を配信するように図1及び3のコンテンツプロファイルエンジンを実装するために実行することのできる例示的機械可読命令を表すフローチャートである。
第2の実装による、修正後再生設定を使用してコンテンツを再生するように図1及び2のメディアユニットを実装するために実行することのできる例示的機械可読命令を表すフローチャートである。
第2の実装による、コンテンツに関連付けられるプロファイル情報に基づいて再生設定を調節するように図1及び2のメディアユニットを実装するために実行することのできる例示的機械可読命令を表すフローチャートである。
本開示の教示による例示的コンテンツプロファイルのブロック図である。
本開示の教示による例示的コンテンツプロファイルのブロック図である。
第3の実装による、リアルタイムオーディオ等化を実施するように図1及び2のメディアユニットを実装するために実行することのできる機械可読命令を表すフローチャートである。
第3の実装による、等化曲線を平滑化するように図1及び2のメディアユニットを実装するために実行することのできる機械可読命令を表すフローチャートである。
第3の実装による、データセットを集めて、基準オーディオ信号に基づいてニューラルネットワークをトレーニング及び/又は確認するように図1及び4のオーディオEQエンジンを実装するために実行することのできる機械可読命令を表すフローチャートである。
図15に関連して示され、説明される平滑化技法を実施する前の等化後オーディオ信号の例示的表現である。
第3の実装による、図15に関連して示され、説明される平滑化技法を実施した後の図17Aのオーディオ信号の例示的表現である。
図1及び2のメディアユニットを実装するために図5、6、11、12、14及び15の命令を実行するように構築された例示的な第1の処理プラットフォームのブロック図である。
図1及び4のオーディオEQエンジンを実装するために図7及び16の命令を実行するための例示的な第2の処理プラットフォーム構造のブロック図である。
図1及び3のコンテンツプロファイルエンジンを実装するために図10の命令を実行するための例示的な第2の処理プラットフォーム構造のブロック図である。
【発明を実施するための形態】
【0005】
[0027]一般には、図面(複数可)及び添付の明細書全体にわたって、同一又は類似の部分を参照するために同一の参照番号が使用される。
【0006】
[0028]従来のメディア処理実装では、異なるメディアに関連付けられるオーディオ信号は、異なる特性を有することがある。たとえば、異なるオーディオトラックは、異なる周波数プロファイル(たとえば、オーディオ信号の異なる周波数での様々な音量レベル)、異なる全音量(たとえば、平均音量)、ピッチ、音色などを有することがある。たとえば、あるCDのメディアは、別のCDのメディアとは異なって記録及び/又はマスタリングされることがある。同様に、ストリーミングデバイスから検索されたメディアは、CDなどの非圧縮媒体から検索されたメディアとは著しく異なるオーディオ特性を有することがあり、異なるアプリケーション及び/又はオーディオ圧縮レベルを介して同一のデバイスから検索されたメディアとも異なることがある。ユーザが様々な異なるソース並びに様々なジャンル及びタイプのメディアをますます聴取するにつれて、ソース間のオーディオ特性の違い、及び同一のソースのメディア間のオーディオ特性の違いが非常に顕著になることがあり、潜在的には聴取者にとっていらいらさせられるものとなることがある。オーディオ等化は、オーディオ信号中の異なる周波数の音量レベルを調節するために利用される技法である。たとえば、音楽のジャンル、音楽の年代、ユーザプリファレンス、オーディオ信号が出力される空間などに関連付けられるプリファレンスに基づいて、低周波数信号、中間周波数信号及び/又は高周波数信号の存在を増大させるために等化を実施することができる。しかしながら、最適な、又は好ましい等化設定は、提示されているメディアに応じて変動することがある。したがって、聴取者は、メディアの変化(たとえば、ジャンルの変化、年代の変化、トラックの全音量の変化など)に基づいて聴取体験を最適化するために等化設定を頻繁に調節する必要があることがある。
【0007】
[0029]いくつかの従来の手法では、特定のジャンル又はタイプの音楽に関連付けられる等化設定を選択することができる。たとえば、車両のメディアユニットでは、ロック音楽の典型的特性に基づいて、大きく聞こえることをユーザが望むことがある周波数をブーストし、非常に強いことがある他の周波数をカットするように構成される「ロック」用のイコライザを聴取者が選択できることがある。しかしながら、そのようなジャンル特有の広く適用される等化設定は、異なる歌の間の著しい違いに対処することができず、さらに、ラジオ局及びオーディオストリーミングアプリケーションでしばしば生じる、ユーザが異なるジャンルの新しいトラックを開始するときに、ユーザが等化設定を手動で変更することを依然として必要とする。
【0008】
[0030]第1の実装では、本明細書で開示される例示的方法、装置、システム及び製造品が、オーディオ信号のリアルタイム特性に基づいて、オーディオ再生設定(たとえば、等化設定、音量設定など)を動的に調節する。本明細書で開示される例は、オーディオ信号のサンプル(たとえば、3秒のサンプル)の周波数表現(たとえば、CQT表現)を決定し、ニューラルネットワークに照会して、オーディオ信号に特有の等化設定を決定する。本明細書で開示されるいくつかの例では、等化設定は、複数のフィルタ(たとえば、低シェルフフィルタ、ピーキングフィルタ、高シェルフフィルタなど)を含み、そのうちの1つ又は複数を選択し、オーディオ信号に適用することができる。本明細書で開示される例示的方法、装置、システム及び製造品では、等化設定を出力するニューラルネットワークが、メディアに対して最適化される(たとえば、オーディオエンジニアによって決定される)複数の等化プロファイルに対応する基準メディアのライブラリを使用してトレーニングされる。
【0009】
[0031]第1の実装では、本明細書で開示される例示的方法、装置、システム及び製造品が、定期的に(たとえば、毎秒)ニューラルネットワークに対して(たとえば、3秒のオーディオを含む)オーディオサンプルを照会して、プロファイルについての等化設定を決定し、経時的なオーディオ信号の変化(たとえば、異なる特性を有するトラックの異なる部分、曲の遷移、ジャンルの遷移など)を補償する。本明細書で開示される例示的方法、装置、システム及び製造品は、フィルタ設定間を遷移するために平滑化フィルタ(たとえば、指数平滑化アルゴリズム、一極巡回型平滑化フィルタなど)を利用して、等化設定の知覚できる変化を回避する。
【0010】
[0032]さらに、前処理されたプロファイル情報を使用してコンテンツの再生を修正するための例示的方法、システム及び製造品が、第2の実装に従って説明される。例示的方法、システム及び製造品は、再生デバイスに配信すべきコンテンツのストリームにアクセスし、再生デバイスに配信すべきコンテンツのストリーム内の1つのコンテンツを特定し、特定した1つのコンテンツについてのプロファイルを決定し、決定したプロファイルを再生デバイスに配信する。これらの動作を自動的に(たとえば、リアルタイムに)オンザフライで実施することができる。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
リアルタイム翻訳システム
5日前
株式会社SOU
保護具
18日前
三井化学株式会社
防音構造
12日前
三井化学株式会社
防音構造体
13日前
三井化学株式会社
遮音構造体
19日前
東レ・セラニーズ株式会社
混繊不織布
18日前
株式会社エクシング
カラオケシステム
27日前
スマートライフサプライ合同会社
楽器スタンド
18日前
株式会社ルミカ
カード型保安用品
27日前
ヤマハ株式会社
楽器用響板および弦楽器
1か月前
トヨタ自動車株式会社
電動車両の制御装置
27日前
リオン株式会社
雑音抑制処理方法及び聴取装置
29日前
横浜ゴム株式会社
多層空洞音響材
26日前
中強光電股ふん有限公司
電子システム及びその制御方法
18日前
ヤマハ株式会社
ギターのボディ構造体およびギター
1か月前
トヨタ自動車株式会社
情報処理装置
5日前
株式会社第一興商
カラオケ装置
14日前
ドリックス株式会社
消音パネル
15日前
ヤマハ株式会社
板材、楽器及び弦楽器
1か月前
カシオ計算機株式会社
電子機器
18日前
株式会社JVCケンウッド
聴音装置、聴音方法及びプログラム
18日前
株式会社しくみ
音声翻訳プログラム
今日
株式会社第一興商
カラオケシステム
28日前
本田技研工業株式会社
車載音響制御装置
1か月前
カシオ計算機株式会社
電子鍵盤楽器
18日前
アルプスアルパイン株式会社
能動騒音制御システム
27日前
本田技研工業株式会社
能動型騒音低減装置
1か月前
ソフトバンクグループ株式会社
システム
15日前
ソフトバンクグループ株式会社
システム
14日前
ソフトバンクグループ株式会社
システム
14日前
ソフトバンクグループ株式会社
システム
18日前
ソフトバンクグループ株式会社
システム
14日前
ソフトバンクグループ株式会社
システム
18日前
ソフトバンクグループ株式会社
システム
14日前
ソフトバンクグループ株式会社
システム
15日前
ソフトバンクグループ株式会社
システム
15日前
続きを見る