TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025090076
公報種別
公開特許公報(A)
公開日
2025-06-17
出願番号
2023205061
出願日
2023-12-05
発明の名称
情報処理装置、情報処理方法、およびプログラム
出願人
ソニーグループ株式会社
代理人
個人
,
個人
,
個人
主分類
G10L
25/78 20130101AFI20250610BHJP(楽器;音響)
要約
【課題】デバイスの装着者による発話の検出率を向上させる。
【解決手段】本技術の情報処理装置は、デバイスの装着者の発話に関する物理量を検出するセンサで取得されたセンサ信号と、センサ信号に基づいて発話の有無を検出する発話検出機能による発話の有無の検出結果とに基づいて、発話検出機能のキャリブレーションを行うキャリブレーション部を備える。本技術は、例えば、装着者の発話検出を行うイヤホンに適用することができる。
【選択図】図12
特許請求の範囲
【請求項1】
デバイスの装着者の発話に関する物理量を検出するセンサで取得されたセンサ信号と、前記センサ信号に基づいて前記発話の有無を検出する発話検出機能による前記発話の有無の検出結果とに基づいて、前記発話検出機能のキャリブレーションを行うキャリブレーション部を備える
情報処理装置。
続きを表示(約 890 文字)
【請求項2】
前記デバイスは、前記装着者の耳に装着される
請求項1に記載の情報処理装置。
【請求項3】
前記センサは、前記発話により生じる振動を検出する加速度センサである
請求項1に記載の情報処理装置。
【請求項4】
前記発話検出機能においては、学習モデルが用いられることにより前記発話の有無の検出が行われ、
前記キャリブレーションは、前記センサ信号に対する前処理のパラメータの調整を含み、
前記前処理は、前記学習モデルに入力するための情報を前記センサ信号に基づいて生成する処理を含む
請求項1に記載の情報処理装置。
【請求項5】
前記前処理は、3軸の前記センサ信号にそれぞれ重み付けして合成することで、前記学習モデルに入力するための、特定方向の振動を示す情報を生成する
請求項4に記載の情報処理装置。
【請求項6】
前記キャリブレーション部は、前記デバイスの外部の装置に備えられる
請求項4に記載の情報処理装置。
【請求項7】
前記キャリブレーション部は、前記デバイスの外部の装置により提示されたガイドに従って前記装着者が行った前記発話に関する前記物理量の検出結果を示す前記センサ信号と、前記発話検出機能による、前記ガイドに従って前記装着者が行った前記発話の有無の検出結果とに基づいて、前記キャリブレーションを行う
請求項6に記載の情報処理装置。
【請求項8】
前記キャリブレーション部は、前記デバイスに備えられる
請求項4に記載の情報処理装置。
【請求項9】
前記キャリブレーション部は、前記前処理に用いられる前記パラメータを、複数の候補の中から選択する
請求項8に記載の情報処理装置。
【請求項10】
前記キャリブレーションは、前記発話の有無の検出に用いられる学習モデルの再学習を含む
請求項1に記載の情報処理装置。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本技術は、情報処理装置、情報処理方法、およびプログラムに関し、特に、デバイスの装着者による発話の検出率を向上させることができるようにした情報処理装置、情報処理方法、およびプログラムに関する。
続きを表示(約 1,400 文字)
【背景技術】
【0002】
イヤホン(インナーイヤーヘッドホン)、TWS(True Wireless Stereo)、補聴器などのユーザが耳に装着するデバイスのUX(User Experience)を改善するための技術が多く開発されている。特許文献1には、イヤホンから再生される音質を改善するのに良好な装着状態を装着者に報知する技術が記載されている。また、デバイスのUXを改善するために、デバイスでの環境検出の需要が高まっている。
【0003】
例えば、イヤホンの装着者が発話すると、イヤホンが装着者の発話を検出し、再生している楽曲をミュートしたり、外音を取り込むモードに遷移したりする。装着者がスマートフォンなどを制御しなくても、イヤホンが、装着者の発話の有無に応じてシームレスに各種の機能を実行することで、装着者はイヤホンを装着しながら例えば目の前の人物と会話をすることができる。
【先行技術文献】
【特許文献】
【0004】
特開2020-150320号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
装着者の発話は、例えば、イヤホンに搭載されたマイク(マイクロフォン)で取得される音声信号やセンサで取得されるセンサ信号に基づいて検出される。装着者の発話を精度よく検出するためには、マイクロフォンやセンサで取得される信号のS/N(Signal-to-Noise ratio)を高くすることが重要である。
【0006】
例えば、装着者の発話により生じる振動を加速度センサで検出する場合、当該振動は頭部内を伝搬してイヤホンに到達するため、加速度信号のS/Nが、個人差やイヤホンの装着方法によって大きく変わる。個人ごとの加速度信号の平均値に基づいて、発話検出に用いられるパラメータを決めることで、平均的な装着者による発話の検出率を向上させることができるが、平均から外れた装着者による発話の検出率は低下する。
【0007】
特許文献1に記載の技術では、装着者の発話により生じ、頭部内を伝搬してイヤホンに到達した振動の検出結果を示す加速度信号のS/Nを改善することができない。
【0008】
本技術はこのような状況に鑑みてなされたものであり、デバイスの装着者による発話の検出率を向上させることができるようにするものである。
【課題を解決するための手段】
【0009】
本技術の第1の側面の情報処理装置は、デバイスの装着者の発話に関する物理量を検出するセンサで取得されたセンサ信号と、前記センサ信号に基づいて前記発話の有無を検出する発話検出機能による前記発話の有無の検出結果とに基づいて、前記発話検出機能のキャリブレーションを行うキャリブレーション部を備える。
【0010】
本技術の第1の側面の情報処理方法は、情報処理装置が、デバイスの装着者の発話に関する物理量を検出するセンサで取得されたセンサ信号と、前記センサ信号に基づいて前記発話の有無を検出する発話検出機能による前記発話の有無の検出結果とに基づいて、前記発話検出機能のキャリブレーションを行う。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
メガホン
1か月前
個人
グランドピアノの鍵盤支持構造
18日前
個人
音鳴らし具
22日前
NOK株式会社
吸音構造体
10日前
合同会社Bootstrap
弦楽器
29日前
三井化学株式会社
遮音構造体
1か月前
株式会社ワコール
繊維構造体
9日前
個人
補助譜面台及び補助譜面台セット
21日前
株式会社イノアックコーポレーション
防音材
23日前
株式会社大同工業所
警報器及び警報システム
10日前
三菱電機株式会社
吸音体
1か月前
旭化成株式会社
内装吸音材
1か月前
ヤマハ株式会社
情報処理方法
1か月前
トヨタ自動車株式会社
音声出力装置
18日前
ヤマハ株式会社
情報処理方法
1か月前
株式会社第一興商
カラオケ装置
11日前
株式会社第一興商
カラオケ装置
1か月前
ヤマハ株式会社
鍵盤装置
1か月前
トヨタ自動車株式会社
車両
1か月前
ヤマハ株式会社
管楽器用部品及び管楽器
17日前
TDK株式会社
振動デバイスおよびその振動方法
14日前
学校法人 工学院大学
音響拡散パネル
1か月前
川上産業株式会社
吸音シート
1日前
国立研究開発法人産業技術総合研究所
実況音声生成システム
1か月前
ヤマハ株式会社
鍵盤装置用の鍵
3日前
株式会社エクサウィザーズ
情報処理方法、プログラム及び情報処理システム
10日前
個人
メガホン
1か月前
株式会社エクシング
携帯端末用プログラム、及び、カラオケシステム
9日前
トヨタ自動車株式会社
車両用ホーンシステム
15日前
株式会社東芝
吸音装置及びパラメータ推定方法
18日前
株式会社JVCケンウッド
情報処理装置、情報処理方法、及びプログラム
1か月前
パイオニア株式会社
音声処理装置、音声処理方法、プログラム及び記憶媒体
29日前
パイオニア株式会社
音声処理装置、音声処理方法、プログラム及び記憶媒体
29日前
パイオニア株式会社
音声処理装置、音声処理方法、プログラム及び記憶媒体
29日前
株式会社 一歩
和音発生方法並びにそれに用いる単音発生具及び和音発生具
28日前
アルプスアルパイン株式会社
音場制御システム及び音場制御方法
1か月前
続きを見る
他の特許を見る