TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025090076
公報種別公開特許公報(A)
公開日2025-06-17
出願番号2023205061
出願日2023-12-05
発明の名称情報処理装置、情報処理方法、およびプログラム
出願人ソニーグループ株式会社
代理人個人,個人,個人
主分類G10L 25/78 20130101AFI20250610BHJP(楽器;音響)
要約【課題】デバイスの装着者による発話の検出率を向上させる。
【解決手段】本技術の情報処理装置は、デバイスの装着者の発話に関する物理量を検出するセンサで取得されたセンサ信号と、センサ信号に基づいて発話の有無を検出する発話検出機能による発話の有無の検出結果とに基づいて、発話検出機能のキャリブレーションを行うキャリブレーション部を備える。本技術は、例えば、装着者の発話検出を行うイヤホンに適用することができる。
【選択図】図12
特許請求の範囲【請求項1】
デバイスの装着者の発話に関する物理量を検出するセンサで取得されたセンサ信号と、前記センサ信号に基づいて前記発話の有無を検出する発話検出機能による前記発話の有無の検出結果とに基づいて、前記発話検出機能のキャリブレーションを行うキャリブレーション部を備える
情報処理装置。
続きを表示(約 890 文字)【請求項2】
前記デバイスは、前記装着者の耳に装着される
請求項1に記載の情報処理装置。
【請求項3】
前記センサは、前記発話により生じる振動を検出する加速度センサである
請求項1に記載の情報処理装置。
【請求項4】
前記発話検出機能においては、学習モデルが用いられることにより前記発話の有無の検出が行われ、
前記キャリブレーションは、前記センサ信号に対する前処理のパラメータの調整を含み、
前記前処理は、前記学習モデルに入力するための情報を前記センサ信号に基づいて生成する処理を含む
請求項1に記載の情報処理装置。
【請求項5】
前記前処理は、3軸の前記センサ信号にそれぞれ重み付けして合成することで、前記学習モデルに入力するための、特定方向の振動を示す情報を生成する
請求項4に記載の情報処理装置。
【請求項6】
前記キャリブレーション部は、前記デバイスの外部の装置に備えられる
請求項4に記載の情報処理装置。
【請求項7】
前記キャリブレーション部は、前記デバイスの外部の装置により提示されたガイドに従って前記装着者が行った前記発話に関する前記物理量の検出結果を示す前記センサ信号と、前記発話検出機能による、前記ガイドに従って前記装着者が行った前記発話の有無の検出結果とに基づいて、前記キャリブレーションを行う
請求項6に記載の情報処理装置。
【請求項8】
前記キャリブレーション部は、前記デバイスに備えられる
請求項4に記載の情報処理装置。
【請求項9】
前記キャリブレーション部は、前記前処理に用いられる前記パラメータを、複数の候補の中から選択する
請求項8に記載の情報処理装置。
【請求項10】
前記キャリブレーションは、前記発話の有無の検出に用いられる学習モデルの再学習を含む
請求項1に記載の情報処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本技術は、情報処理装置、情報処理方法、およびプログラムに関し、特に、デバイスの装着者による発話の検出率を向上させることができるようにした情報処理装置、情報処理方法、およびプログラムに関する。
続きを表示(約 1,400 文字)【背景技術】
【0002】
イヤホン(インナーイヤーヘッドホン)、TWS(True Wireless Stereo)、補聴器などのユーザが耳に装着するデバイスのUX(User Experience)を改善するための技術が多く開発されている。特許文献1には、イヤホンから再生される音質を改善するのに良好な装着状態を装着者に報知する技術が記載されている。また、デバイスのUXを改善するために、デバイスでの環境検出の需要が高まっている。
【0003】
例えば、イヤホンの装着者が発話すると、イヤホンが装着者の発話を検出し、再生している楽曲をミュートしたり、外音を取り込むモードに遷移したりする。装着者がスマートフォンなどを制御しなくても、イヤホンが、装着者の発話の有無に応じてシームレスに各種の機能を実行することで、装着者はイヤホンを装着しながら例えば目の前の人物と会話をすることができる。
【先行技術文献】
【特許文献】
【0004】
特開2020-150320号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
装着者の発話は、例えば、イヤホンに搭載されたマイク(マイクロフォン)で取得される音声信号やセンサで取得されるセンサ信号に基づいて検出される。装着者の発話を精度よく検出するためには、マイクロフォンやセンサで取得される信号のS/N(Signal-to-Noise ratio)を高くすることが重要である。
【0006】
例えば、装着者の発話により生じる振動を加速度センサで検出する場合、当該振動は頭部内を伝搬してイヤホンに到達するため、加速度信号のS/Nが、個人差やイヤホンの装着方法によって大きく変わる。個人ごとの加速度信号の平均値に基づいて、発話検出に用いられるパラメータを決めることで、平均的な装着者による発話の検出率を向上させることができるが、平均から外れた装着者による発話の検出率は低下する。
【0007】
特許文献1に記載の技術では、装着者の発話により生じ、頭部内を伝搬してイヤホンに到達した振動の検出結果を示す加速度信号のS/Nを改善することができない。
【0008】
本技術はこのような状況に鑑みてなされたものであり、デバイスの装着者による発話の検出率を向上させることができるようにするものである。
【課題を解決するための手段】
【0009】
本技術の第1の側面の情報処理装置は、デバイスの装着者の発話に関する物理量を検出するセンサで取得されたセンサ信号と、前記センサ信号に基づいて前記発話の有無を検出する発話検出機能による前記発話の有無の検出結果とに基づいて、前記発話検出機能のキャリブレーションを行うキャリブレーション部を備える。
【0010】
本技術の第1の側面の情報処理方法は、情報処理装置が、デバイスの装着者の発話に関する物理量を検出するセンサで取得されたセンサ信号と、前記センサ信号に基づいて前記発話の有無を検出する発話検出機能による前記発話の有無の検出結果とに基づいて、前記発話検出機能のキャリブレーションを行う。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

三井化学株式会社
吸音構造体
3日前
個人
弦楽器用押弦補助具及び弦楽器
8日前
三井化学株式会社
遮音構造体
8日前
三井化学株式会社
遮音構造体
8日前
三井化学株式会社
遮音構造体
15日前
林テレンプ株式会社
防音カバー
8日前
株式会社ドクター中松創研
歌及び歌の制作方法
18日前
株式会社総合車両製作所
吸音パネル
2日前
株式会社JVCケンウッド
車載装置
9日前
個人
電気自動車等の「接近音」における最適な「音の種類」
11日前
株式会社HOWA
遮音構造
15日前
カシオ計算機株式会社
楽器
15日前
株式会社JVCケンウッド
情報処理装置及び情報処理方法
3日前
株式会社第一興商
カラオケ装置
2日前
個人
電子管楽器
8日前
株式会社第一興商
カラオケ装置
3日前
株式会社コルグ
電子楽器用アナログエフェクタ
1日前
ヤマハ株式会社
発音制御装置
9日前
川上産業株式会社
吸音シート
22日前
トヨタ自動車株式会社
電気自動車
10日前
AOBAENERGY株式会社
サービス提供機器
8日前
トヨタ自動車株式会社
音響式遮音材の製造方法
9日前
井関農機株式会社
作業車の操縦者用騒音低減装置
2日前
ローランド株式会社
鍵盤装置および押鍵情報の検出方法
3日前
日本電波工業株式会社
音声再生装置及び音声再生方法
2日前
ローランド株式会社
鍵盤装置および鍵の揺動の規制方法
3日前
ローランド株式会社
鍵盤装置および押鍵情報の検出方法
3日前
株式会社パトライト
メール読み上げテキスト生成プログラム
22日前
ブラザー工業株式会社
カラオケシステム、及び、カラオケ装置
3日前
ヤマハ株式会社
音響測定装置、音響測定方法および音響測定プログラム
9日前
カシオ計算機株式会社
音響処理装置、音響処理システム、音響処理方法及びプログラム
16日前
株式会社丸高工業
防音板及びその附属品
3日前
トヨタ自動車株式会社
車両管理システム及び電気自動車
10日前
株式会社石森管楽器
リガチャーおよび楽器
1日前
ブラザー工業株式会社
カラオケシステム、カラオケ装置、及びカラオケ装置用のプログラム
2日前
ヤマハ株式会社
音響処理方法、音響処理システムおよびプログラム
22日前
続きを見る