TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025134096
公報種別公開特許公報(A)
公開日2025-09-17
出願番号2024031770
出願日2024-03-04
発明の名称コンテンツボイス/サウンド処理装置、コンテンツボイス/サウンド再生装置、コンテンツボイス/サウンド処理方法、ならびに、コンテンツボイス/サウンド処理プログラムおよびそれが記録された記録媒体
出願人シャープ株式会社
代理人個人,個人
主分類G06F 3/16 20060101AFI20250909BHJP(計算;計数)
要約【課題】音声の認識の誤りを抑制しながら、コンテンツの視聴の満足度の低下を抑制する。
【解決手段】コンテンツボイス/サウンド処理装置は、人の音声がヒューマンボイス入力部によって入力されたヒューマンボイス信号に基づいて人の音声を認識するヒューマンボイス認識部と、コンテンツ入力部から入力されたコンテンツ信号に基づいて再生されているコンテンツのジャンルを判定するジャンル判定部と、コンテンツの再生によってコンテンツボイス/サウンド出力部が出力するコンテンツボイスおよびコンテンツボイス以外のコンテンツサウンドの少なくともいずれか一方を制御するコンテンツボイス/サウンド処理部と、を備え、コンテンツボイス/サウンド処理部は、コンテンツボイスまたはコンテンツサウンドのいずれか一方の人による聞き取り易さの低下を抑制するように、コンテンツボイスおよび前記コンテンツサウンドの少なくともいずれか一方の音量の大きさを変更する。
【選択図】図3
特許請求の範囲【請求項1】
人の音声がヒューマンボイス入力部によって入力されたヒューマンボイス信号に基づいて前記人の音声を認識するヒューマンボイス認識部と、
コンテンツ入力部から入力されたコンテンツ信号に基づいて再生されているコンテンツのジャンルを判定するジャンル判定部と、
前記コンテンツの再生によってコンテンツボイス/サウンド出力部が出力するコンテンツボイスおよび前記コンテンツボイス以外のコンテンツサウンドの少なくともいずれか一方を制御するコンテンツボイス/サウンド処理部と、を備え、
前記コンテンツボイス/サウンド処理部は、前記コンテンツボイスまたは前記コンテンツサウンドのいずれか一方の人による聞き取り易さの低下を抑制するように、前記コンテンツボイスおよび前記コンテンツサウンドの少なくともいずれか一方の音量の大きさを変更する、
コンテンツボイス/サウンド処理装置。
続きを表示(約 2,600 文字)【請求項2】
前記コンテンツボイス/サウンド処理部は、前記ヒューマンボイス認識部が前記人の音声を認識している期間において、前記ジャンル判定部により判定された前記ジャンルに基づいて、前記コンテンツボイスおよび前記コンテンツサウンドの全体の音量を低下させ、かつ、前記コンテンツボイスまたは前記コンテンツサウンドのいずれか一方の人による聞き取り易さの低下を抑制するように、前記コンテンツボイスおよび前記コンテンツサウンドの少なくともいずれか一方の音量の大きさを変更する、
請求項1に記載のコンテンツボイス/サウンド処理装置。
【請求項3】
前記コンテンツボイスの周波数と前記コンテンツサウンドの周波数とが識別され得るものであり、
前記コンテンツボイス/サウンド処理部は、前記ヒューマンボイス認識部が前記人の音声を認識している期間において、前記ジャンル判定部により判定された前記ジャンルが前記コンテンツサウンドの重要度よりも前記コンテンツボイスの重要度が高いジャンルであれば、前記コンテンツボイスおよび前記コンテンツサウンドの全体の音量を低下させ、かつ、前記コンテンツボイスの周波数レベルを前記コンテンツサウンドの周波数レベルに対して相対的に増加させる、
請求項2に記載のコンテンツボイス/サウンド処理装置。
【請求項4】
前記コンテンツボイスの周波数と前記コンテンツサウンドの周波数とが識別され得るものであり、
前記コンテンツボイス/サウンド処理部は、前記ヒューマンボイス認識部が前記人の音声を認識している期間において、前記ジャンル判定部により判定された前記ジャンルが前記コンテンツボイスの重要度よりも前記コンテンツサウンドの重要度が高いジャンルであれば、前記コンテンツボイスおよび前記コンテンツサウンドの全体の音量を低下させ、かつ、前記コンテンツサウンドの周波数レベルを前記コンテンツボイスの周波数レベルに対して相対的に増加させる、
請求項2に記載のコンテンツボイス/サウンド処理装置。
【請求項5】
前記コンテンツボイスのグループと前記コンテンツサウンドのグループとが識別され得るものであり、
前記コンテンツボイス/サウンド処理部は、前記ヒューマンボイス認識部が前記人の音声を認識している期間において、前記ジャンル判定部により判定された前記ジャンルが前記コンテンツサウンドの重要度よりも前記コンテンツボイスの重要度が高いジャンルであれば、前記コンテンツボイスおよび前記コンテンツサウンドの全体の音量を低下させ、かつ、前記コンテンツボイスのグループの音量を前記コンテンツサウンドのグループの音量に対して相対的に増加させる、
請求項2に記載のコンテンツボイス/サウンド処理装置。
【請求項6】
前記コンテンツボイスのグループと前記コンテンツサウンドのグループとが識別され得るものであり、
前記コンテンツボイス/サウンド処理部は、前記ヒューマンボイス認識部が前記人の音声を認識している期間において、前記ジャンル判定部により判定された前記ジャンルが前記コンテンツボイスの重要度よりも前記コンテンツサウンドの重要度が高いジャンルであれば、前記コンテンツボイスおよび前記コンテンツサウンドの全体の音量を低下させ、かつ、前記コンテンツサウンドのグループの音量を前記コンテンツボイスのグループの音量に対して相対的に増加させる、
請求項2に記載のコンテンツボイス/サウンド処理装置。
【請求項7】
前記コンテンツボイス/サウンド処理部は、前記ヒューマンボイス認識部が前記人の音声を認識している期間が終了すれば、前記コンテンツボイスおよび前記コンテンツサウンドの少なくともいずれか一方の音量の大きさを、前記コンテンツボイスおよび前記コンテンツサウンドの少なくともいずれか一方の音量の大きさを変更する前の大きさに戻す、
請求項2に記載のコンテンツボイス/サウンド処理装置。
【請求項8】
前記コンテンツボイス/サウンド処理部から前記コンテンツボイスを特定可能なコンテンツボイス信号および前記コンテンツサウンドを特定可能なコンテンツサウンド信号を受信するエコーキャンセル部をさらに備え、
前記エコーキャンセル部は、前記コンテンツボイス信号および前記コンテンツサウンド信号の少なくともいずれか一方を用いて、前記ヒューマンボイス信号に混入した前記コンテンツボイスに対応するボイスノイズ信号、および、前記ヒューマンボイス信号に混入した前記コンテンツサウンドに対応するサウンドノイズ信号の少なくともいずれか一方を低減し、
前記ヒューマンボイス認識部は、前記エコーキャンセル部によって前記ボイスノイズ信号および前記サウンドノイズ信号の少なくともいずれか一方が低減された前記ヒューマンボイス信号を処理することよって、前記人の音声を認識する、
請求項2に記載のコンテンツボイス/サウンド処理装置。
【請求項9】
請求項1~8のいずれかに記載のコンテンツボイス/サウンド処理装置と、
前記コンテンツボイス/サウンド出力部としてのスピーカーと、
前記ヒューマンボイス入力部としてのマイクロフォンと、を含む
コンテンツボイス/サウンド再生装置。
【請求項10】
人の音声がヒューマンボイス入力部によって入力されたヒューマンボイス信号に基づいて前記人の音声を認識するステップと、
コンテンツ入力部から入力されたコンテンツ信号に基づいて再生されているコンテンツのジャンルを判定するステップと、
前記コンテンツの再生によってコンテンツボイス/サウンド出力部が出力するコンテンツボイスおよび前記コンテンツボイス以外のコンテンツサウンドの少なくともいずれか一方を制御するステップと、を備え、
前記少なくともいずれか一方を制御するステップにおいて、前記コンテンツボイスまたは前記コンテンツサウンドの人による聞き取り易さの低下を抑制するように、前記コンテンツボイスおよび前記コンテンツサウンドの少なくともいずれか一方の音量の大きさを変更する、
コンテンツボイス/サウンド処理方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本開示は、コンテンツボイス/サウンド処理装置、コンテンツボイス/サウンド再生装置、コンテンツボイス/サウンド処理方法、ならびに、コンテンツボイス/サウンド処理プログラムおよびそれが記録された記録媒体に関する。
続きを表示(約 1,800 文字)【背景技術】
【0002】
近年、人の音声を認識し、認識された人の音声に基づいて機器の操作が行われる技術が開発されている。そのような人の音声認識技術を利用した機器として、スマートフォン、または、テレビ受像機などのコンテンツボイス/サウンド再生装置が普及している。
【0003】
操作対象の機器が何等かのコンテンツボイスおよびコンテンツサウンドを発するスピーカーを備えた機器である場合、そのコンテンツボイスおよびコンテンツサウンドが人の音声を認識するときに雑音になる。
【0004】
通常、そのような機器が発するコンテンツボイスを特定可能なコンテンツボイス信号またはコンテンツサウンドを発するコンテンツサウンド信号と人の音声を特定可能なヒューマンボイス信号とが混在している合成信号が生成される。そのため、この合成信号から、機器が発するコンテンツボイス信号およびコンテンツサウンド信号を取り除くためにエコーキャンセルの技術が利用される。それにより、人の音声の認識の精度が向上する。
【0005】
しかしながら、上述のエコーキャンセルのためには高速の演算処理が必要であるため、処理能力に制約がある機器では、エコーキャンセル機能の能力が不十分である場合がある。また、機器にエコーキャンセル機能が搭載されていない場合も考えられる。これらの場合、人の音声の認識の精度が高くないため、音声認識に誤りが生じるおそれがある。
【0006】
そのような場合、たとえば、テレビ受像機では、特許文献1に記載のような技術が開示されている。この技術によれば、コンテンツボイスおよびコンテンツサウンドが、人の音声を認識している期間において、人の音声とともにマイクから入力されないようにする。具体的には、人の音声の認識の開始のときに、テレビ受像機等のコンテンツボイス/サウンド再生装置の出力音量の設定値を人の音声の認識の終了のときまで、所定値以下の値に低下させる。
【先行技術文献】
【特許文献】
【0007】
特開2012-181374号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
特許文献1に開示された技術によれば、人の音声の認識の処理のときに、単にスピーカーから発せられる出力音の全体の音量を低下させる。そのため、たとえば、ニュース番組を視聴しているときには、ユーザーは、キャスターの声を聞きとり難くなるため、番組の内容を理解し難くなる。また、たとえば、音楽番組を視聴しているときには、ユーザーは、スピーカーから発せられる出力音の全体の音量の一時的な低下を不快に感じる。これらのいずれの場合も、ユーザーのコンテンツの視聴の満足度が低下する。
【0009】
本開示は、上述の問題に鑑みなされたものである。本開示の目的は、音声の認識の誤りを抑制しながら、コンテンツの視聴の満足度の低下を抑制することができるコンテンツボイス/サウンド処理装置およびコンテンツボイス/サウンド再生装置を提供することである。また、本開示の目的は、コンテンツボイス/サウンド処理装置のために使用されるコンテンツボイス/サウンド処理方法、ならびに、コンテンツボイス/サウンド処理プログラムおよびそれが記録されたコンピュータ読み取り可能な記録媒体を提供することである。
【課題を解決するための手段】
【0010】
本開示の一態様のコンテンツボイス/サウンド処理装置は、人の音声がヒューマンボイス入力部によって入力されたヒューマンボイス信号に基づいて前記人の音声を認識するヒューマンボイス認識部と、コンテンツ入力部から入力されたコンテンツ信号に基づいて再生されているコンテンツのジャンルを判定するジャンル判定部と、前記コンテンツの再生によってコンテンツボイス/サウンド出力部が出力するコンテンツボイスおよび前記コンテンツボイス以外のコンテンツサウンドの少なくともいずれか一方を制御するコンテンツボイス/サウンド処理部と、を備え、前記コンテンツボイス/サウンド処理部は前記コンテンツボイスまたは前記コンテンツサウンドの人による聞き取り易さの低下を抑制するように、前記コンテンツボイスおよび前記コンテンツサウンドの少なくともいずれか一方の音量の大きさを変更する。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

シャープ株式会社
冷蔵庫
12日前
シャープ株式会社
冷蔵庫
4日前
シャープ株式会社
表示装置
5日前
シャープ株式会社
加熱調理器
4日前
シャープ株式会社
画像形成装置
4日前
シャープ株式会社
画像形成装置
4日前
シャープ株式会社
画像形成装置
12日前
シャープ株式会社
ファクシミリ装置
5日前
シャープ株式会社
電子部品の筐体構造
12日前
シャープ株式会社
スタンド及び表示装置
6日前
シャープ株式会社
画像形成装置の定着装置
12日前
シャープ株式会社
情報処理装置及び表示方法
4日前
シャープ株式会社
集塵装置および電気掃除機
13日前
シャープ株式会社
原稿送り装置及び画像形成装置
4日前
シャープ株式会社
原稿搬送装置および画像形成装置
5日前
シャープ株式会社
端末装置、方法、および、集積回路
13日前
シャープ株式会社
表示装置、及び表示装置の制御方法
4日前
シャープ株式会社
カバー部材取付構造および表示装置
4日前
シャープ株式会社
端末装置、基地局装置および通信方法
4日前
シャープ株式会社
端末装置、基地局装置および通信方法
4日前
シャープ株式会社
表示装置、および表示装置の制御方法
4日前
シャープ株式会社
通信装置およびネットワークシステム
13日前
シャープ株式会社
通信装置および通信装置の取り付け方法
13日前
シャープ株式会社
UE(User Equipment)
5日前
シャープ株式会社
UE(User Equipment)
5日前
シャープ株式会社
収納庫、引き出し及び引き出しの製造方法
12日前
シャープ株式会社
画像形成装置及び画像形成装置の制御方法
12日前
シャープ株式会社
端末装置、基地局装置、および、通信方法
5日前
シャープ株式会社
画像形成装置及び画像形成装置の制御方法
6日前
シャープ株式会社
端末装置、基地局装置、および、通信方法
13日前
シャープ株式会社
受信装置、放送システム、および、受信方法
6日前
シャープ株式会社
光触媒物質塗布材及び光触媒物質の塗布方法
4日前
シャープ株式会社
3Dデータ復号装置および3Dデータ符号化装置
4日前
シャープ株式会社
3Dデータ復号装置および3Dデータ符号化装置
4日前
シャープ株式会社
3Dデータ復号装置および3Dデータ符号化装置
4日前
シャープ株式会社
情報処理装置、情報処理方法、及び情報処理システム
4日前
続きを見る