TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025027139
公報種別公開特許公報(A)
公開日2025-02-26
出願番号2024212920,2021198830
出願日2024-12-05,2021-12-07
発明の名称音声処理システム、プログラム、方法、オンライン会議システム、および音声通話装置
出願人株式会社日立ソリューションズ
代理人弁理士法人ウィルフォート国際特許事務所
主分類G10L 17/00 20130101AFI20250218BHJP(楽器;音響)
要約【課題】音声により継続的に人物の認証を行う技術を提供する。
【解決手段】音声処理システムは、特定人物の音声の特徴を表す声紋データを記憶する記憶部と、継続的な受信音声データに含まれる人物の音声を取得する受信処理部と、前記声紋データに基づいて前記取得された音声に対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する認証処理部と、を有する。
【選択図】図2
特許請求の範囲【請求項1】
特定人物の音声の特徴を表す声紋データを記憶する記憶部と、
継続的な受信音声データに含まれる人物の音声を取得する受信処理部と、
前記声紋データに基づいて前記取得された音声に対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する認証処理部と、
を有する音声処理システム。
続きを表示(約 1,700 文字)【請求項2】
前記認証結果値が所定の閾値以上である間、前記受信音声データにおける前記特定人物の音声のみの音声データまたは前記特定人物の音声を取り除いた音声データを生成する認証結果処理部を更に有する、
請求項1に記載の音声処理システム。
【請求項3】
前記記憶部は、所定の文脈を示す文脈データを更に記憶し、
前記認証結果値が所定の閾値を下回っていれば、前記受信音声データにおける音声の文脈を抽出し、前記抽出された文脈と前記文脈データに示された文脈とが一致するか否かにより異なる処理を行う認証結果処理部を更に有する、
請求項1に記載の音声処理システム。
【請求項4】
所定の宛先アドレスに宛てた所定の電子メールを生成する電子メール処理部を更に有し、
前記認証結果処理部は、前記抽出された文脈と前記文脈データに示された文脈とが一致したら、前記電子メール処理部に前記電子メールを生成させる、
請求項3に記載の音声処理システム。
【請求項5】
所定の宛先アドレスに宛てた所定の電子メールを生成する電子メール処理部と、
前記認証結果値が所定の閾値を下回っていれば、前記電子メール処理部に前記電子メールを生成させる認証結果処理部と、を更に有する、
請求項1に記載の音声処理システム。
【請求項6】
前記認証処理部は、所定の継続時間だけ前記取得された音声に対して声紋認証を行い、前記継続時間が経過すると前記音声に対する声紋認証を終了する、
請求項3または5に記載の音声処理システム。
【請求項7】
前記認証結果処理部は、前記認証結果値が所定の閾値以上である間、前記受信音声データにおける前記特定人物の音声のみの音声データを生成する通過モードと、前記特定人物の音声を取り除いた音声データを生成する廃棄モードとが選択可能である、
請求項2に記載の音声処理システム。
【請求項8】
コンピュータに、
特定人物の音声の特徴を表す声紋データを記憶し、
継続的な受信音声データを受信し、
前記声紋データに基づいて前記受信音声データに対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する、ことを実行させるための音声処理プログラム。
【請求項9】
コンピュータが、
特定人物の音声の特徴を表す声紋データを記憶し、
継続的な受信音声データを受信し、
前記声紋データに基づいて前記受信音声データに対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する、ことを実行する音声処理方法。
【請求項10】
通信ネットワークを介して複数の参加者が相互に音声で対話を行うためのオンライン会議システムであって、
参加者の音声を収音した音声データを加工し、他の参加者に聴取させる音声データを生成する音声処理システムを有し、
前記音声処理システムは、
特定人物の音声の特徴を表す声紋データを記憶する記憶部と、
継続的な受信音声データに含まれる人物の音声を取得する受信処理部と、
前記声紋データに基づいて前記取得された音声に対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する認証処理部と、
前記認証結果値が所定の閾値以上であるか否かに応じて前記受信音声データを加工する認証結果処理部と、を有し、
前記認証結果処理部は、前記特定人物の音声を通過させる通過モードと前記特定人物の音声を廃棄する廃棄モードとが選択可能であり、
前記通過モードでは、前記認証結果値が前記閾値以上である音声を通過させ、前記認証結果値が前記閾値を下回っている音声を所定条件を満たせば通過させ、
前記廃棄モードでは、前記認証結果値が前記閾値以上である音声を廃棄し、前記認証結果値が前記閾値を下回っている音声を通過させる、
オンライン会議システム。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本開示は、音声の認証を行う技術に関する。
続きを表示(約 1,900 文字)【背景技術】
【0002】
様々な用途で音声データが活用されている。電話やオンライン会議では音声データにより通話が実現される。また、会議の議事録を作成するのにも音声データが利用される。それら様々な用途においてデータに含まれる音の中から特定の人物の音声を特定することが求められている。
【0003】
音声から人物の本人確認を行う技術として音声認証技術がある。音声認証には、コールセンターにおける電話相手の人物を確認するといった用途がある。また、スマーフォンのロック解除といった用途もある(特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
特表2015-509680号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
一般的に音声認証技術は本人確認のために利用される。そのため本人確認が終われば音声認証も終わる。しかしながら、継続的に人物を特定することが要求される場面がある。例えば、オンライン会議や電話の音声から特定の人物の音声のみを抽出したい場合がある。また、電話を利用した様々な特殊詐欺を防止するために、電話の音声において通話相手が悪意の人物であるか否かを継続的に計測したい場合がある。
【0006】
本開示のひとつの目的は、音声により継続的に人物の認証を行う技術を提供することである。
【課題を解決するための手段】
【0007】
本開示のひとつの態様による音声処理システムは、特定人物の音声の特徴を表す声紋データを記憶する記憶部と、継続的な受信音声データに含まれる人物の音声を取得する受信処理部と、前記声紋データに基づいて前記取得された音声に対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する認証処理部と、を有する。
【0008】
本開示の他の態様によるオンライン会議システムは、通信ネットワークを介して複数の参加者が相互に音声で対話を行うためのオンライン会議システムであって、参加者の音声を収音した音声データを加工し、他の参加者に聴取させる音声データを生成する音声処理システムを有し、前記音声処理システムは、特定人物の音声の特徴を表す声紋データを記憶する記憶部と、継続的な受信音声データに含まれる人物の音声を取得する受信処理部と、前記声紋データに基づいて前記取得された音声に対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する認証処理部と、前記認証結果値が所定の閾値以上であるか否かに応じて前記受信音声データを加工する認証結果処理部と、を有し、前記認証結果処理部は、前記特定人物の音声を通過させる通過モードと前記特定人物の音声を廃棄する廃棄モードとが選択可能であり、前記通過モードでは、前記認証結果値が前記閾値以上である音声を通過させ、前記認証結果値が前記閾値を下回っている音声を所定条件を満たせば通過させ、前記廃棄モードでは、前記認証結果値が前記閾値以上である音声を廃棄し、前記認証結果値が前記閾値を下回っている音声を通過させる。
【0009】
本開示の他の態様による、音声通話装置は、利用者が通信ネットワークを介して通話相手と相互に音声で通話を行うための音声通話装置であって、前記通話相手の音声を収音した音声データを加工し、前記利用者に聴取させる音声データを生成する音声処理システムを有し、前記音声処理システムは、特定人物の音声の特徴を表す声紋データを記憶する記憶部と、継続的な受信音声データに含まれる人物の音声を取得する受信処理部と、前記声紋データに基づいて前記取得された音声に対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する認証処理部と、前記認証結果値が所定の閾値以上であるか否かに応じた処理を実行する認証結果処理部と、を有し、前記記憶部は、単語を登録した文脈データを更に記憶し、前記認証結果処理部は、前記認証結果値が前記閾値を下回っている音声について、前記文脈データに基づいて不審であるか否か判定し、不審であったら、前記通話の録音と、警告用の電子メールの送信と、音声による警告との1つ以上を実行する。
【発明の効果】
【0010】
本開示のひとつの態様によれば、音声により継続的に人物の認証を行うことが可能になる。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
アクセサリー型集音器
今日
横浜ゴム株式会社
音響材
7日前
横浜ゴム株式会社
音響材
7日前
横浜ゴム株式会社
音響材
7日前
横浜ゴム株式会社
水中音響材
10日前
ヤマハ株式会社
ヘルムホルツ共鳴器
1か月前
大和ハウス工業株式会社
音再現設備
14日前
日産自動車株式会社
防音構造体
28日前
岡山県
吸音構造
7日前
セイコーエプソン株式会社
吸音ボード
28日前
株式会社第一興商
カラオケ装置
14日前
株式会社第一興商
カラオケ装置
1か月前
株式会社第一興商
カラオケ装置
6日前
京セラ株式会社
音出力装置及び音出力方法
28日前
コスモネクスト株式会社
入力支援プログラム及び入力支援方法
21日前
本田技研工業株式会社
能動型騒音低減装置
28日前
本田技研工業株式会社
能動型騒音低減装置
6日前
本田技研工業株式会社
能動型騒音低減装置
6日前
日本放送協会
音声認識装置およびプログラム
28日前
本田技研工業株式会社
能動型騒音低減装置
1か月前
個人
発音体モジュール
1日前
株式会社アナザーウェア
鍵盤画面表示プログラム及びそのシステム
1か月前
カシオ計算機株式会社
楽器用電子機器
6日前
トヨタ自動車株式会社
異音診断システム
1か月前
株式会社コルグ
音波生成装置、音波生成方法、プログラム
21日前
株式会社永セ仁
「パワハラ」等ハラスメント発言に係る職場環境測定システム
10日前
ソフトバンクグループ株式会社
行動制御システム
21日前
株式会社AZSTOKE
調整装置、およびプログラム
6日前
本田技研工業株式会社
音声認識装置、音声認識方法、およびプログラム
13日前
永楽電気株式会社
放送音声文字化システム及び放送設備における故障診断方法
28日前
東日本電信電話株式会社
演奏補助装置、演奏補助方法、及び、演奏補助プログラム
13日前
パイオニア株式会社
情報処理装置
15日前
ヤマハ株式会社
響板、その製造方法および響板を備える楽器
13日前
ヤマハ株式会社
信号生成方法、表示制御方法およびプログラム
7日前
ドーナッツロボティクス株式会社
音声処理システム、音声処理方法
21日前
株式会社イノアックコーポレーション
防音カバー
6日前
続きを見る