特許ウォッチ

公開番号2025027139
公報種別公開特許公報(A)
公開日2025-02-26
出願番号2024212920,2021198830
出願日2024-12-05,2021-12-07
発明の名称音声処理システム、プログラム、方法、オンライン会議システム、および音声通話装置
出願人株式会社日立ソリューションズ
代理人弁理士法人ウィルフォート国際特許事務所
主分類G10L 17/00 20130101AFI20250218BHJP(楽器;音響)
要約【課題】音声により継続的に人物の認証を行う技術を提供する。
【解決手段】音声処理システムは、特定人物の音声の特徴を表す声紋データを記憶する記憶部と、継続的な受信音声データに含まれる人物の音声を取得する受信処理部と、前記声紋データに基づいて前記取得された音声に対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する認証処理部と、を有する。
【選択図】図2
特許請求の範囲【請求項１】
特定人物の音声の特徴を表す声紋データを記憶する記憶部と、
継続的な受信音声データに含まれる人物の音声を取得する受信処理部と、
前記声紋データに基づいて前記取得された音声に対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する認証処理部と、
を有する音声処理システム。
続きを表示（約 1,700 文字）【請求項２】
前記認証結果値が所定の閾値以上である間、前記受信音声データにおける前記特定人物の音声のみの音声データまたは前記特定人物の音声を取り除いた音声データを生成する認証結果処理部を更に有する、
請求項１に記載の音声処理システム。
【請求項３】
前記記憶部は、所定の文脈を示す文脈データを更に記憶し、
前記認証結果値が所定の閾値を下回っていれば、前記受信音声データにおける音声の文脈を抽出し、前記抽出された文脈と前記文脈データに示された文脈とが一致するか否かにより異なる処理を行う認証結果処理部を更に有する、
請求項１に記載の音声処理システム。
【請求項４】
所定の宛先アドレスに宛てた所定の電子メールを生成する電子メール処理部を更に有し、
前記認証結果処理部は、前記抽出された文脈と前記文脈データに示された文脈とが一致したら、前記電子メール処理部に前記電子メールを生成させる、
請求項３に記載の音声処理システム。
【請求項５】
所定の宛先アドレスに宛てた所定の電子メールを生成する電子メール処理部と、
前記認証結果値が所定の閾値を下回っていれば、前記電子メール処理部に前記電子メールを生成させる認証結果処理部と、を更に有する、
請求項１に記載の音声処理システム。
【請求項６】
前記認証処理部は、所定の継続時間だけ前記取得された音声に対して声紋認証を行い、前記継続時間が経過すると前記音声に対する声紋認証を終了する、
請求項３または５に記載の音声処理システム。
【請求項７】
前記認証結果処理部は、前記認証結果値が所定の閾値以上である間、前記受信音声データにおける前記特定人物の音声のみの音声データを生成する通過モードと、前記特定人物の音声を取り除いた音声データを生成する廃棄モードとが選択可能である、
請求項２に記載の音声処理システム。
【請求項８】
コンピュータに、
特定人物の音声の特徴を表す声紋データを記憶し、
継続的な受信音声データを受信し、
前記声紋データに基づいて前記受信音声データに対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する、ことを実行させるための音声処理プログラム。
【請求項９】
コンピュータが、
特定人物の音声の特徴を表す声紋データを記憶し、
継続的な受信音声データを受信し、
前記声紋データに基づいて前記受信音声データに対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する、ことを実行する音声処理方法。
【請求項１０】
通信ネットワークを介して複数の参加者が相互に音声で対話を行うためのオンライン会議システムであって、
参加者の音声を収音した音声データを加工し、他の参加者に聴取させる音声データを生成する音声処理システムを有し、
前記音声処理システムは、
特定人物の音声の特徴を表す声紋データを記憶する記憶部と、
継続的な受信音声データに含まれる人物の音声を取得する受信処理部と、
前記声紋データに基づいて前記取得された音声に対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する認証処理部と、
前記認証結果値が所定の閾値以上であるか否かに応じて前記受信音声データを加工する認証結果処理部と、を有し、
前記認証結果処理部は、前記特定人物の音声を通過させる通過モードと前記特定人物の音声を廃棄する廃棄モードとが選択可能であり、
前記通過モードでは、前記認証結果値が前記閾値以上である音声を通過させ、前記認証結果値が前記閾値を下回っている音声を所定条件を満たせば通過させ、
前記廃棄モードでは、前記認証結果値が前記閾値以上である音声を廃棄し、前記認証結果値が前記閾値を下回っている音声を通過させる、
オンライン会議システム。
（【請求項１１】以降は省略されています）
発明の詳細な説明【技術分野】
【０００１】
本開示は、音声の認証を行う技術に関する。
続きを表示（約 1,900 文字）【背景技術】
【０００２】
様々な用途で音声データが活用されている。電話やオンライン会議では音声データにより通話が実現される。また、会議の議事録を作成するのにも音声データが利用される。それら様々な用途においてデータに含まれる音の中から特定の人物の音声を特定することが求められている。
【０００３】
音声から人物の本人確認を行う技術として音声認証技術がある。音声認証には、コールセンターにおける電話相手の人物を確認するといった用途がある。また、スマーフォンのロック解除といった用途もある（特許文献１参照）。
【先行技術文献】
【特許文献】
【０００４】
特表２０１５－５０９６８０号公報
【発明の概要】
【発明が解決しようとする課題】
【０００５】
一般的に音声認証技術は本人確認のために利用される。そのため本人確認が終われば音声認証も終わる。しかしながら、継続的に人物を特定することが要求される場面がある。例えば、オンライン会議や電話の音声から特定の人物の音声のみを抽出したい場合がある。また、電話を利用した様々な特殊詐欺を防止するために、電話の音声において通話相手が悪意の人物であるか否かを継続的に計測したい場合がある。
【０００６】
本開示のひとつの目的は、音声により継続的に人物の認証を行う技術を提供することである。
【課題を解決するための手段】
【０００７】
本開示のひとつの態様による音声処理システムは、特定人物の音声の特徴を表す声紋データを記憶する記憶部と、継続的な受信音声データに含まれる人物の音声を取得する受信処理部と、前記声紋データに基づいて前記取得された音声に対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する認証処理部と、を有する。
【０００８】
本開示の他の態様によるオンライン会議システムは、通信ネットワークを介して複数の参加者が相互に音声で対話を行うためのオンライン会議システムであって、参加者の音声を収音した音声データを加工し、他の参加者に聴取させる音声データを生成する音声処理システムを有し、前記音声処理システムは、特定人物の音声の特徴を表す声紋データを記憶する記憶部と、継続的な受信音声データに含まれる人物の音声を取得する受信処理部と、前記声紋データに基づいて前記取得された音声に対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する認証処理部と、前記認証結果値が所定の閾値以上であるか否かに応じて前記受信音声データを加工する認証結果処理部と、を有し、前記認証結果処理部は、前記特定人物の音声を通過させる通過モードと前記特定人物の音声を廃棄する廃棄モードとが選択可能であり、前記通過モードでは、前記認証結果値が前記閾値以上である音声を通過させ、前記認証結果値が前記閾値を下回っている音声を所定条件を満たせば通過させ、前記廃棄モードでは、前記認証結果値が前記閾値以上である音声を廃棄し、前記認証結果値が前記閾値を下回っている音声を通過させる。
【０００９】
本開示の他の態様による、音声通話装置は、利用者が通信ネットワークを介して通話相手と相互に音声で通話を行うための音声通話装置であって、前記通話相手の音声を収音した音声データを加工し、前記利用者に聴取させる音声データを生成する音声処理システムを有し、前記音声処理システムは、特定人物の音声の特徴を表す声紋データを記憶する記憶部と、継続的な受信音声データに含まれる人物の音声を取得する受信処理部と、前記声紋データに基づいて前記取得された音声に対して時系列に声紋認証を行い、前記特定人物の音声と推定される度合いを表す認証結果値を時系列に生成する認証処理部と、前記認証結果値が所定の閾値以上であるか否かに応じた処理を実行する認証結果処理部と、を有し、前記記憶部は、単語を登録した文脈データを更に記憶し、前記認証結果処理部は、前記認証結果値が前記閾値を下回っている音声について、前記文脈データに基づいて不審であるか否か判定し、不審であったら、前記通話の録音と、警告用の電子メールの送信と、音声による警告との１つ以上を実行する。
【発明の効果】
【００１０】
本開示のひとつの態様によれば、音声により継続的に人物の認証を行うことが可能になる。
【図面の簡単な説明】
（【００１１】以降は省略されています）

関連特許