TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025132238
公報種別公開特許公報(A)
公開日2025-09-10
出願番号2024029655
出願日2024-02-29
発明の名称認証装置、認証方法及び認証プログラム
出願人KDDI株式会社
代理人個人
主分類G10L 17/00 20130101AFI20250903BHJP(楽器;音響)
要約【課題】音声認識によるユーザの識別精度を向上させた認証装置を提供すること。
【解決手段】認証装置1は、ユーザそれぞれに対する挨拶文を決定すると共に、挨拶文に対する期待回答を示すユーザ自身の音声、及びテキストの入力を受け付け、ユーザに紐づけて登録する登録部11と、テキストに対応した音声認識可能なモデル音声を生成し、ユーザ自身の音声からモデル音声へ変換するためのフィルタをユーザ毎に機械学習する学習部12と、挨拶文を出力し、回答の音声による入力を受け付ける回答受付部13と、回答の音声を、ユーザ毎のフィルタにより変換し、変換後の音声に対する所定の音声認識ソフトウェアによる読み取り結果、及び読み取り結果の正しさの期待値を取得する音声認識部14と、読み取り結果と期待回答との一致度、及び読み取り結果の正しさの期待値に基づいて、回答の音声を入力したユーザを識別及び認証する認証部15と、を備える。
【選択図】図1
特許請求の範囲【請求項1】
ユーザそれぞれに対する挨拶文を決定すると共に、当該挨拶文に対する期待回答を示す当該ユーザ自身の音声、及びテキストの入力を受け付け、当該ユーザに紐づけて登録する登録部と、
前記テキストに対応した音声認識可能なモデル音声を生成し、前記ユーザ自身の音声から当該モデル音声へ変換するためのフィルタをユーザ毎に機械学習する学習部と、
前記挨拶文を出力し、当該挨拶文への回答の音声による入力を受け付ける回答受付部と、
前記回答の音声を、ユーザ毎の前記フィルタにより変換し、変換後の音声に対する所定の音声認識ソフトウェアによる読み取り結果、及び当該読み取り結果の正しさの期待値を取得する音声認識部と、
前記読み取り結果と前記期待回答との一致度、及び前記読み取り結果の正しさの期待値に基づいて、前記回答の音声を入力したユーザを識別及び認証する認証部と、を備える認証装置。
続きを表示(約 950 文字)【請求項2】
前記学習部は、前記モデル音声として、AIによる合成音声を生成する請求項1に記載の認証装置。
【請求項3】
前記学習部は、前記期待回答を入力したユーザから、前記テキストに対応した音声認識用の音声の入力を受け付け、前記モデル音声とする請求項1に記載の認証装置。
【請求項4】
前記認証部は、前記読み取り結果の正しさの期待値が最大となった前記フィルタに対応するユーザを識別及び認証する請求項1に記載の認証装置。
【請求項5】
前記認証部は、前記期待回答と一致した読み取り結果のうち、当該読み取り結果の正しさの期待値が最大となった前記フィルタに対応するユーザを識別及び認証する請求項1に記載の認証装置。
【請求項6】
前記認証部により識別されたユーザに対応する前記フィルタに固定したうえで、前記音声認識部による読み取り結果を用いた所定のサービスを提供するサービス提供部を備える請求項1から請求項5のいずれかに記載の認証装置。
【請求項7】
ユーザそれぞれに対する挨拶文を決定すると共に、当該挨拶文に対する期待回答を示す当該ユーザ自身の音声、及びテキストの入力を受け付け、当該ユーザに紐づけて登録する登録ステップと、
前記テキストに対応した音声認識可能なモデル音声を生成し、前記ユーザ自身の音声から当該モデル音声へ変換するためのフィルタをユーザ毎に機械学習する学習ステップと、
前記挨拶文を出力し、当該挨拶文への回答の音声による入力を受け付ける回答受付ステップと、
前記回答の音声を、ユーザ毎の前記フィルタにより変換し、変換後の音声に対する所定の音声認識ソフトウェアによる読み取り結果、及び当該読み取り結果の正しさの期待値を取得する音声認識ステップと、
前記読み取り結果と前記期待回答との一致度、及び前記読み取り結果の正しさの期待値に基づいて、前記回答の音声を入力したユーザを識別及び認証する認証ステップと、をコンピュータが実行する認証方法。
【請求項8】
請求項1から請求項5のいずれかに記載の認証装置としてコンピュータを機能させるための認証プログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、音声認識によるユーザ認証技術に関する。
続きを表示(約 1,300 文字)【背景技術】
【0002】
従来、音声をテキストに変換する音声認識の技術が研究され、近年では、ニューラルネットワークを用いた音声認識モデルによるサービスが提供されている(例えば、非特許文献1参照)。
【先行技術文献】
【非特許文献】
【0003】
Wisper,インターネット,[2024年2月19日検索],<https://openai.com/research/whisper>
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、日本語の音声認識は最新のAI技術を用いても十分ではなく、高性能なGPUを用いた場合でも話者により認識精度が大きく落ちることがある。
このため、音声認識を認証に用いる場合、例えばパスワードのような鍵データを音声で入力する場合に、音声とパスワードとの一致率が低いことを許容して幅広い入力を受け付けようとすると、セキュリティ強度が落ちるためパスワードを長くする必要があるが、長いパスワードは忘れやすいという問題がある。
一方で、短いパスワードで認証を行う場合には、音声とパスワードとの高い一致率を要求して狭い入力とする必要がある。この場合、本人が正しいパスワードを何度話しても認識されないという問題が発生する。
【0005】
本発明は、音声認識によるユーザの識別精度を向上させた認証装置、認証方法及び認証プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明に係る認証装置は、ユーザそれぞれに対する挨拶文を決定すると共に、当該挨拶文に対する期待回答を示す当該ユーザ自身の音声、及びテキストの入力を受け付け、当該ユーザに紐づけて登録する登録部と、前記テキストに対応した音声認識可能なモデル音声を生成し、前記ユーザ自身の音声から当該モデル音声へ変換するためのフィルタをユーザ毎に機械学習する学習部と、前記挨拶文を出力し、当該挨拶文への回答の音声による入力を受け付ける回答受付部と、前記回答の音声を、ユーザ毎の前記フィルタにより変換し、変換後の音声に対する所定の音声認識ソフトウェアによる読み取り結果、及び当該読み取り結果の正しさの期待値を取得する音声認識部と、前記読み取り結果と前記期待回答との一致度、及び前記読み取り結果の正しさの期待値に基づいて、前記回答の音声を入力したユーザを識別及び認証する認証部と、を備える。
【0007】
前記学習部は、前記モデル音声として、AIによる合成音声を生成してもよい。
【0008】
前記学習部は、前記期待回答を入力したユーザから、前記テキストに対応した音声認識用の音声の入力を受け付け、前記モデル音声としてもよい。
【0009】
前記認証部は、前記読み取り結果の正しさの期待値が最大となった前記フィルタに対応するユーザを識別及び認証してもよい。
【0010】
前記認証部は、前記期待回答と一致した読み取り結果のうち、当該読み取り結果の正しさの期待値が最大となった前記フィルタに対応するユーザを識別及び認証してもよい。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

KDDI株式会社
解析装置及びプログラム
26日前
KDDI株式会社
ユーザ端末及び通信制御方法
1か月前
KDDI株式会社
ユーザ端末及び通信制御方法
1か月前
KDDI株式会社
情報処理装置及び情報処理方法
14日前
KDDI株式会社
情報処理装置及び情報処理方法
1日前
KDDI株式会社
情報処理装置及び情報処理方法
14日前
KDDI株式会社
情報処理装置及び情報処理方法
7日前
KDDI株式会社
ネットワーク制御装置及びプログラム
7日前
KDDI株式会社
中継装置、中継方法及び中継プログラム
今日
KDDI株式会社
認証装置、認証方法及び認証プログラム
12日前
KDDI株式会社
認証装置、認証方法及び認証プログラム
今日
KDDI株式会社
通信装置、無線デバイス及びプログラム
8日前
KDDI株式会社
通信装置、無線デバイス及びプログラム
8日前
KDDI株式会社
無線デバイス及びコンピュータプログラム
29日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
23日前
KDDI株式会社
画像復号装置、画像復号方法及びプログラム
1か月前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
28日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
1か月前
KDDI株式会社
点群復号装置、点群復号方法及びプログラム
1か月前
KDDI株式会社
点群復号装置、点群復号方法及びプログラム
1か月前
KDDI株式会社
画像復号装置、画像復号方法及びプログラム
1か月前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
1か月前
KDDI株式会社
点群復号装置、点群復号方法及びプログラム
1か月前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
1か月前
KDDI株式会社
点群復号装置、点群復号方法及びプログラム
1か月前
KDDI株式会社
画像復号装置、画像復号方法及びプログラム
1か月前
KDDI株式会社
画像復号装置、画像復号方法及びプログラム
1か月前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
8日前
トヨタ自動車株式会社
システム、及び、方法
14日前
KDDI株式会社
情報処理装置、情報処理方法及び情報処理システム
5日前
KDDI株式会社
無線通信システム並びにその制御方法及びプログラム
27日前
KDDI株式会社
メッシュ復号装置、メッシュ復号方法及びプログラム
1か月前
KDDI株式会社
メッシュ復号装置、メッシュ復号方法及びプログラム
1か月前
KDDI株式会社
メッシュ復号装置、メッシュ復号方法及びプログラム
1か月前
KDDI株式会社
AI連携装置、AI連携方法及びAI連携プログラム
28日前
KDDI株式会社
AI連携装置、AI連携方法及びAI連携プログラム
26日前
続きを見る