TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024129781
公報種別公開特許公報(A)
公開日2024-09-27
出願番号2023189551
出願日2023-11-06
発明の名称音声認証装置、および機器
出願人ローム株式会社
代理人弁理士法人 佐野特許事務所
主分類G10L 17/18 20130101AFI20240919BHJP(楽器;音響)
要約【課題】機器において音声認証のために外部との通信が不要となる音声認証装置を提供する。
【解決手段】音声認証装置(3)は、外部からの音声(S)を電気信号である音声信号(SD)に変換するように構成される音声変換部(2)を備えた機器(1)に搭載可能であって、前記音声信号に基づいて、AIモデルのパラメータを学習するように構成される音声登録部(3A)と、前記音声信号に基づく入力データに対して、学習された前記パラメータを有する前記AIモデルにより得られる推論結果に基づいて音声の照合を実行するように構成される音声照合部(3B)と、を備え、前記音声登録部と前記音声照合部に基づいて音声認証を実行する。
【選択図】図2
特許請求の範囲【請求項1】
外部からの音声を電気信号である音声信号に変換するように構成される音声変換部を備えた機器に搭載可能であって、
前記音声信号に基づいて、AIモデルのパラメータを学習するように構成される音声登録部と、
前記音声信号に基づく入力データに対して、学習された前記パラメータを有する前記AIモデルにより得られる推論結果に基づいて音声の照合を実行するように構成される音声照合部と、
を備え、
前記音声登録部と前記音声照合部に基づいて音声認証を実行する、音声認証装置。
続きを表示(約 1,600 文字)【請求項2】
前記音声登録部および前記音声照合部は、それぞれキーワードを含んだ前記音声に基づいて登録・照合を行う、請求項1に記載の音声認証装置。
【請求項3】
前記AIモデルは、入力層、隠れ層、および出力層を有する3層ニューラルネットワークである、請求項2に記載の音声認証装置。
【請求項4】
前記音声登録部は、下記(A)式を用いて前記パラメータとして前記隠れ層と前記出力層を結合する重みβ

を算出する、請求項3に記載の音声認証装置。


=(H

T



-1
β

=P



T


(A)
ただし、隠れ層行列H

=G(x

・α+b)、α:前記入力層と前記隠れ層を結合する重み、b:前記隠れ層のバイアス、G:前記隠れ層の活性化関数、x

:バッチサイズk

のi番目の入力データ、t

:バッチサイズk

のi番目の教師データ
【請求項5】
前記音声登録部は、下記(B)式を用いて前記パラメータとして前記隠れ層と前記出力層を結合する重みβ

を逐次算出する、請求項3に記載の音声認証装置。


=P
i-1
-P
i-1


T
(I+H


i-1


T

-1



i-1
β

=β
i-1
+P



T
(t

-H

β
i-1
) (B)
ただし、隠れ層行列H

=G(x

・α+b)、α:前記入力層と前記隠れ層を結合する重み、b:前記隠れ層のバイアス、G:前記隠れ層の活性化関数、x

:バッチサイズk

のi番目の入力データ、t

:バッチサイズk

のi番目の教師データ
【請求項6】
前記音声登録部は、下記(C)式を用いて前記重みβ

を算出する、請求項5に記載の音声認証装置。


=(H

T



-1
β

=P



T


(C)
【請求項7】
前記音声登録部は、t

=x

として学習を行う、請求項4から請求項6のいずれか1項に記載の音声認証装置。
【請求項8】
前記入力データは、前記音声信号のサンプリングデータである、請求項4から請求項6のいずれか1項に記載の音声認証装置。
【請求項9】
前記入力データは、前記音声信号を周波数解析して得られるスペクトルデータである、請求項4から請求項6のいずれか1項に記載の音声認証装置。
【請求項10】
請求項1に記載の音声認証装置と、前記音声変換部と、通信ネットワークと通信可能な通信部と、を備える、機器。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本開示は、音声認証装置に関する。
続きを表示(約 1,500 文字)【背景技術】
【0002】
従来、音声認証を行う機器が知られている(例えば特許文献1)。音声認証では、人が発した音声に関する特徴(声紋など)を登録する処理と、登録した特徴との照合を行う処理が行われる。
【先行技術文献】
【特許文献】
【0003】
特開2010-211296号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来、音声認証を行う機器は、処理能力の高い外部サーバーと通信して登録・照合を行っていた。しかしながら、音声データの漏洩などの課題があった。
【0005】
上記状況に鑑み、本開示は、機器において音声認証のために外部との通信が不要となる音声認証装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
例えば、本開示に係る音声認証装置は、
外部からの音声を電気信号である音声信号に変換するように構成される音声変換部を備えた機器に搭載可能であって、
前記音声信号に基づいて、AIモデルのパラメータを学習するように構成される音声登録部と、
前記音声信号に基づく入力データに対して、学習された前記パラメータを有する前記AIモデルにより得られる推論結果に基づいて音声の照合を実行するように構成される音声照合部と、
を備え、
前記音声登録部と前記音声照合部に基づいて音声認証を実行する構成としている。
【発明の効果】
【0007】
本開示に係る音声認証装置によれば、機器において音声認証のために外部との通信が不要となる。
【図面の簡単な説明】
【0008】
図1は、比較例に係る音声認証システムを示す図である。
図2は、本開示の例示的な実施形態に係るスマートスピーカの構成を示す図である。
図3は、音声登録の一例を示す図である。
図4は、音声照合の一例を示す図である。
図5は、3層ニューラルネットワークの構成を示す図である。
図6は、音声信号の模式図である。
図7は、本開示の変形例に係る機器の構成を示す図である。
【発明を実施するための形態】
【0009】
<1.比較例>
図1は、比較例に係る音声認証システムを示す図である。図1に示すシステムにおいては、音声認証装置100と、サーバー200と、が設けられる。音声認証装置100は、サーバー200との間で通信を行う。
【0010】
登録処理時には、ユーザPが発した音声Sが音声認証装置100に入力され、音声認証装置100は、入力された音声Sに関する音声データをサーバー200へ送信する。サーバー200は、送信された音声データに基づいて音声Sの特徴を登録する登録処理を行う。照合処理時には、ユーザが発した音声が音声認証装置100に入力されると、音声認証装置100は、入力された音声に関する音声データをサーバー200へ送信する。サーバー200は、送信された音声データに基づいて登録処理により登録された音声Sの特徴との照合を行う。照合処理時のユーザが登録処理時のユーザPである場合は、サーバー200は、登録された音声Sの特徴と一致するとの照合結果を取得する。一方、照合処理時のユーザが登録処理時のユーザPと異なる場合は、サーバー200は、登録された音声Sの特徴と一致しないとの照合結果を取得する。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

株式会社トランストロン
軸構造
3日前
株式会社第一興商
カラオケ装置
21日前
学校法人幾徳学園
鍵盤楽器
7日前
株式会社今仙電機製作所
自動車用警報音発生装置
18日前
株式会社河合楽器製作所
鍵盤装置
15日前
株式会社河合楽器製作所
鍵盤装置
21日前
株式会社河合楽器製作所
鍵盤装置
15日前
個人
アコースティック・ギター用単弦牽引装置のための台座
21日前
株式会社イノアックコーポレーション
防音構造
14日前
日本製紙パピリア株式会社
表面材および吸音材
7日前
ヤマハ株式会社
情報処理方法
25日前
ヤマハ株式会社
動画処理方法
3日前
株式会社第一興商
カラオケ装置
22日前
パナソニックIPマネジメント株式会社
個室ブース
1か月前
株式会社第一興商
カラオケ装置
18日前
株式会社第一興商
カラオケ装置
1か月前
ヤマハ株式会社
管楽器及び管楽器用のキー
15日前
株式会社フューチャー・ブレイン
音声合成システム及び音声合成方法
1か月前
日産自動車株式会社
音声認識方法及び音声認識装置
3日前
ヤマハ株式会社
鍵盤ユニット
15日前
ローム株式会社
音声認証装置、および機器
今日
ヤマハ株式会社
音データ生成方法
8日前
株式会社イノアックコーポレーション
吸音材
24日前
ヤマハ株式会社
音源およびその制御方法、プログラム、電子鍵盤楽器
21日前
TOA株式会社
音源形成システム、音源形成プログラム、および音源形成方法
21日前
本田技研工業株式会社
対話理解装置、および対話理解方法
24日前
ピクシーダストテクノロジーズ株式会社
吸音部材及び吸音壁
1か月前
ヤマハ株式会社
音高表示装置、音高表示方法、およびプログラム
24日前
日本放送協会
解説音声制作装置、携帯端末及びプログラム
1か月前
花王株式会社
対話システム、対話プログラム、対話方法
29日前
株式会社NTTドコモ
音声書き起こしシステム及び音声翻訳システム
1か月前
TOA株式会社
会話漏洩評価装置
1か月前
国立研究開発法人情報通信研究機構
声質変換処理システム、および、声質変換処理方法
25日前
カシオ計算機株式会社
プログラム、情報処理装置及び画像生成方法
21日前
カシオ計算機株式会社
ペダル装置及び電子鍵盤楽器
9日前
ヤマハ株式会社
音処理方法、音処理装置、および音処理プログラム
1か月前
続きを見る