TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024129781
公報種別公開特許公報(A)
公開日2024-09-27
出願番号2023189551
出願日2023-11-06
発明の名称音声認証装置、および機器
出願人ローム株式会社
代理人弁理士法人 佐野特許事務所
主分類G10L 17/18 20130101AFI20240919BHJP(楽器;音響)
要約【課題】機器において音声認証のために外部との通信が不要となる音声認証装置を提供する。
【解決手段】音声認証装置(3)は、外部からの音声(S)を電気信号である音声信号(SD)に変換するように構成される音声変換部(2)を備えた機器(1)に搭載可能であって、前記音声信号に基づいて、AIモデルのパラメータを学習するように構成される音声登録部(3A)と、前記音声信号に基づく入力データに対して、学習された前記パラメータを有する前記AIモデルにより得られる推論結果に基づいて音声の照合を実行するように構成される音声照合部(3B)と、を備え、前記音声登録部と前記音声照合部に基づいて音声認証を実行する。
【選択図】図2
特許請求の範囲【請求項1】
外部からの音声を電気信号である音声信号に変換するように構成される音声変換部を備えた機器に搭載可能であって、
前記音声信号に基づいて、AIモデルのパラメータを学習するように構成される音声登録部と、
前記音声信号に基づく入力データに対して、学習された前記パラメータを有する前記AIモデルにより得られる推論結果に基づいて音声の照合を実行するように構成される音声照合部と、
を備え、
前記音声登録部と前記音声照合部に基づいて音声認証を実行する、音声認証装置。
続きを表示(約 1,600 文字)【請求項2】
前記音声登録部および前記音声照合部は、それぞれキーワードを含んだ前記音声に基づいて登録・照合を行う、請求項1に記載の音声認証装置。
【請求項3】
前記AIモデルは、入力層、隠れ層、および出力層を有する3層ニューラルネットワークである、請求項2に記載の音声認証装置。
【請求項4】
前記音声登録部は、下記(A)式を用いて前記パラメータとして前記隠れ層と前記出力層を結合する重みβ

を算出する、請求項3に記載の音声認証装置。


=(H

T



-1
β

=P



T


(A)
ただし、隠れ層行列H

=G(x

・α+b)、α:前記入力層と前記隠れ層を結合する重み、b:前記隠れ層のバイアス、G:前記隠れ層の活性化関数、x

:バッチサイズk

のi番目の入力データ、t

:バッチサイズk

のi番目の教師データ
【請求項5】
前記音声登録部は、下記(B)式を用いて前記パラメータとして前記隠れ層と前記出力層を結合する重みβ

を逐次算出する、請求項3に記載の音声認証装置。


=P
i-1
-P
i-1


T
(I+H


i-1


T

-1



i-1
β

=β
i-1
+P



T
(t

-H

β
i-1
) (B)
ただし、隠れ層行列H

=G(x

・α+b)、α:前記入力層と前記隠れ層を結合する重み、b:前記隠れ層のバイアス、G:前記隠れ層の活性化関数、x

:バッチサイズk

のi番目の入力データ、t

:バッチサイズk

のi番目の教師データ
【請求項6】
前記音声登録部は、下記(C)式を用いて前記重みβ

を算出する、請求項5に記載の音声認証装置。


=(H

T



-1
β

=P



T


(C)
【請求項7】
前記音声登録部は、t

=x

として学習を行う、請求項4から請求項6のいずれか1項に記載の音声認証装置。
【請求項8】
前記入力データは、前記音声信号のサンプリングデータである、請求項4から請求項6のいずれか1項に記載の音声認証装置。
【請求項9】
前記入力データは、前記音声信号を周波数解析して得られるスペクトルデータである、請求項4から請求項6のいずれか1項に記載の音声認証装置。
【請求項10】
請求項1に記載の音声認証装置と、前記音声変換部と、通信ネットワークと通信可能な通信部と、を備える、機器。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本開示は、音声認証装置に関する。
続きを表示(約 1,500 文字)【背景技術】
【0002】
従来、音声認証を行う機器が知られている(例えば特許文献1)。音声認証では、人が発した音声に関する特徴(声紋など)を登録する処理と、登録した特徴との照合を行う処理が行われる。
【先行技術文献】
【特許文献】
【0003】
特開2010-211296号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来、音声認証を行う機器は、処理能力の高い外部サーバーと通信して登録・照合を行っていた。しかしながら、音声データの漏洩などの課題があった。
【0005】
上記状況に鑑み、本開示は、機器において音声認証のために外部との通信が不要となる音声認証装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
例えば、本開示に係る音声認証装置は、
外部からの音声を電気信号である音声信号に変換するように構成される音声変換部を備えた機器に搭載可能であって、
前記音声信号に基づいて、AIモデルのパラメータを学習するように構成される音声登録部と、
前記音声信号に基づく入力データに対して、学習された前記パラメータを有する前記AIモデルにより得られる推論結果に基づいて音声の照合を実行するように構成される音声照合部と、
を備え、
前記音声登録部と前記音声照合部に基づいて音声認証を実行する構成としている。
【発明の効果】
【0007】
本開示に係る音声認証装置によれば、機器において音声認証のために外部との通信が不要となる。
【図面の簡単な説明】
【0008】
図1は、比較例に係る音声認証システムを示す図である。
図2は、本開示の例示的な実施形態に係るスマートスピーカの構成を示す図である。
図3は、音声登録の一例を示す図である。
図4は、音声照合の一例を示す図である。
図5は、3層ニューラルネットワークの構成を示す図である。
図6は、音声信号の模式図である。
図7は、本開示の変形例に係る機器の構成を示す図である。
【発明を実施するための形態】
【0009】
<1.比較例>
図1は、比較例に係る音声認証システムを示す図である。図1に示すシステムにおいては、音声認証装置100と、サーバー200と、が設けられる。音声認証装置100は、サーバー200との間で通信を行う。
【0010】
登録処理時には、ユーザPが発した音声Sが音声認証装置100に入力され、音声認証装置100は、入力された音声Sに関する音声データをサーバー200へ送信する。サーバー200は、送信された音声データに基づいて音声Sの特徴を登録する登録処理を行う。照合処理時には、ユーザが発した音声が音声認証装置100に入力されると、音声認証装置100は、入力された音声に関する音声データをサーバー200へ送信する。サーバー200は、送信された音声データに基づいて登録処理により登録された音声Sの特徴との照合を行う。照合処理時のユーザが登録処理時のユーザPである場合は、サーバー200は、登録された音声Sの特徴と一致するとの照合結果を取得する。一方、照合処理時のユーザが登録処理時のユーザPと異なる場合は、サーバー200は、登録された音声Sの特徴と一致しないとの照合結果を取得する。
(【0011】以降は省略されています)

特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する
Flag Counter

関連特許

個人
アクセサリー型集音器
12日前
横浜ゴム株式会社
音響材
19日前
横浜ゴム株式会社
音響材
19日前
横浜ゴム株式会社
音響材
19日前
横浜ゴム株式会社
水中音響材
22日前
大和ハウス工業株式会社
音再現設備
26日前
岡山県
吸音構造
19日前
株式会社第一興商
カラオケ装置
4日前
株式会社第一興商
カラオケ装置
18日前
株式会社第一興商
カラオケ装置
26日前
株式会社コルグ
演奏情報制御装置、プログラム
4日前
コスモネクスト株式会社
入力支援プログラム及び入力支援方法
1か月前
日本放送協会
音声認識装置およびプログラム
1か月前
本田技研工業株式会社
能動型騒音低減装置
18日前
個人
発音体モジュール
13日前
本田技研工業株式会社
能動型騒音低減装置
18日前
カシオ計算機株式会社
楽器用電子機器
18日前
株式会社永セ仁
「パワハラ」等ハラスメント発言に係る職場環境測定システム
22日前
株式会社コルグ
音波生成装置、音波生成方法、プログラム
1か月前
株式会社奏音楽企画
クラッパーアーム揺動機構及びこれを備える練習用ベル
8日前
ソフトバンクグループ株式会社
行動制御システム
1か月前
株式会社AZSTOKE
調整装置、およびプログラム
18日前
本田技研工業株式会社
音声認識装置、音声認識方法、およびプログラム
25日前
東日本電信電話株式会社
演奏補助装置、演奏補助方法、及び、演奏補助プログラム
25日前
パイオニア株式会社
情報処理装置
27日前
ヤマハ株式会社
響板、その製造方法および響板を備える楽器
25日前
ヤマハ株式会社
信号生成方法、表示制御方法およびプログラム
19日前
ドーナッツロボティクス株式会社
音声処理システム、音声処理方法
1か月前
株式会社イノアックコーポレーション
防音カバー
18日前
株式会社イノアックコーポレーション
防音カバー
18日前
株式会社イノアックコーポレーション
防音カバー
6日前
ソフトバンクグループ株式会社
データ処理装置、データ処理方法、及びプログラム
1か月前
MPLUSPLUS株式会社
演奏差異検出方法、プログラム及びシステム並びに演奏誤り箇所通知方法
4日前
カシオ計算機株式会社
情報処理装置、情報処理方法及びプログラム
27日前
カシオ計算機株式会社
楽音制御システム
25日前
ローランド株式会社
電子打楽器、制御装置、ベロシティ算出プログラム及びベロシティ算出方法
25日前
続きを見る