TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025097720
公報種別公開特許公報(A)
公開日2025-07-01
出願番号2023214073
出願日2023-12-19
発明の名称情報処理装置、情報処理方法及びプログラム
出願人株式会社東芝,東芝デジタルソリューションズ株式会社
代理人弁理士法人酒井国際特許事務所
主分類G10L 17/04 20130101AFI20250624BHJP(楽器;音響)
要約【課題】使用環境が変わった場合でも、識別性能の低下を防ぐ。
【解決手段】実施形態の情報処理装置は、1以上の入力デバイスと、抽出部と、特定部と、環境情報取得部と、分析部と、再登録部とを備える。1以上の入力デバイスは、入力情報を取得する。抽出部は、人物特徴モデルを用いて、前記入力情報から人物の特徴を示す特徴量を抽出する。特定部は、前記特徴量と、人物辞書が示す特徴量とを比較することによって、前記人物を特定する。環境情報取得部は、前記入力情報から環境情報を取得する。分析部は、前記環境情報の変化、及び、前記特定部による前記人物の特定精度を分析する。再登録部は、前記環境情報の変化があった場合、または、前記特定精度が精度閾値未満の場合、前記人物辞書を再登録する制御を行う。
【選択図】図1
特許請求の範囲【請求項1】
入力情報を取得する1以上の入力デバイスと、
人物特徴モデルを用いて、前記入力情報から人物の特徴を示す特徴量を抽出する抽出部と、
前記特徴量と、人物辞書が示す特徴量とを比較することによって、前記人物を特定する特定部と、
前記入力情報から環境情報を取得する環境情報取得部と、
前記環境情報の変化、及び、前記特定部による前記人物の特定精度を分析する分析部と、
前記環境情報の変化があった場合、または、前記特定精度が精度閾値未満の場合、前記人物辞書を再登録する制御を行う再登録部と、
を備える情報処理装置。
続きを表示(約 1,500 文字)【請求項2】
前記環境情報取得部は、前記環境情報が時系列データである場合、前記環境情報を示す一部のデータが取得できなかったときには、前記環境情報の取得された部分のデータから、前記一部のデータを補間することによって、前記環境情報を推測する、
請求項1に記載の情報処理装置。
【請求項3】
前記分析部は、前記環境情報の変化の大きさを示す環境変化スコアを計算し、
前記再登録部は、前記環境変化スコアが変化閾値より大きい場合、前記人物辞書を再登録する制御を行う、
請求項1又は2に記載の情報処理装置。
【請求項4】
前記1以上の入力デバイスは、マイクロフォンを含み、
前記人物辞書を記憶する人物辞書記憶部と、
前記環境情報を記憶する環境情報記憶部と、
前記入力情報を蓄積する入力情報記憶部と、を更に備え、
前記環境情報は、前記マイクロフォンにより入力された入力情報から得られた音声認識環境情報を含み、
前記環境変化スコアが前記変化閾値より大きい場合、蓄積された前記入力情報に、前記音声認識環境情報を含むデータを重畳することによって、更新データを生成する生成部、を更に備え、
前記再登録部は、前記更新データに基づき、前記人物辞書の再登録を行う第1の再登録処理を実行する、
請求項3に記載の情報処理装置。
【請求項5】
前記環境情報記憶部に記憶された環境情報は、前記人物辞書が示す特徴量に対応する合計モーラの数、または、前記人物辞書が示す特徴量に対応する登録ワードの数を更に含み、
前記再登録部は、前記人物辞書の再登録を行うとき、前記合計モーラの数が、モーラ数閾値より小さい場合、または、前記登録ワードの数が、登録ワード数閾値より小さい場合、前記マイクロフォンによって再入力された音声に基づき、前記人物辞書の再登録を行う第2の再登録処理を実行する、
請求項4に記載の情報処理装置。
【請求項6】
前記再登録部は、前記人物辞書の再登録を行うとき、前記環境変化スコアが前記変化閾値未満であり、かつ、前記合計モーラの数が前記モーラ数閾値以上であり、かつ、前記登録ワードの数が前記登録ワード数閾値以上である場合、前記人物特徴モデルの再学習をすることによって、前記人物特徴モデルを更新する第3の再登録処理を実行する、
請求項5に記載の情報処理装置。
【請求項7】
前記再登録部は、前記人物辞書の再登録が行われた後、前記特定精度が精度閾値より大きい場合、または、再登録された前記人物辞書が示す特徴量が、複数の前記入力情報を用いて計算された前記人物の特徴量の分布の信頼区間内に収まる場合、再登録処理を終了する、
請求項6に記載の情報処理装置。
【請求項8】
複数の前記入力情報は、前記音声認識環境情報を含むデータを、前記入力情報に重畳させることによって新たに生成された追加入力情報を含む、
請求項7に記載の情報処理装置。
【請求項9】
複数の前記入力情報は、前記入力情報に含まれるデータの時系列の順序を入れ替えることによって新たに生成された追加入力情報を含む、
請求項7に記載の情報処理装置。
【請求項10】
一人の前記人物に対し、複数の前記人物辞書が前記人物辞書記憶部に記憶されている場合、前記環境情報に応じて前記人物辞書を選択する選択部、
を更に備える請求項4に記載の情報処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明の実施形態は情報処理装置、情報処理方法及びプログラムに関する。
続きを表示(約 2,200 文字)【背景技術】
【0002】
経時変化または体調変化などによる性能低下を防ぐ人物識別技術が従来から知られている。例えば、識別失敗時に、ユーザーに個人特徴情報を入力してもらうことによって、誤認識されたときに人物情報を更新する方法が従来から知られている。
【先行技術文献】
【特許文献】
【0003】
国際公開第2008-018136号
【非特許文献】
【0004】
Wan et al., Generalized End-to-End Loss for Speaker Verification, ICASSP 2018, pp.4879-4883, 2018
Synder et al., X-Vectors: Robust DNN Embeddings for Speaker Recognition, ICASSP 2018, pp.5329-5333, 2018
Ioffe, Probabilistic linear discriminant analysis, ECCV, Part IV, LNCS 3954, pp.531-542, 2006
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら従来の技術では、使用環境が変わった場合に、識別性能の低下を防ぐことが難しかった。
【課題を解決するための手段】
【0006】
実施形態の情報処理装置は、1以上の入力デバイスと、抽出部と、特定部と、環境情報取得部と、分析部と、再登録部とを備える。1以上の入力デバイスは、入力情報を取得する。抽出部は、人物特徴モデルを用いて、前記入力情報から人物の特徴を示す特徴量を抽出する。特定部は、前記特徴量と、人物辞書が示す特徴量とを比較することによって、前記人物を特定する。環境情報取得部は、前記入力情報から環境情報を取得する。分析部は、前記環境情報の変化、及び、前記特定部による前記人物の特定精度を分析する。再登録部は、前記環境情報の変化があった場合、または、前記特定精度が精度閾値未満の場合、前記人物辞書を再登録する制御を行う。
【図面の簡単な説明】
【0007】
図1は第1実施形態の情報処理装置の機能構成の例を示す図である。
図2は第1実施形態の人物辞書記憶部の例を示す図である。
図3は第1実施形態の環境情報記憶部の例を示す図である。
図4は第1実施形態の人物特定方法の例を示すフローチャートである。
図5は第1実施形態の変形例1の環境情報取得部の機能構成の例を示す図である。
図6は第1実施形態の変形例1の環境情報の例を示す図である。
図7Aは第1実施形態の変形例2の環境情報の取得方法、及び、差異の計算方法の例を示す図である。
図7Bは第1実施形態の変形例2の環境情報の取得方法、及び、差異の計算方法の例を示す図である。
図8は第1実施形態の変形例2の環境情報取得部の機能構成の例を示す図である。
図9は第2実施形態の情報処理装置の機能構成の例を示す図である。
図10は第2実施形態の個人分布モデルの例を示す図である。
図11は第2実施形態の環境情報取得部の機能構成の例を示す図である。
図12は第2実施形態の追加入力情報の生成例を示す図である。
図13は第2実施形態の人物辞書の再登録フローの例1を示すフローチャートである。
図14は第2実施形態の人物辞書の再登録フローの例2を示すフローチャートである。
図15は第3実施形態の情報処理装置の機能構成の例を示す図である。
図16は第4実施形態の情報処理装置の機能構成の例を示す図である。
図17は第4実施形態の経時変化処理部の処理例を示す図である。
図18は第4実施形態の変形例の情報処理装置の機能構成の例を示す図である。
図19は第1乃至第4実施形態の情報処理装置のハードウェア構成の例を示す図である。
【発明を実施するための形態】
【0008】
以下に添付図面を参照して、情報処理装置、情報処理方法及びプログラムの実施形態を詳細に説明する。
【0009】
(第1実施形態)
第1実施形態では、人物特定情報を登録する際に、雑音種などの環境情報も考慮することで、環境が変化したことを検出し、環境に合わせて人物特定情報を更新することで、性能低下を防止する情報処理装置について説明する。第1実施形態の情報処理装置は、任意のデバイスでよく、例えば、パーソナルコンピュータ、スマートデバイス(例えば、タブレット及びスマートフォン等)、及び、ゲーム機等である。
【0010】
[機能構成の例]
図1は第1実施形態の情報処理装置100の機能構成の例を示す図である。第1実施形態の情報処理装置100は、入力デバイス1、信号取得部2、抽出部3、人物特徴モデル記憶部4、登録部5、人物辞書記憶部6、特定部7、環境情報取得部11、分析部21、再登録部31及び環境情報記憶部41を備える。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

株式会社東芝
センサ
1か月前
株式会社東芝
立て看板
1か月前
株式会社東芝
遮断装置
3日前
株式会社東芝
電子機器
4日前
株式会社東芝
回転電機
10日前
株式会社東芝
判定装置
5日前
株式会社東芝
制御装置
1か月前
株式会社東芝
回転電機
2か月前
株式会社東芝
搬送装置
4日前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
9日前
株式会社東芝
半導体装置
1か月前
株式会社東芝
真空バルブ
1か月前
株式会社東芝
半導体装置
2か月前
株式会社東芝
半導体装置
10日前
株式会社東芝
静止誘導電器
1か月前
株式会社東芝
ディスク装置
29日前
株式会社東芝
スイッチギヤ
1か月前
株式会社東芝
スイッチギヤ
25日前
株式会社東芝
区分システム
1か月前
株式会社東芝
アイソレータ
17日前
株式会社東芝
アンテナ装置
2日前
株式会社東芝
電力変換装置
2か月前
株式会社東芝
静止誘導電器
1か月前
株式会社東芝
車両システム
1か月前
株式会社東芝
情報表示装置
2か月前
株式会社東芝
操作盤カバー
2日前
株式会社東芝
粒子線治療装置
1か月前
株式会社東芝
紙葉類処理装置
16日前
株式会社東芝
電池モジュール
2か月前
株式会社東芝
磁気ディスク装置
2日前
株式会社東芝
バックアップ回路
16日前
株式会社東芝
X線厚み測定装置
1か月前
株式会社東芝
磁気ディスク装置
2日前
続きを見る