TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024134879
公報種別
公開特許公報(A)
公開日
2024-10-04
出願番号
2023045310
出願日
2023-03-22
発明の名称
音認識システム、及び音認識方法
出願人
菱洋エレクトロ株式会社
代理人
個人
主分類
G10L
15/10 20060101AFI20240927BHJP(楽器;音響)
要約
【課題】物理音を対象とした認識精度の向上を図る音認識システム、及び音認識方法を提供する。
【解決手段】音素認識を用いた音認識システムであって、音声認識装置1は、取得部と、保存部と、導出部と、を備える。取得部は、媒質を介して伝播する物理音に基づき生成された物理音情報を取得する。保存部は、予め設定された音素認識の認識条件が複数保存される。生成部は、物理音情報に対応する複数の認識履歴を、それぞれ異なる認識条件に基づき生成する。導出部は、複数の認識履歴に基づき、物理音に対応する認識結果を導出する。
【選択図】図4
特許請求の範囲
【請求項1】
音素認識を用いた音認識システムであって、
媒質を介して伝播する物理音に基づき生成された物理音情報を取得する取得部と、
予め設定された前記音素認識の認識条件が複数保存された保存部と、
前記物理音情報に対応する複数の認識履歴を、それぞれ異なる前記認識条件に基づき生成する生成部と、
複数の前記認識履歴に基づき、前記物理音に対応する認識結果を導出する導出部と、
を備えること
を特徴とする音認識システム。
続きを表示(約 1,500 文字)
【請求項2】
前記導出部は、
複数の前記認識履歴毎に含まれる特徴量を特定し、
複数の前記特徴量を用いて、前記認識結果を導出すること
を含むこと
を特徴とする請求項1記載の音認識システム。
【請求項3】
前記生成部は、
第1認識条件に基づき、前記物理音情報に対応する第1認識履歴を生成し、
前記第1認識履歴に基づき、前記第1認識条件とは異なる第2認識条件を選択し、
前記第2認識条件に基づき、前記物理音情報に対応する第2認識履歴を生成すること
を含み、
前記導出部は、前記第1認識履歴、及び前記第2認識履歴を少なくとも含む複数の前記認識履歴に基づき、前記認識結果を導出することを含むこと
を特徴とする請求項1記載の音認識システム。
【請求項4】
前記生成部は、それぞれ異なる前記認識条件を用いて前記認識履歴を生成する第1認識部、及び第2認識部を含むこと
を特徴とする請求項1記載の音認識システム。
【請求項5】
前記生成部は、
前記第1認識部を介して生成された第1認識履歴、及び
前記第2認識部を介して生成された第2認識履歴
に基づき、前記第1認識部及び前記第2認識部における前記認識条件を選択し、
選択された前記認識条件に基づき、
前記第1認識部を介して第3認識履歴、及び
前記第2認識部を介して第4認識履歴
を生成すること
を含むこと
を特徴とする請求項4記載の音認識システム。
【請求項6】
前記認識履歴は、
前記物理音情報から抽出された音素情報と、
前記認識条件の特徴を示す認識条件情報と、
前記認識条件に基づき、前記音素情報を評価した結果を示す評価情報と、
を含むこと
を特徴とする請求項1~5の何れか1項記載の音認識システム。
【請求項7】
前記認識条件情報は、前記音素認識に用いられる学習モデルを特定する情報を含み、
前記学習モデルは、予め取得された参照用物理音情報と、前記参照用物理音情報に紐づく参照用音素とを用いて構築され、前記保存部に複数保存されること
を特徴とする請求項6記載の音認識システム。
【請求項8】
前記認識条件情報は、前記音素認識に用いられるデータベースを特定する情報を含み、
前記データベースは、予め取得された認識用音素と、前記認識用音素に紐づく認識情報とを用いて構築され、前記保存部に複数保存され、
前記生成部は、
前記認識条件に紐づく前記学習モデルを参照し、前記物理音情報から前記音素情報を抽出し、
前記認識条件に紐づく前記データベースを参照し、前記音素情報に対応する前記評価情報を導出し、
前記音素情報、参照した前記学習モデルの情報、参照した前記データベースの情報、及び前記評価情報を含む前記認識履歴を生成すること
を特徴とする請求項7記載の音認識システム。
【請求項9】
音素認識を用いた音認識方法であって、
媒質を介して伝播する物理音に基づき生成された物理音情報を取得する取得ステップと、
前記物理音情報に対応する複数の認識履歴を、それぞれ異なる前記音素認識の認識条件に基づき生成する生成ステップと、
複数の前記認識履歴に基づき、前記物理音に対応する認識結果を導出する導出ステップと、
を備えること
を特徴とする音認識方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、音素認識を用いた音認識システム、及び音認識方法に関する。
続きを表示(約 1,400 文字)
【背景技術】
【0002】
従来、音素認識を用いた音認識に関する技術として、例えば特許文献1、2の音声認識システム等が提案されている。
【0003】
特許文献1では、例えば複数混合のガウス混合モデルを生成し、所定の雑音のない音声HMMと生成された雑音ガウス混合モデルから複数の適応化されたHMMを生成し、生成された複数の適応化されたHMMを並置しマルチパス形式の音響モデルを生成し、抽出された特徴量に基づき上記適応化された音響モデルを用いて発話音声信号の音声認識を行う旨の技術が開示されている。
【0004】
特許文献2では、少なくとも1つの音声データを取得する取得手段と、前記音声データに含まれる開始無音区間及び終了無音区間を抽出し、前記開始無音区間と前記終了無音区間との間に挟まれた音素及び休止区間の配列を、認識対象データとして抽出する抽出手段等を備えることを特徴とする音声認識システムが開示されている。
【先行技術文献】
【特許文献】
【0005】
特開2003-177781号公報
特許第6462936号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
ここで、媒質を介して伝播する物理音の認識技術は、様々な用途が期待される一方で、認識精度の向上が難しいという事情がある。この点、特許文献1では、雑音等の環境音が混入した場合においても、高い音声認識率を得ることを前提としており、環境音については、雑音(ノイズ)としての扱いを前提としている。即ち、音声以外の物理音を対象とした認識については、記載も示唆もされていない。また、特許文献2の開示技術においても、音声以外の物理音を対象とした認識については、記載も示唆もされていない。
【0007】
そこで本発明は、上述した問題に鑑みて案出されたものであり、その目的とするところは、物理音を対象とした認識精度の向上を図る音認識システム、及び音認識方法を提供することにある。
【課題を解決するための手段】
【0008】
第1発明に係る音認識システムは、音素認識を用いた音認識システムであって、媒質を介して伝播する物理音に基づき生成された物理音情報を取得する取得部と、予め設定された前記音素認識の認識条件が複数保存された保存部と、前記物理音情報に対応する複数の認識履歴を、それぞれ異なる前記認識条件に基づき生成する生成部と、複数の前記認識履歴に基づき、前記物理音に対応する認識結果を導出する導出部と、を備えることを特徴とする。
【0009】
第2発明に係る音認識システムは、第1発明において、前記導出部は、複数の前記認識履歴毎に含まれる特徴量を特定し、複数の前記特徴量を用いて、前記認識結果を導出することを含むことを特徴とする。
【0010】
第3発明に係る音認識システムは、第1発明において、前記生成部は、第1認識条件に基づき、前記物理音情報に対応する第1認識履歴を生成し、前記第1認識履歴に基づき、前記第1認識条件とは異なる第2認識条件を選択し、前記第2認識条件に基づき、前記物理音情報に対応する第2認識履歴を生成することを含み、前記導出部は、前記第1認識履歴、及び前記第2認識履歴を少なくとも含む複数の前記認識履歴に基づき、前記認識結果を導出することを含むことを特徴とする。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
名陽木工株式会社
台
24日前
個人
鍵盤楽器の調号別音階表示機能
19日前
株式会社大貴
吸音材及びその製造方法
24日前
個人
リガチャー付メタル製マウスピース
3日前
富士電機機器制御株式会社
ブザー
18日前
ヤマハ株式会社
ドラムスタンド
10日前
株式会社フジタ
環境音快音化システム
17日前
個人
リード管楽器用音響改善装置
3日前
学校法人早稲田大学
音声認識システムおよびプログラム
18日前
株式会社第一興商
カラオケ装置
10日前
株式会社第一興商
カラオケ装置
17日前
ニチアス株式会社
吸音構造体
3日前
株式会社レゾナック
吸音構造体及びタイヤ
24日前
株式会社レゾナック
吸音構造体及びタイヤ
24日前
三菱重工業株式会社
音響減衰装置および音響減衰方法
24日前
トヨタ自動車株式会社
会話音声保護装置
23日前
トヨタ紡織株式会社
乗物用騒音レベル予測システム
17日前
フジテック株式会社
エレベータの制御システム
11日前
ヤマハ株式会社
情報処理方法および情報処理装置
4日前
株式会社東芝
会話評価プログラム、装置及び方法
10日前
株式会社レゾナック
吸音構造体、吸音装置、及び吸音方法
24日前
ローランド株式会社
ドラムパッチ及び打面の保護方法
10日前
株式会社JVCケンウッド
提案装置および提案方法
17日前
日産自動車株式会社
騒音制御方法及び騒音制御装置
5日前
三菱電機株式会社
情報処理装置、出力方法、及び出力プログラム
17日前
株式会社ユピテル
システム及びプログラム
12日前
CASE特許株式会社
車載機及び車両
12日前
株式会社NTTドコモ
音声区間検出装置及び音声区間検出方法
5日前
ヤマハ株式会社
演奏音生成方法、演奏音生成装置、およびプログラム
4日前
ヤマハ株式会社
信号処理方法、信号処理システム、およびプログラム
4日前
ヤマハ株式会社
コンテンツ情報処理方法およびコンテンツ情報処理装置
3日前
LINEヤフー株式会社
対話システム、プログラムおよび対話方法
25日前
国立研究開発法人産業技術総合研究所
雰囲気推定方法、情報処理装置、及びプログラム
17日前
レンゴー株式会社
遮音吸音材およびその製造方法
17日前
日本放送協会
音声認識のエラーを検出するためのモデルを生成する学習装置、音声認識装置及びプログラム
11日前
パナソニックIPマネジメント株式会社
ノイズ解析装置、ノイズ解析方法及びプログラム
10日前
続きを見る
他の特許を見る