TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024133725
公報種別
公開特許公報(A)
公開日
2024-10-02
出願番号
2024113591,2019171730
出願日
2024-07-16,2019-09-20
発明の名称
人工神経網における復号化方法、音声認識装置及び音声認識システム
出願人
三星電子株式会社
,
Samsung Electronics Co.,Ltd.
代理人
弁理士法人ITOH
主分類
G10L
15/32 20130101AFI20240925BHJP(楽器;音響)
要約
【課題】 自己回帰に基づくシーケンス生成人工神経網における低い確率トークンの処理方法及び装置が提供される。
【解決手段】 人工神経網におけるデコーダは以前に入力された少なくとも1つの入力トークンに基づいて、出力トークンの候補の確率を予測し、予測された確率に基づいて、候補のうち出力トークンを決定し、出力トークンの決定された確率に基づいて出力トークン及び予め定義された特殊トークンのいずれか1つを選択することによって、次の入力トークンを決定する。
【選択図】図1
特許請求の範囲
【請求項1】
第1人工神経網における復号化方法において、
以前に入力された少なくとも1つの入力トークンに基づいて、出力トークンの候補の確率を予測するステップと、
前記第1人工神経網と連動する少なくとも1つの第2人工神経網によって予測された前記候補の確率と、前記第1人工神経網によって予測された前記候補の確率との組合せに基づいて、前記候補のうち前記出力トークンを選択するステップと、
前記少なくとも1つの第2人工神経網のうち、前記出力トークンの確率を最も高く判断した人工神経網と前記第1人工神経網との間で前記出力トークンの確率を比較するステップと、
前記比較の結果に基づいて、前記出力トークン及び予め定義された特殊トークンのいずれか1つを選択することによって、前記第1人工神経網の次の入力トークンを決定するステップと、
を含む人工神経網における復号化方法。
続きを表示(約 1,300 文字)
【請求項2】
前記次の入力トークンを決定するステップは、
前記出力トークンの確率を最も高く判断した人工神経網と前記第1人工神経網の前記出力トークンの確率の差が予め決定した閾値よりも大きい場合、前記特殊トークンを前記第1人工神経網の前記次の入力トークンとして選択するステップと、
前記出力トークンの確率を最も高く判断した人工神経網と前記第1人工神経網の前記出力トークンの確率の差が予め決定した閾値よりも小さい場合、前記出力トークンを前記第1人工神経網の前記次の入力トークンとして選択するステップと、
を含む、請求項1に記載の人工神経網における復号化方法。
【請求項3】
前記特殊トークンに基づいて予測される次の出力トークンの候補の信頼度は、前記閾値よりも大きい場合、前記出力トークンに基づいて予測される次の出力トークンの候補の信頼度よりも高い、請求項2に記載の人工神経網における復号化方法。
【請求項4】
前記人工神経網の入力レイヤは、前記候補それぞれに対応する複数のノード及び前記特殊トークンに対応する特殊ノードを含む、請求項1-3のうち何れか1項に記載の人工神経網における復号化方法。
【請求項5】
前記少なくとも1つの入力トークンは、前記人工神経網によって予め予測された出力トークン及び前記特殊トークンのうち少なくとも1つを含む、請求項1-3のうち何れか1項に記載の人工神経網における復号化方法。
【請求項6】
前記出力トークンの候補の確率を予測するステップは、前記少なくとも1つの入力トークンと前記出力トークンとの間の相関関係に基づいて、前記出力トークンの候補の確率を予測するステップを含む、請求項1に記載の人工神経網における復号化方法。
【請求項7】
前記少なくとも1つの入力トークン及び前記次の入力トークンに基づいて次の出力トークンを決定するステップをさらに含む、請求項1-6のうち何れか1項に記載の人工神経網における復号化方法。
【請求項8】
前記特殊トークン以外のトークンが前記特殊トークンにアテンションしないように前記特殊トークンをマスキングするステップをさらに含む、請求項1-7のうち何れか1項に記載の人工神経網における復号化方法。
【請求項9】
前記特殊トークンが前記次の入力トークンとして決定された場合、次の出力トークンと前記特殊トークンとの間の相関関係を予め決定した数値以下に設定するステップをさらに含む、請求項1-8のうち何れか1項に記載の人工神経網における復号化方法。
【請求項10】
前記出力トークンを決定するステップは、
前記出力トークンが前記特殊トークンと同一であるかを判断するステップと、
前記出力トークンが前記特殊トークンと同一である場合、前記候補のうち2番目に確率の高いトークンを前記出力トークンとして決定するステップと、
を含む、請求項1に記載の人工神経網における復号化方法。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明の実施形態は、人工神経網における復号化方法及びその装置に関する。
続きを表示(約 1,300 文字)
【背景技術】
【0002】
長さの決められていないシーケンスを人工神経網の入力として受け、決められていない長さの出力を生成しなければならない問題を解決するための方法として、シーケンスツーシーケンス(sequence-to-sequence)モデルの1つであるエンコーダ-デコーダの人工神経網モデルが導入されたが、特に、その中でも決められていない長さの出力を人工神経網に算出するために、1つのシーケンスを構成している単位であるトークン(token)ごとに人工神経網の以前出力を入力にして次の出力を続けて出力する方法は、自己回帰(auto-regressive)復号化と呼ばれる。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明の目的は、人工神経網における復号化方法及びその装置を提供する。
【課題を解決するための手段】
【0004】
一実施形態に係る第1人工神経網における復号化方法は、以前に入力された少なくとも1つの入力トークンに基づいて、出力トークンの候補の確率を予測するステップと、前記予測された確率に基づいて、前記候補のうち前記出力トークンを決定するステップと、前記出力トークンの決定された確率に基づいて、前記出力トークン及び予め定義された特殊トークンのいずれか1つを選択することによって、次の入力トークンを決定するステップとを含む。
【0005】
前記特殊トークンを次の入力トークンとして決定する場合、前記特殊トークンに基づいて予測される次の出力トークンの候補の信頼度は、前記出力トークンに基づいて予測される次の出力トークンの候補の信頼度よりも高い。
【0006】
前記出力トークンを決定するステップは、前記第1人工神経網と連動する少なくとも1つの第2人工神経網によって予測された前記候補の確率と、前記第1人工神経網によって予測された前記候補の確率との組合せに基づいて、前記候補のうち前記出力トークンを選択し得る。
【0007】
前記人工神経網の入力レイヤは、前記候補それぞれに対応する複数のノード及び前記特殊トークンに対応する特殊ノードを含み得る。
【0008】
前記少なくとも1つの入力トークンは、前記人工神経網によって予め予測された出力トークン及び前記特殊トークンのうち少なくとも1つを含み得る。
【0009】
前記出力トークンを決定するステップは、前記候補のうち確率が最も高いトークンを選択するステップを含み得る。
【0010】
前記次の入力トークンを決定するステップは、前記出力トークンの確率と予め決定した閾値確率とを比較するステップと、前記出力トークンの確率が前記閾値確率よりも小さい場合、前記特殊トークンを前記次の入力トークンとして選択するステップと、前記出力トークンの確率が前記閾値確率よりも大きい場合、前記出力トークンを前記次の入力トークンとして選択するステップとを含み得る。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
コンサートイアーホーン
今日
個人
ヴァイオリン ビオラ聴診器
今日
株式会社トランストロン
軸構造
13日前
富士電機株式会社
パネル構造
3日前
学校法人幾徳学園
鍵盤楽器
17日前
積水化学工業株式会社
2重壁遮音構造体
3日前
三菱電機株式会社
吸音体
7日前
株式会社河合楽器製作所
鍵盤装置
25日前
株式会社河合楽器製作所
鍵盤装置
25日前
株式会社イノアックコーポレーション
防音構造
24日前
日本製紙パピリア株式会社
表面材および吸音材
17日前
ヤマハ株式会社
動画処理方法
13日前
ヤマハ株式会社
楽器
7日前
株式会社第一興商
カラオケ装置
3日前
菱洋エレクトロ株式会社
音認識システム、及び音認識方法
3日前
丸子警報器株式会社
警報器
3日前
カシオ計算機株式会社
鍵盤楽器
3日前
ヤマハ株式会社
管楽器及び管楽器用のキー
25日前
カシオ計算機株式会社
電子鍵盤機器
3日前
カシオ計算機株式会社
電子鍵盤機器
3日前
日産自動車株式会社
音声認識方法及び音声認識装置
13日前
ヤマハ株式会社
鍵盤ユニット
25日前
ローム株式会社
音声認証装置、および機器
10日前
ヤマハ株式会社
音データ生成方法
18日前
セコム株式会社
対話システム及びセンタ装置
4日前
株式会社IHI
吸音材、および、吸音材の製造方法
7日前
ヤマハ株式会社
音変換方法およびプログラム
3日前
ヤマハ株式会社
音変換方法およびプログラム
3日前
ヤマハ株式会社
リード及びリードの製造方法
7日前
シナプティクス インコーポレイテッド
ハンズフリー通信のための音源分類
6日前
カシオ計算機株式会社
鍵盤楽器の製造方法及び鍵盤楽器
3日前
能美防災株式会社
警報ベル
5日前
カシオ計算機株式会社
電子楽器、電子鍵盤楽器及び電子機器
3日前
株式会社デンソーエレクトロニクス
ブザーおよびその製造方法
3日前
株式会社河合楽器製作所
グランドピアノの譜面台ユニット取付構造
7日前
株式会社日立情報通信エンジニアリング
音声入力支援システム、音声入力支援方法
17日前
続きを見る
他の特許を見る