TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024069156
公報種別公開特許公報(A)
公開日2024-05-21
出願番号2023188581
出願日2023-11-02
発明の名称音声生成プログラム及び音声生成システム
出願人株式会社スクウェア・エニックス
代理人個人,個人
主分類G10L 13/08 20130101AFI20240514BHJP(楽器;音響)
要約【課題】開発者の作業負担の増加を抑えつつ架空言語としての音声を生成する。
【解決手段】所定言語のテキストから音声特徴量に変換することについて予め学習が行われた学習済モデルに、所定言語とは異なる言語のテキストを入力することで、当該テキストから音声特徴量に変換し、変換した音声特徴量から音声を合成する。また、学習済モデルを用いて、入力したテキストのうち、所定言語に属する文字をトークンに変換し、所定言語に属さない文字を所定規則に従って数値に変換し、変換したトークン及び数値から音声特徴量に変換してもよい。
【選択図】図3
特許請求の範囲【請求項1】
テキストから音声を生成する機能をサーバに実現させるための音声生成プログラムであって、
前記サーバに、
所定言語のテキストから音声特徴量に変換することについて予め学習が行われた学習済変換モデルに、前記所定言語とは異なる言語のテキストを入力することで、当該テキストから音声特徴量に変換する変換機能と、
変換された前記音声特徴量から音声を合成する合成機能とを
実現させるための音声生成プログラム。
続きを表示(約 860 文字)【請求項2】
前記変換機能では、
前記学習済変換モデルを用いて、入力したテキストのうち、前記所定言語に属する文字をトークンに変換し、前記所定言語に属さない文字を所定規則に従って数値に変換し、
前記トークン及び前記数値から前記音声特徴量に変換する機能を
実現させるための請求項1記載の音声生成プログラム。
【請求項3】
前記サーバに、所定の記憶領域に登録された語(以下、「予約語」という。)と、音声または音声の特定方法とが対応付けされた予約語情報を記憶する記憶手段を参照し、前記所定言語とは異なる言語のテキストにおける予約語を特定する特定機能を実現させ、
前記合成機能では、前記音声特徴量から合成される音声のうち前記予約語に対応する部分を、当該予約語に対応する音声に変更する機能を
実現させるための請求項1又は請求項2記載の音声生成プログラム。
【請求項4】
通信ネットワークと、サーバと、ユーザ端末とを備え、テキストから音声を生成する処理を行うための音声生成システムであって、
所定言語のテキストから音声特徴量に変換することについて予め学習が行われた学習済変換モデルに、前記所定言語とは異なる言語のテキストを入力することで、当該テキストから音声特徴量に変換する変換手段と、
変換された前記音声特徴量から音声を合成する合成手段と
を含む音声生成システム。
【請求項5】
テキストから音声を生成する機能をユーザ端末に実現させるための音声生成プログラムであって、
前記ユーザ端末に、
所定言語のテキストから音声特徴量に変換することについて予め学習が行われた学習済変換モデルに、前記所定言語とは異なる言語のテキストを入力することで、当該テキストから音声特徴量に変換する変換機能と、
変換された前記音声特徴量から音声を合成する合成機能とを
実現させるための音声生成プログラム。

発明の詳細な説明【技術分野】
【0001】
本発明の実施形態の少なくとも1つは、テキストから音声を生成する機能を実現させるための音声生成プログラム及び音声生成システムに関する。
続きを表示(約 1,500 文字)【背景技術】
【0002】
従来、ビデオゲームや映像作品等において、キャラクタ等が架空言語の言葉を音声で話すように制御することが行われてきた。ここで、キャラクタに架空言語の言葉を話させる手段のひとつとして、実在する言語のテキストから架空言語としての音声を生成するものがある。
【0003】
例えば、特許文献1には、実在する言語の変換前文字列と架空言語の変換後文字列とを対応付けた辞書データを参照し、実在する言語のテキストを所定の文字列毎に変換する処理を実行することで架空言語のテキストを生成し、当該テキストを音声として出力する構成が開示されている。
【先行技術文献】
【特許文献】
【0004】
特開2018-206191号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかし、特許文献1記載の構成では、音声に変換される対象のテキストに含まれる可能性がある文字列すべてに対して架空言語の変換後文字列を対応付けた辞書データを用意する必要がある。そのため、音声に変換される対象のテキストに含まれる可能性がある文字列の種類が増えるに従って辞書データを用意する開発者の作業負担が大きくなってしまうという問題があった。
【0006】
本発明の少なくとも1つの実施形態の目的は、開発者の作業負担の増加を抑えつつ架空言語としての音声を生成することが可能な音声生成プログラム及び音声生成システムを提供することである。
【課題を解決するための手段】
【0007】
非限定的な観点によると、本発明の一実施形態に係る音声生成プログラムは、テキストから音声を生成する機能をサーバに実現させるための音声生成プログラムであって、前記サーバに、所定言語のテキストから音声特徴量に変換することについて予め学習が行われた学習済変換モデルに、前記所定言語とは異なる言語のテキストを入力することで、当該テキストから音声特徴量に変換する変換機能と、変換された前記音声特徴量から音声を合成する合成機能とを実現させるためのものである。
【0008】
非限定的な観点によると、本発明の一実施形態に係る音声生成システムは、通信ネットワークと、サーバと、ユーザ端末とを備え、テキストから音声を生成する処理を行うための音声生成システムであって、所定言語のテキストから音声特徴量に変換することについて予め学習が行われた学習済変換モデルに、前記所定言語とは異なる言語のテキストを入力することで、当該テキストから音声特徴量に変換する変換手段と、変換された前記音声特徴量から音声を合成する合成手段とを含むことを特徴とする。
【0009】
非限定的な観点によると、本発明の一実施形態に係る音声生成プログラムは、テキストから音声を生成する機能をユーザ端末に実現させるための音声生成プログラムであって、前記ユーザ端末に、所定言語のテキストから音声特徴量に変換することについて予め学習が行われた学習済変換モデルに、前記所定言語とは異なる言語のテキストを入力することで、当該テキストから音声特徴量に変換する変換機能と、変換された前記音声特徴量から音声を合成する合成機能とを実現させるためのものである。
【発明の効果】
【0010】
本願の各実施形態により1または2以上の不足が解決される。
【図面の簡単な説明】
(【0011】以降は省略されています)

特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する

関連特許

株式会社トランストロン
軸構造
2日前
株式会社大貴
吸音材及びその製造方法
1か月前
株式会社第一興商
カラオケ装置
20日前
学校法人幾徳学園
鍵盤楽器
6日前
株式会社今仙電機製作所
自動車用警報音発生装置
17日前
株式会社河合楽器製作所
鍵盤装置
20日前
株式会社河合楽器製作所
鍵盤装置
14日前
株式会社河合楽器製作所
鍵盤装置
14日前
ヤマハ株式会社
打撃検出デバイス
1か月前
株式会社イノアックコーポレーション
防音構造
13日前
日本製紙パピリア株式会社
表面材および吸音材
6日前
個人
アコースティック・ギター用単弦牽引装置のための台座
20日前
ヤマハ株式会社
動画処理方法
2日前
ヤマハ株式会社
情報処理方法
24日前
株式会社第一興商
カラオケ装置
17日前
株式会社第一興商
カラオケ装置
1か月前
株式会社第一興商
カラオケ装置
21日前
パナソニックIPマネジメント株式会社
個室ブース
1か月前
ヤマハ株式会社
管楽器及び管楽器用のキー
14日前
株式会社フューチャー・ブレイン
音声合成システム及び音声合成方法
1か月前
日産自動車株式会社
音声認識方法及び音声認識装置
2日前
ヤマハ株式会社
鍵盤ユニット
14日前
ヤマハ株式会社
音データ生成方法
7日前
株式会社イノアックコーポレーション
吸音材
23日前
ヤマハ株式会社
音源およびその制御方法、プログラム、電子鍵盤楽器
20日前
TOA株式会社
音源形成システム、音源形成プログラム、および音源形成方法
20日前
本田技研工業株式会社
対話理解装置、および対話理解方法
23日前
ピクシーダストテクノロジーズ株式会社
吸音部材及び吸音壁
1か月前
日本放送協会
解説音声制作装置、携帯端末及びプログラム
1か月前
ヤマハ株式会社
音高表示装置、音高表示方法、およびプログラム
23日前
花王株式会社
対話システム、対話プログラム、対話方法
28日前
株式会社NTTドコモ
音声書き起こしシステム及び音声翻訳システム
1か月前
京セラ株式会社
表示制御プログラム、表示制御装置、及び表示制御方法
1か月前
TOA株式会社
会話漏洩評価装置
1か月前
カシオ計算機株式会社
ペダル装置及び電子鍵盤楽器
8日前
ヤマハ株式会社
音処理方法、音処理装置、および音処理プログラム
1か月前
続きを見る