TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024110756
公報種別公開特許公報(A)
公開日2024-08-16
出願番号2023015534
出願日2023-02-03
発明の名称音声翻訳システムおよび音声翻訳方法
出願人学校法人幾徳学園,国立大学法人 長崎大学
代理人弁理士法人MIP
主分類G06F 40/289 20200101AFI20240808BHJP(計算;計数)
要約【課題】 翻訳時間を短縮でき、利用可能なシーンを拡大できるシステムや方法を提供すること。
【解決手段】 音声翻訳システムは、外国語の音声を日本語に翻訳するシステムであり、入力された外国語の音声の音声認識を行う音声認識部20と、音声認識された音声を単語単位で分割する分割部21と、単語もしくは1つの意味としてまとまりのある2以上の単語を連結した連結単語につき、日本語に翻訳する翻訳部27と、日本語に翻訳された単語もしくは連結単語の音声合成を行う音声合成部30とを含む。
【選択図】 図2
特許請求の範囲【請求項1】
外国語の音声を日本語に翻訳するシステムであって、
入力された外国語の音声の音声認識を行う音声認識手段と、
音声認識された音声を単語単位で分割する分割手段と、
単語もしくは1つの意味としてまとまりのある2以上の単語を連結した連結単語につき、日本語に翻訳する翻訳手段と、
日本語に翻訳された単語もしくは連結単語の音声合成を行う音声合成手段と
を含む、音声翻訳システム。
続きを表示(約 1,100 文字)【請求項2】
前記単語もしくは連結単語が発生する以前の翻訳済みの音声内容を記憶する音声内容記憶手段と、
前記単語もしくは連結単語が複数の訳の候補を有する場合、前記音声内容記憶手段に記憶された前記翻訳済みの音声内容に基づき、機械学習により学習された学習済みモデルを使用して、各訳の候補が出現する確率を算出する演算手段と
を含み、
前記翻訳手段は、算出された確率が閾値以上である訳の候補を、前記単語もしくは連結単語の訳として選択する、請求項1に記載の音声翻訳システム。
【請求項3】
前記翻訳手段は、算出された前記確率が前記閾値以上である訳の候補が存在しない場合、前記単語もしくは連結単語を翻訳せずに外国語のまま使用する、請求項2に記載の音声翻訳システム。
【請求項4】
前記音声合成手段は、前記翻訳手段により翻訳されない外国語の単語もしくは連結単語を、日本語が有する音素のみで音声合成を行う、請求項3に記載の音声翻訳システム。
【請求項5】
前記翻訳手段は、算出された前記確率が前記閾値以上である訳の候補が存在せず、前記訳の候補が所定数以下である場合、前記訳の候補を全て選択し、
前記音声合成手段は、選択した前記訳の候補を、無音期間を挟んで音声合成を行う、請求項2に記載の音声翻訳システム。
【請求項6】
前記翻訳手段は、算出された前記確率が前記閾値以上である訳の候補が2以上存在する場合、前記確率が最も高い訳の候補を選択する、請求項2に記載の音声翻訳システム。
【請求項7】
連続する2以上の単語が連結単語として第1の辞書に登録されているか否かを判断する連結性判断手段を含む、請求項1に記載の音声翻訳システム。
【請求項8】
前記単語もしくは連結単語が省略可能な単語として第2の辞書に登録されているか否かを判定する省略可否判定手段を含む、請求項7に記載の音声翻訳システム。
【請求項9】
前記単語もしくは連結単語が第3の辞書を参照して複数の訳の候補を有するか否かを判定する多義語判定手段を含む、請求項8に記載の音声翻訳システム。
【請求項10】
前記単語もしくは連結単語が第4の辞書を参照して転置すべき単語もしくは連結単語か否かを判定する転置処理手段と、
転置すべき単語もしくは連結単語と判定された場合、判定された前記単語もしくは連結単語を記憶する単語記憶手段と
を含む、請求項9に記載の音声翻訳システム。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、外国語の音声を日本語に翻訳するシステムおよび方法に関する。
続きを表示(約 1,500 文字)【背景技術】
【0002】
近年、英語等の外国語から日本語への翻訳、あるいはその逆方向への翻訳が、AI(Artificial Intelligence)を用いて自動的に変換される自動翻訳機や自動通訳機が開発されている。しかしながら、1つの文が終了しないと翻訳ができないことから、翻訳に時間を要し、リアルタイムでの双方向の円滑な会話ができない。
【0003】
そこで、入力された発話を句や節といった単位で翻訳し、その部分的な翻訳結果の日本語表現を順次確定していきながら、文全体として意味の通る自然な日本語文を生成する技術が提案されている(例えば、特許文献1、2参照)。
【先行技術文献】
【特許文献】
【0004】
特開平8-263499号公報
特開平10-247194号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記の従来の技術では、句や節の単位で語順を入れ替えるため、双方向のリアルタイムな会話にとって十分なレベルで翻訳時間を短縮することができていない。このため、3人以上で行う会議において、誰かの発言に対して直ちに応答したいケースで用いることはできず、利用可能なシーンが制限されている。
【課題を解決するための手段】
【0006】
そこで、本発明の発明者らは、鋭意検討の結果、従来の技術が節単位等の出来るだけ長い区間で文法を遵守した語順とすることで文全体の意味の整合性を重視することを基本とし、これがリアルタイム性を犠牲にしている主要因となっていることから、意味が分かる最小の単位として単語もしくは2以上の単語を連結した連結単語を直ちに翻訳するようにすれば、リアルタイムな会話にとって十分なレベルで翻訳時間を短縮することができることを見出した。上記課題は、本発明の音声翻訳システムおよび音声翻訳方法を提供することにより解決される。
【0007】
本発明によれば、外国語の音声を日本語に翻訳するシステムであって、
入力された外国語の音声の音声認識を行う音声認識手段と、
音声認識された音声を単語単位で分割する分割手段と、
単語もしくは1つの意味としてまとまりのある2以上の単語を連結した連結単語につき、日本語に翻訳する翻訳手段と、
日本語に翻訳された単語もしくは連結単語の音声合成を行う音声合成手段と
を含む、音声翻訳システムが提供される。
【0008】
音声翻訳システムは、単語もしくは連結単語が発生する以前の翻訳済みの音声内容を記憶する音声内容記憶手段と、単語もしくは連結単語が複数の訳の候補を有する場合、音声内容記憶手段に記憶された翻訳済みの音声内容に基づき、機械学習により学習された学習済みモデルを使用して、各訳の候補が出現する確率を算出する演算手段とを含むことができ、翻訳手段は、算出された確率が閾値以上である訳の候補を、単語もしくは連結単語の訳として選択することができる。
【0009】
翻訳手段は、算出された確率が閾値以上である訳の候補が存在しない場合、単語もしくは連結単語を翻訳せずに外国語のまま使用することができる。
【0010】
音声合成手段は、翻訳手段により翻訳されない外国語の単語もしくは連結単語を、日本語が有する音素のみで音声合成を行うことができる。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する
Flag Counter

関連特許

学校法人幾徳学園
鍵盤楽器
1か月前
学校法人幾徳学園
映像処理装置
26日前
富士電機株式会社
電気集塵機
2か月前
学校法人幾徳学園
情報入力システムおよび情報入力方法
4日前
トヨタ自動車株式会社
走行制御システムおよび走行制御方法
1か月前
個人
マウス用テーブル
1か月前
個人
管理装置
1か月前
個人
特徴検討支援システム
1か月前
アズビル株式会社
防爆装置
26日前
個人
契約管理サーバ
1か月前
個人
業界地図作成システム
13日前
個人
人的価値発掘システム
16日前
株式会社宗建
SNSサーバー
24日前
キヤノン電子株式会社
情報処理装置
16日前
株式会社セガフェイブ
遊戯機
1か月前
個人
選択操作音声出力システム
1か月前
個人
配送システムおよび同包箱
16日前
ミサワホーム株式会社
システム
16日前
ミサワホーム株式会社
管理装置
16日前
株式会社ジール
文章の分析装置
1か月前
キヤノン株式会社
印刷制御装置
4日前
オムロン株式会社
認証中継サーバ
23日前
アスエネ株式会社
森林管理の方法
26日前
大同特殊鋼株式会社
棒材計数装置
23日前
トヨタ自動車株式会社
車両
1か月前
個人
動作のデザイン評価の方法及び装置
23日前
株式会社奥村組
削孔位置検出方法
1か月前
日本電気株式会社
システム及び方法
1か月前
株式会社八咲
イベント管理システム
23日前
株式会社チノー
ユーザ認証システム
11日前
トヨタ自動車株式会社
作業評価装置
2日前
個人
口座悪用を防止する口座管理システム
18日前
セコム株式会社
監視装置
1か月前
セコム株式会社
監視装置
1か月前
個人
分類処理プログラム、システム及び方法
1か月前
個人
分類処理プログラム、システム及び方法
1か月前
続きを見る