TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025017835
公報種別
公開特許公報(A)
公開日
2025-02-06
出願番号
2023121124
出願日
2023-07-25
発明の名称
音声処理システム、音声処理方法
出願人
ドーナッツロボティクス株式会社
代理人
弁理士法人みなとみらい特許事務所
主分類
G10L
15/00 20130101AFI20250130BHJP(楽器;音響)
要約
【課題】
翻訳を伴う音声テキスト化の好適な処理を実現する。
【解決手段】
入力された音声データをテキスト化し、テキストデータをそれぞれの音声入出力装置に送信し、指定言語と、テキストデータ及び当該テキストデータの変換結果の少なくとも何れか一方と、に基づきそれぞれの音声入出力装置において出力する。
【選択図】図1
特許請求の範囲
【請求項1】
音声処理システムであって、
音声処理装置と、複数の音声入出力装置と、を備え、
前記音声処理装置は、入力された音声データをテキスト化し、テキストデータをそれぞれの音声入出力装置に送信するテキスト処理部を備え、
それぞれの前記音声入出力装置は、指定言語と、前記テキストデータ及び前記テキストデータの変換結果の少なくとも何れか一方と、に基づき出力する出力部を備える、音声処理システム。
続きを表示(約 720 文字)
【請求項2】
前記音声処理装置は、音声データを前記音声入出力装置より取得する音声取得部と、
当該音声データのテキスト化領域を制御する制御指示を前記音声入出力装置より取得する制御指示取得部と、を備える、請求項1に記載の音声処理システム。
【請求項3】
前記出力部は、前記テキストデータ又は前記テキストデータの変換結果をチャット画面として前記音声入出力装置の表示部に表示し、
前記チャット画面は、制御指示ボタンを備え、
前記制御指示取得部は、前記制御指示ボタンのオン/オフ操作に応じて生成される前記テキスト化領域に関する制御指示を取得する、請求項2に記載の音声処理システム。
【請求項4】
前記音声入出力装置は、制御指示ボタンを備え、
前記制御指示取得部は、前記制御指示ボタンのオン/オフ操作に応じて生成される前記テキスト化領域に関する制御指示を取得する、請求項2に記載の音声処理システム。
【請求項5】
前記出力部は、他の音声入出力装置より送信された音声データ及び、前記変換結果に対応する合成音声データの少なくとも何れか一方を音声出力する、請求項1~4の何れか一項に記載の音声処理システム。
【請求項6】
音声処理装置と、複数の音声入出力装置を用いた音声処理方法であって、
入力された音声データをテキスト化し、テキストデータをそれぞれの音声入出力装置に送信し、
指定言語と、前記テキストデータ及び前記テキストデータの変換結果の少なくとも何れか一方と、に基づきそれぞれの前記音声入出力装置において出力する、音声処理方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、翻訳を伴う音声テキスト化の好適な処理を実現する音声処理システム、音声処理方法に関する。
続きを表示(約 1,200 文字)
【背景技術】
【0002】
異なる言語による対話におけるデータ処理において、まず、第1言語の入力音声を取得し、入力音声を第1言語の第1テキストデータに変換処理し、第1言語の第1テキストデータを第2言語の第1テキストデータに翻訳処理し、第2言語の第1テキストデータを出力する、という流れが一般的に知られている。また、第2言語の第1テキストデータを第2言語の出力音声に変換して出力することで、異なる言語による対話を実現することが知られている。
【0003】
特許文献1に記載の双方向音声翻訳システムでは、受け付ける音声又は当該音声の言語に応じた適切な音声認識エンジン、翻訳エンジン、音声合成エンジンの組合せによる音声翻訳が実行できることが開示されている。
【0004】
このように、異なる言語間における音声対話では、第1言語および第2言語の間で翻訳処理を実行するための各種エンジンを制御し、第1言語の音声データおよび第1テキストデータ、並びに、その翻訳結果である第2言語の音声データおよびテキストデータが生成されるように、多数のデータと処理を伴うことから複雑な構成であることが把握される。
【先行技術文献】
【特許文献】
【0005】
国際公開第2019/111346号
【発明の概要】
【発明が解決しようとする課題】
【0006】
翻訳を伴う音声データ処理は、工数やデータ数が多いことから処理速度、処理負担などのコストが大きいことが課題であった。
【0007】
本発明は、翻訳を伴う音声テキスト化の好適な処理を実現する技術を提供することを解決すべき課題とする。
【課題を解決するための手段】
【0008】
上述した課題を解決するために、本発明は、音声処理システムであって、音声処理装置と、複数の音声入出力装置と、を備え、前記音声処理装置は、入力された音声データをテキスト化し、テキストデータをそれぞれの音声入出力装置に送信するテキスト処理部を備え、それぞれの前記音声入出力装置は、指定言語と、前記テキストデータ及び前記テキストデータの変換結果の少なくとも何れか一方と、に基づき出力する出力部を備える。
【0009】
また、本発明は、音声処理装置と、複数の音声入出力装置を用いた音声処理方法であって、入力された音声データをテキスト化し、テキストデータをそれぞれの音声入出力装置に送信し、指定言語と、前記テキストデータ及び前記テキストデータの変換結果の少なくとも何れか一方と、に基づきそれぞれの前記音声入出力装置において出力する。
【0010】
このような構成とすることで、音声データに対応するテキストデータを、それぞれの音声入出力装置の指定言語によって変換結果の出力とするか判断でき、出力のリアルタイム性を向上させることができる。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
ヤマハ株式会社
ヘルムホルツ共鳴器
19日前
ブラザー工業株式会社
カラオケ装置
23日前
ヤマハ株式会社
電子楽器
23日前
ブラザー工業株式会社
カラオケ装置
23日前
セイコーエプソン株式会社
吸音ボード
13日前
日産自動車株式会社
防音構造体
13日前
ヤマハ株式会社
シンバルワッシャ
26日前
株式会社イノアックコーポレーション
遮音カバー
26日前
株式会社第一興商
カラオケ装置
19日前
コスモネクスト株式会社
入力支援プログラム及び入力支援方法
6日前
京セラ株式会社
音出力装置及び音出力方法
13日前
日本放送協会
音声認識装置およびプログラム
13日前
本田技研工業株式会社
能動型騒音低減装置
19日前
本田技研工業株式会社
能動型騒音低減装置
13日前
トヨタ自動車株式会社
制御装置及び制御方法
23日前
株式会社アナザーウェア
鍵盤画面表示プログラム及びそのシステム
19日前
トヨタ自動車株式会社
異音診断システム
19日前
株式会社コルグ
音波生成装置、音波生成方法、プログラム
6日前
株式会社SOKEN
遮音部
23日前
ソフトバンクグループ株式会社
行動制御システム
6日前
株式会社イノアックコーポレーション
ダクト
23日前
永楽電気株式会社
放送音声文字化システム及び放送設備における故障診断方法
13日前
アルプスアルパイン株式会社
オーディオ信号処理装置及び遠隔制御システム
23日前
パイオニア株式会社
情報処理装置
今日
ドーナッツロボティクス株式会社
音声処理システム、音声処理方法
6日前
コニカミノルタ株式会社
リモート会議システムおよび文字情報生成方法および文字情報生成プログラム
26日前
三菱重工業株式会社
サイレンサ
19日前
ソフトバンクグループ株式会社
データ処理装置、データ処理方法、及びプログラム
13日前
国立研究開発法人情報通信研究機構
音声認識システム、音声認識方法およびプログラム
23日前
セイコーエプソン株式会社
キッチンプリンター用ブザーユニット、及びキッチンプリンターシステム
26日前
株式会社アナザーウェア
鍵盤画面表示プログラム及びそのシステム
19日前
カシオ計算機株式会社
情報処理装置、情報処理方法及びプログラム
今日
日産自動車株式会社
シート状防音構造体、並びにこれを用いた自動車用部品およびダクト閉塞用蓋部品
7日前
カシオ計算機株式会社
モジュール及びウェアラブル機器
8日前
日本電信電話株式会社
音声認識装置、音声認識方法及び音声認識プログラム
7日前
株式会社東芝
推定プログラム、学習プログラム、推定装置、学習装置、推定方法、学習方法、および学習モデル
6日前
続きを見る
他の特許を見る