TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025070727
公報種別
公開特許公報(A)
公開日
2025-05-02
出願番号
2023181239
出願日
2023-10-20
発明の名称
動画編集装置及びプログラム
出願人
Wovn Technologies株式会社
代理人
TRY国際弁理士法人
主分類
G10L
15/00 20130101AFI20250424BHJP(楽器;音響)
要約
【課題】動画コンテンツ内におけるセリフや言説を発した人物の属性に応じて、言葉遣いを調整できる技術的手段を提供する。
【解決手段】動画編集装置20は、処理対象の動画ファイル内の各音声を、音声を示す第1テキストデータ、及び、音声を発した人物の属性データとして認識する認識手段と、第1テキストデータを、別の言語の第2テキストデータに翻訳する翻訳手段と、属性データに基づいて、第2テキストデータが示す翻訳結果の一部の言葉遣いを改変した第3テキストデータを生成し、生成した第3テキストデータを、動画ファイル内の画像を示すデータとともに出力する改変手段とを具備する。
【選択図】図1
特許請求の範囲
【請求項1】
処理対象の動画ファイル内の各音声を、前記音声を示す第1テキストデータ及び前記音声を発した人物の属性データとして認識する認識手段と、
前記第1テキストデータを、別の言語の第2テキストデータに翻訳する翻訳手段と、
前記属性データに基づいて、前記第2テキストデータが示す翻訳結果の一部の言葉遣いを改変した第3テキストデータを生成し、生成した第3テキストデータを、前記動画ファイル内の画像を示すデータとともに出力する改変手段と
を具備することを特徴とする動画編集装置。
続きを表示(約 670 文字)
【請求項2】
前記認識手段は、
前記動画ファイル内の音声の音声データに、FFT処理を施し、FFT処理により得られたスペクトラムデータに基づいて、当該音声を発した人物の属性を特定する属性認識処理手段を有する
ことを特徴とする請求項1に記載の動画編集装置。
【請求項3】
前記認識手段は、
前記動画ファイルにおける動画コンテンツの開始時から終了時までの間の音声データから、人の発声音の記録された部分の音声データのみを抽出する音声抽出手段と、
前記音声抽出手段により抽出された音声データを、各々がひとまとまりの発声音を示す複数の音声データに分割する分割手段と、
を具備し、
前記属性認識処理手段は、前記分割手段により分割された複数の音声データの各々について、当該音声を発した人物の属性を特定する
ことを特徴とする請求項2に記載の動画編集装置。
【請求項4】
コンピュータに、
処理対象の動画ファイル内の各音声を、前記音声を示す第1テキストデータ及び前記音声を発した人物の属性データとして認識する認識機能と、
前記第1テキストデータを、別の言語の第2テキストデータに翻訳する翻訳機能と、
前記属性データに基づいて、前記第2テキストデータが示す翻訳結果の一部の言葉遣いを改変した第3テキストデータを生成し、生成した第3テキストデータを、前記動画ファイル内の画像を示すデータとともに出力する改変機能と
を実現させるプログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、動画ファイルを生成する技術に関し、特に、外国語の音声を含む動画ファイルから、字幕や吹替音声を含む動画ファイルを生成する技術に関する。
続きを表示(約 1,800 文字)
【背景技術】
【0002】
この種の技術を開示した文献として、特許文献1、2、3がある。特許文献1に記載された受信装置は、マルチメディアプレゼンテーションをバッファリングし、このマルチメディアプレゼンテーションのオーディオコンポーネント及びビデオコンポーネントを取り出し、オーディオコンポーネントに音声認識分析を施して字幕テキストデータを生成し、この字幕テキストデータを元のビデオコンポーネントに統合して出力する。特許文献2に記載された文字起こしサーバは、ユーザのプロファイルに従って、音声認識ユニットによって生成されたテキストをユーザのターゲット言語に翻訳し、翻訳結果である翻訳テキストをユーザの携帯端末に送信する。特許文献3に記載された機械翻訳機は、オンラインビデオサービスにおける時限テキストトラックを処理対象とし、時限テキストトラックの時限テキストを、所定の外国語に翻訳し、時限テキストを書き換えたオンラインビデオサービスのコンテンツをユーザのビューアクライアントに送信する。
【先行技術文献】
【特許文献】
【0003】
米国特許第8781824号明細書
欧州特許第2725816号明細書
米国特許出願公開第2010/0138209号明細書
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、これまでに提案された動画コンテンツ吹替技術は、吹替音声におけるセリフや言説の言葉遣いが画一的であり、発言者の感情や言葉のニュアンスが視聴者に伝わり難いという問題があった。
【0005】
本発明は、このような課題に鑑みてなされたものであり、動画コンテンツ内におけるセリフや言説を発した人物の属性に応じて、言葉遣いを調整できる技術的手段を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するため、本発明の好適な態様である動画編集装置は、処理対象の動画ファイル内の各音声を、前記音声を示す第1テキストデータ及び前記音声を発した人物の属性データとして認識する認識手段と、前記第1テキストデータを、別の言語の第2テキストデータに翻訳する翻訳手段と、前記属性データに基づいて、前記第2テキストデータが示す翻訳結果の一部の言葉遣いを改変した第3テキストデータを生成し、生成した第3テキストデータを、前記動画ファイル内の画像を示すデータとともに出力する改変手段とを具備することを特徴とする。
【0007】
この態様において、前記認識手段は、前記動画ファイル内の音声の音声データに、FFT処理を施し、FFT処理により得られたスペクトラムデータに基づいて、当該音声を発した人物の属性を特定する属性認識処理手段を有してもよい。
【0008】
また、前記認識手段は、前記動画ファイルにおける動画コンテンツの開始時から終了時までの間の音声データから、人の発声音の記録された部分の音声データのみを抽出する音声抽出手段と、前記音声抽出手段により抽出された音声データを、各々がひとまとまりの発声音を示す複数の音声データに分割する分割手段と、を具備し、前記属性認識処理手段は、前記分割手段により分割された複数の音声データの各々について、当該音声を発した人物の属性を特定してもよい。
【0009】
本発明の別の好適な態様であるプログラムは、コンピュータに、処理対象の動画ファイル内の各音声を、前記音声を示す第1テキストデータ及び前記音声を発した人物の属性データとして認識する認識機能と、前記第1テキストデータを、別の言語の第2テキストデータに翻訳する翻訳機能と、前記属性データに基づいて、前記第2テキストデータが示す翻訳結果の一部の言葉遣いを改変した第3テキストデータを生成し、生成した第3テキストデータを、前記動画ファイル内の画像を示すデータとともに出力する改変機能とを実現させる。
【発明の効果】
【0010】
本発明によると、外国語の音声を含む動画コンテンツから、発言者の感情や言葉のニュアンスが視聴者に伝わり易い吹替音声情報を含む動画コンテンツを生成することができる。
【図面の簡単な説明】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
メガホン
9日前
個人
10デジタルサラウンドラジオ
26日前
合同会社Bootstrap
弦楽器
6日前
三井化学株式会社
遮音構造体
14日前
三井化学株式会社
遮音構造体
1か月前
株式会社イノアックコーポレーション
防音材
今日
三菱電機株式会社
吸音体
8日前
旭化成株式会社
内装吸音材
9日前
矢崎総業株式会社
車両用対話システム
20日前
矢崎総業株式会社
車両用対話システム
20日前
ヤマハ株式会社
情報処理方法
7日前
矢崎総業株式会社
車両用対話システム
20日前
ヤマハ株式会社
情報処理方法
7日前
矢崎総業株式会社
車両用対話システム
20日前
矢崎総業株式会社
車両用対話システム
20日前
矢崎総業株式会社
車両用対話システム
20日前
トヨタ自動車株式会社
音声制御装置
1か月前
株式会社第一興商
カラオケ装置
16日前
ヤマハ株式会社
鍵盤装置
15日前
トヨタ自動車株式会社
車両
8日前
ヤマハ株式会社
鍵盤楽器
1か月前
株式会社しくみ
音声翻訳プログラム
1か月前
学校法人 工学院大学
音響拡散パネル
15日前
日本放送協会
音声認識装置およびプログラム
20日前
株式会社Gottsu
サキソフォーン向けねじ込み式スクリュー
28日前
国立研究開発法人産業技術総合研究所
実況音声生成システム
12日前
株式会社エクシング
携帯端末用プログラム、及び、カラオケシステム
20日前
個人
メガホン
9日前
株式会社JVCケンウッド
情報処理装置、情報処理方法、及びプログラム
13日前
カシオ計算機株式会社
電子楽器、方法およびプログラム
28日前
株式会社 一歩
和音発生方法並びにそれに用いる単音発生具及び和音発生具
5日前
パイオニア株式会社
音声処理装置、音声処理方法、プログラム及び記憶媒体
6日前
パイオニア株式会社
音声処理装置、音声処理方法、プログラム及び記憶媒体
6日前
パイオニア株式会社
音声処理装置、音声処理方法、プログラム及び記憶媒体
6日前
アルプスアルパイン株式会社
音場制御システム及び音場制御方法
15日前
ヤマハ株式会社
情報処理システム、情報処理方法及びプログラム
8日前
続きを見る
他の特許を見る