TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025075437
公報種別公開特許公報(A)
公開日2025-05-15
出願番号2023186606
出願日2023-10-31
発明の名称情報処理装置、情報処理方法、及びプログラム
出願人株式会社JVCケンウッド
代理人個人
主分類G10L 25/54 20130101AFI20250508BHJP(楽器;音響)
要約【課題】コンテンツの音声をユーザの好みに応じて適切に再生することが可能な情報処理装置を提供すること。
【解決手段】本開示にかかる情報処理装置1は、特定人物の音声の特徴量を示す特定音声特徴量を取得する特定音声取得部11と、コンテンツに含まれる音声の特徴量を示すコンテンツ音声特徴量を取得するコンテンツ音声取得部12と、特定音声特徴量とコンテンツ音声特徴量とに基づいて、コンテンツにおいて特定人物の音声が含まれる区間を特定音声区間として特定する特定部13と、を備える。
【選択図】図1
特許請求の範囲【請求項1】
特定人物の音声の特徴量を示す特定音声特徴量を取得する特定音声取得部と、
コンテンツに含まれる音声の特徴量を示すコンテンツ音声特徴量を取得するコンテンツ音声取得部と、
前記特定音声特徴量と前記コンテンツ音声特徴量とに基づいて、前記コンテンツにおいて前記特定人物の音声が含まれる区間を特定音声区間として特定する特定部と、を備える
情報処理装置。
続きを表示(約 630 文字)【請求項2】
前記コンテンツに対して音声処理を行う音声処理部をさらに備え、
前記音声処理部は、前記特定音声区間に対し、前記特定音声区間以外の区間とは異なる音声処理を行う
請求項1に記載の情報処理装置。
【請求項3】
前記コンテンツを再生する再生部をさらに備え、
前記再生部は、複数の前記特定音声区間を連続で再生する
請求項1又は2に記載の情報処理装置。
【請求項4】
特定人物の音声の特徴量を示す特定音声特徴量を取得する特定音声取得ステップと、
コンテンツに含まれる音声の特徴量を示すコンテンツ音声特徴量を取得するコンテンツ音声取得ステップと、
前記特定音声特徴量と前記コンテンツ音声特徴量とに基づいて、前記コンテンツにおいて前記特定人物の音声が含まれる区間を特定音声区間として特定する特定ステップと、を備える
情報処理方法。
【請求項5】
特定人物の音声の特徴量を示す特定音声特徴量を取得する特定音声取得ステップと、
コンテンツに含まれる音声の特徴量を示すコンテンツ音声特徴量を取得するコンテンツ音声取得ステップと、
前記特定音声特徴量と前記コンテンツ音声特徴量とに基づいて、前記コンテンツにおいて前記特定人物の音声が含まれる区間を特定音声区間として特定する特定ステップと、をコンピュータに実行させる
プログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、情報処理装置、情報処理方法、及びプログラムに関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
アニメーションや映画などのコンテンツに対して加工を行い、コンテンツに所定の効果を加える技術が知られている。関連する技術として、特許文献1は、映像データと、当該映像データに関連する音声データとを再生する再生装置を開示する。当該再生装置は、音声処理部から供給された音声データを解析し、解析した音声データが所定のパターンに対応する場合に、映像処理部から供給された映像データに所定の特殊効果を加える。例えば、当該再生装置は、解析した音声データが拍手の音の周波数特性のパターンに対応する場合、紙吹雪が舞う様子を表す複数枚の画像データを映像データに合成する。
【先行技術文献】
【特許文献】
【0003】
特開2004-159257号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
コンテンツの音声データを加工する場合、音声データに適した加工が行われることが望ましい。例えば、アニメーションのコンテンツを視聴するユーザには、ユーザの好みの声優(いわゆる「推し」の声優)がいる場合がある。コンテンツ全体に一様な加工処理を行った場合、好みの声優の声に合っていない加工が行われる可能性がある。このような加工が行われた場合、ユーザの好みに応じたコンテンツの再生は困難である。
【0005】
本開示の目的は、上述した課題を鑑み、コンテンツの音声をユーザの好みに応じて適切に再生することが可能な情報処理装置、情報処理方法、及びプログラムを提供することにある。
【課題を解決するための手段】
【0006】
本開示にかかる情報処理装置は、
特定人物の音声の特徴量を示す特定音声特徴量を取得する特定音声取得部と、
コンテンツに含まれる音声の特徴量を示すコンテンツ音声特徴量を取得するコンテンツ音声取得部と、
前記特定音声特徴量と前記コンテンツ音声特徴量とに基づいて、前記コンテンツにおいて前記特定人物の音声が含まれる区間を特定音声区間として特定する特定部と、を備えるものである。
【0007】
本開示にかかる情報処理方法は、
特定人物の音声の特徴量を示す特定音声特徴量を取得する特定音声取得ステップと、
コンテンツに含まれる音声の特徴量を示すコンテンツ音声特徴量を取得するコンテンツ音声取得ステップと、
前記特定音声特徴量と前記コンテンツ音声特徴量とに基づいて、前記コンテンツにおいて前記特定人物の音声が含まれる区間を特定音声区間として特定する特定ステップと、を備えるものである。
【0008】
本開示にかかるプログラムは、
特定人物の音声の特徴量を示す特定音声特徴量を取得する特定音声取得ステップと、
コンテンツに含まれる音声の特徴量を示すコンテンツ音声特徴量を取得するコンテンツ音声取得ステップと、
前記特定音声特徴量と前記コンテンツ音声特徴量とに基づいて、前記コンテンツにおいて前記特定人物の音声が含まれる区間を特定音声区間として特定する特定ステップと、をコンピュータに実行させるものである。
【発明の効果】
【0009】
本開示にかかる情報処理装置、情報処理方法、及びプログラムは、コンテンツの音声をユーザの好みに応じて適切に再生することができる。
【図面の簡単な説明】
【0010】
実施形態にかかる情報処理装置の構成を示すブロック図である。
実施形態にかかる特定音声特徴量の抽出処理の流れを示すフローチャートである。
実施形態にかかる情報処理装置が行う処理を具体的に説明するための図である。
実施形態にかかる特定音声区間の特定処理の流れを示すフローチャートである。
実施形態にかかるコンテンツの再生処理の流れを示すフローチャートである。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

三井化学株式会社
吸音構造体
12日前
個人
弦楽器用押弦補助具及び弦楽器
17日前
三井化学株式会社
遮音構造体
17日前
三井化学株式会社
遮音構造体
17日前
三井化学株式会社
遮音構造体
24日前
林テレンプ株式会社
防音カバー
17日前
株式会社ドクター中松創研
歌及び歌の制作方法
27日前
株式会社JVCケンウッド
車載装置
18日前
株式会社総合車両製作所
吸音パネル
11日前
株式会社レゾナック
吸音材及び車両部材
4日前
個人
電気自動車等の「接近音」における最適な「音の種類」
20日前
株式会社HOWA
遮音構造
24日前
カシオ計算機株式会社
楽器
24日前
株式会社第一興商
カラオケ装置
12日前
株式会社JVCケンウッド
情報処理装置及び情報処理方法
12日前
個人
電子管楽器
17日前
株式会社第一興商
カラオケ装置
11日前
株式会社コルグ
電子楽器用アナログエフェクタ
10日前
ヤマハ株式会社
発音制御装置
18日前
川上産業株式会社
吸音シート
1か月前
トヨタ自動車株式会社
電気自動車
19日前
AOBAENERGY株式会社
サービス提供機器
17日前
トヨタ自動車株式会社
音響式遮音材の製造方法
18日前
井関農機株式会社
作業車の操縦者用騒音低減装置
11日前
日本電波工業株式会社
音声再生装置及び音声再生方法
11日前
ローランド株式会社
鍵盤装置および鍵の揺動の規制方法
12日前
ローランド株式会社
鍵盤装置および押鍵情報の検出方法
12日前
ローランド株式会社
鍵盤装置および押鍵情報の検出方法
12日前
株式会社パトライト
メール読み上げテキスト生成プログラム
1か月前
ブラザー工業株式会社
カラオケシステム、及び、カラオケ装置
12日前
ヤマハ株式会社
音響測定装置、音響測定方法および音響測定プログラム
18日前
カシオ計算機株式会社
音響処理装置、音響処理システム、音響処理方法及びプログラム
25日前
株式会社丸高工業
防音板及びその附属品
12日前
トヨタ自動車株式会社
車両管理システム及び電気自動車
19日前
株式会社石森管楽器
リガチャーおよび楽器
10日前
ブラザー工業株式会社
カラオケシステム、カラオケ装置、及びカラオケ装置用のプログラム
11日前
続きを見る