TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025075437
公報種別公開特許公報(A)
公開日2025-05-15
出願番号2023186606
出願日2023-10-31
発明の名称情報処理装置、情報処理方法、及びプログラム
出願人株式会社JVCケンウッド
代理人個人
主分類G10L 25/54 20130101AFI20250508BHJP(楽器;音響)
要約【課題】コンテンツの音声をユーザの好みに応じて適切に再生することが可能な情報処理装置を提供すること。
【解決手段】本開示にかかる情報処理装置1は、特定人物の音声の特徴量を示す特定音声特徴量を取得する特定音声取得部11と、コンテンツに含まれる音声の特徴量を示すコンテンツ音声特徴量を取得するコンテンツ音声取得部12と、特定音声特徴量とコンテンツ音声特徴量とに基づいて、コンテンツにおいて特定人物の音声が含まれる区間を特定音声区間として特定する特定部13と、を備える。
【選択図】図1
特許請求の範囲【請求項1】
特定人物の音声の特徴量を示す特定音声特徴量を取得する特定音声取得部と、
コンテンツに含まれる音声の特徴量を示すコンテンツ音声特徴量を取得するコンテンツ音声取得部と、
前記特定音声特徴量と前記コンテンツ音声特徴量とに基づいて、前記コンテンツにおいて前記特定人物の音声が含まれる区間を特定音声区間として特定する特定部と、を備える
情報処理装置。
続きを表示(約 630 文字)【請求項2】
前記コンテンツに対して音声処理を行う音声処理部をさらに備え、
前記音声処理部は、前記特定音声区間に対し、前記特定音声区間以外の区間とは異なる音声処理を行う
請求項1に記載の情報処理装置。
【請求項3】
前記コンテンツを再生する再生部をさらに備え、
前記再生部は、複数の前記特定音声区間を連続で再生する
請求項1又は2に記載の情報処理装置。
【請求項4】
特定人物の音声の特徴量を示す特定音声特徴量を取得する特定音声取得ステップと、
コンテンツに含まれる音声の特徴量を示すコンテンツ音声特徴量を取得するコンテンツ音声取得ステップと、
前記特定音声特徴量と前記コンテンツ音声特徴量とに基づいて、前記コンテンツにおいて前記特定人物の音声が含まれる区間を特定音声区間として特定する特定ステップと、を備える
情報処理方法。
【請求項5】
特定人物の音声の特徴量を示す特定音声特徴量を取得する特定音声取得ステップと、
コンテンツに含まれる音声の特徴量を示すコンテンツ音声特徴量を取得するコンテンツ音声取得ステップと、
前記特定音声特徴量と前記コンテンツ音声特徴量とに基づいて、前記コンテンツにおいて前記特定人物の音声が含まれる区間を特定音声区間として特定する特定ステップと、をコンピュータに実行させる
プログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、情報処理装置、情報処理方法、及びプログラムに関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
アニメーションや映画などのコンテンツに対して加工を行い、コンテンツに所定の効果を加える技術が知られている。関連する技術として、特許文献1は、映像データと、当該映像データに関連する音声データとを再生する再生装置を開示する。当該再生装置は、音声処理部から供給された音声データを解析し、解析した音声データが所定のパターンに対応する場合に、映像処理部から供給された映像データに所定の特殊効果を加える。例えば、当該再生装置は、解析した音声データが拍手の音の周波数特性のパターンに対応する場合、紙吹雪が舞う様子を表す複数枚の画像データを映像データに合成する。
【先行技術文献】
【特許文献】
【0003】
特開2004-159257号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
コンテンツの音声データを加工する場合、音声データに適した加工が行われることが望ましい。例えば、アニメーションのコンテンツを視聴するユーザには、ユーザの好みの声優(いわゆる「推し」の声優)がいる場合がある。コンテンツ全体に一様な加工処理を行った場合、好みの声優の声に合っていない加工が行われる可能性がある。このような加工が行われた場合、ユーザの好みに応じたコンテンツの再生は困難である。
【0005】
本開示の目的は、上述した課題を鑑み、コンテンツの音声をユーザの好みに応じて適切に再生することが可能な情報処理装置、情報処理方法、及びプログラムを提供することにある。
【課題を解決するための手段】
【0006】
本開示にかかる情報処理装置は、
特定人物の音声の特徴量を示す特定音声特徴量を取得する特定音声取得部と、
コンテンツに含まれる音声の特徴量を示すコンテンツ音声特徴量を取得するコンテンツ音声取得部と、
前記特定音声特徴量と前記コンテンツ音声特徴量とに基づいて、前記コンテンツにおいて前記特定人物の音声が含まれる区間を特定音声区間として特定する特定部と、を備えるものである。
【0007】
本開示にかかる情報処理方法は、
特定人物の音声の特徴量を示す特定音声特徴量を取得する特定音声取得ステップと、
コンテンツに含まれる音声の特徴量を示すコンテンツ音声特徴量を取得するコンテンツ音声取得ステップと、
前記特定音声特徴量と前記コンテンツ音声特徴量とに基づいて、前記コンテンツにおいて前記特定人物の音声が含まれる区間を特定音声区間として特定する特定ステップと、を備えるものである。
【0008】
本開示にかかるプログラムは、
特定人物の音声の特徴量を示す特定音声特徴量を取得する特定音声取得ステップと、
コンテンツに含まれる音声の特徴量を示すコンテンツ音声特徴量を取得するコンテンツ音声取得ステップと、
前記特定音声特徴量と前記コンテンツ音声特徴量とに基づいて、前記コンテンツにおいて前記特定人物の音声が含まれる区間を特定音声区間として特定する特定ステップと、をコンピュータに実行させるものである。
【発明の効果】
【0009】
本開示にかかる情報処理装置、情報処理方法、及びプログラムは、コンテンツの音声をユーザの好みに応じて適切に再生することができる。
【図面の簡単な説明】
【0010】
実施形態にかかる情報処理装置の構成を示すブロック図である。
実施形態にかかる特定音声特徴量の抽出処理の流れを示すフローチャートである。
実施形態にかかる情報処理装置が行う処理を具体的に説明するための図である。
実施形態にかかる特定音声区間の特定処理の流れを示すフローチャートである。
実施形態にかかるコンテンツの再生処理の流れを示すフローチャートである。
【発明を実施するための形態】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

三井化学株式会社
遮音構造体
8日前
個人
弦楽器用押弦補助具及び弦楽器
8日前
三井化学株式会社
吸音構造体
3日前
三井化学株式会社
遮音構造体
8日前
林テレンプ株式会社
防音カバー
8日前
株式会社JVCケンウッド
車載装置
9日前
株式会社総合車両製作所
吸音パネル
2日前
株式会社第一興商
カラオケ装置
2日前
株式会社JVCケンウッド
情報処理装置及び情報処理方法
3日前
株式会社第一興商
カラオケ装置
3日前
個人
電子管楽器
8日前
株式会社コルグ
電子楽器用アナログエフェクタ
1日前
ヤマハ株式会社
発音制御装置
9日前
AOBAENERGY株式会社
サービス提供機器
8日前
トヨタ自動車株式会社
音響式遮音材の製造方法
9日前
井関農機株式会社
作業車の操縦者用騒音低減装置
2日前
ローランド株式会社
鍵盤装置および押鍵情報の検出方法
3日前
ローランド株式会社
鍵盤装置および押鍵情報の検出方法
3日前
日本電波工業株式会社
音声再生装置及び音声再生方法
2日前
ローランド株式会社
鍵盤装置および鍵の揺動の規制方法
3日前
ヤマハ株式会社
音響測定装置、音響測定方法および音響測定プログラム
9日前
ブラザー工業株式会社
カラオケシステム、及び、カラオケ装置
3日前
株式会社丸高工業
防音板及びその附属品
3日前
株式会社石森管楽器
リガチャーおよび楽器
1日前
ブラザー工業株式会社
カラオケシステム、カラオケ装置、及びカラオケ装置用のプログラム
2日前
ブラザー工業株式会社
端末装置用のカラオケプログラム、端末装置の制御方法、及び端末装置
2日前
株式会社イノアックコーポレーション
消音器、シールプレート及びフェンダーライナー
1日前
カシオ計算機株式会社
プログラム、情報処理装置、電子楽器及び表示方法
8日前
エルジー ディスプレイ カンパニー リミテッド
ノイズキャンセリングシステム
8日前
ヤマハ株式会社
加振装置及び加振システム
1日前
株式会社JVCケンウッド
データシステム、識別装置、データシステムの制御方法及びプログラム
8日前
チョーチアン ヘンイー ペトロケミカル カンパニー,リミテッド
ノイズ処理方法、装置、電子機器、および記憶媒体
8日前
ドルビー・インターナショナル・アーベー
オーディオ・エンコーダおよびデコーダ
8日前
ソニーグループ株式会社
音響再生装置、信号処理装置、信号処理方法
1日前
ナンジン シリコン インテリジェンス テクノロジー カンパニー リミテッド
音高に基づく音声変換モデルのトレーニング方法及び音声変換システム
1日前
カリアド、(チャイナ)、カンパニー、リミテッド
シーン作成方法及び機器並びに対応する車両、コンピュータ機器及び媒体
3日前
続きを見る