TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024088476
公報種別公開特許公報(A)
公開日2024-07-02
出願番号2022203675
出願日2022-12-20
発明の名称情報処理装置、及び情報処理プログラム
出願人トヨタ自動車株式会社
代理人弁理士法人太陽国際特許事務所
主分類G10L 25/63 20130101AFI20240625BHJP(楽器;音響)
要約【課題】本発明は、一の音声データから複数のデータを抽出する場合において、音声データが示す特徴を精度よく推定できる情報処理装置、及び情報処理プログラムを提供することを目的とする。
【解決手段】情報処理装置は、ユーザの一の音声データを取得する取得部と、一の音声データから所定の期間毎に抽出された複数の音声データであって、所定の単位時間毎に期間を移転することによって、複数の音声データを抽出する抽出部と、抽出した複数の音声データからユーザの感情を示す特徴量を推定するための機械学習を実行した推定モデルを用いて、複数の音声データの各々から前記ユーザの感情を示す特徴量をそれぞれ推定する推定部と、複数の音声データにそれぞれ対応する特徴量を用いて、一の音声データが表すユーザの感情を判定する判定部と、を備えている。
【選択図】図3
特許請求の範囲【請求項1】
ユーザの一の音声データを取得する取得部と、
前記一の音声データから所定の期間毎に抽出された複数の音声データであって、所定の単位時間毎に前記期間を移転することによって、前記複数の音声データを抽出する抽出部と、
抽出した前記複数の音声データからユーザの感情を示す特徴量を推定するための機械学習を実行した推定モデルを用いて、前記複数の音声データの各々から前記ユーザの感情を示す特徴量をそれぞれ推定する推定部と、
前記複数の音声データにそれぞれ対応する特徴量を用いて、前記一の音声データが表すユーザの感情を判定する判定部と、
を備えた情報処理装置。
続きを表示(約 800 文字)【請求項2】
前記所定の期間は、過去に取得した前記一の音声データにおいて、前記一の音声データのラベルとして設定されたユーザの感情に対応する感情を示す前記特徴量と、前記一の音声データのラベルとして設定されたユーザの感情とは異なる感情を示す前記特徴量と、に応じて設定される
請求項1に記載の情報処理装置。
【請求項3】
前記抽出部は、前記一の音声データから抽出する音声データの数が予め定められた数となるように前記単位時間を設定して、前記複数の音声データを抽出する
請求項1に記載の情報処理装置。
【請求項4】
前記推定部は、前記推定モデルとして、複数のユーザのうち、個人のユーザ毎に一の音声データを学習した個人ユーザ推定モデル、及び前記複数のユーザ全体に係る一の音声データを学習した全体ユーザ推定モデルを用いて、前記ユーザの感情を示す特徴量をそれぞれ推定し、
前記判定部は、前記個人ユーザ推定モデル、及び前記全体ユーザ推定モデルがそれぞれ推定した特徴量を用いて、前記一の音声データが表すユーザの感情を判定する
請求項1に記載の情報処理装置。
【請求項5】
ユーザの一の音声データを取得し、
前記一の音声データから所定の期間毎に抽出された複数の音声データであって、所定の単位時間毎に前記期間を移転することによって、前記複数の音声データを抽出し、
抽出した前記複数の音声データからユーザの感情を示す特徴量を推定するための機械学習を実行した推定モデルを用いて、前記複数の音声データの各々から前記ユーザの感情を示す特徴量をそれぞれ推定し、
前記複数の音声データにそれぞれ対応する特徴量を用いて、前記一の音声データが表すユーザの感情を判定する、
処理をコンピュータに実行させるための情報処理プログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、音声データから感情を推定する情報処理装置、及び情報処理プログラムに関する。
続きを表示(約 1,500 文字)【背景技術】
【0002】
特許文献1には、前処理として音声データを画像データに変換して、当該画像データを学習データとして機械学習を実行することによって、音声データから感情を推定するトラウマスクリーニング装置について開示されている。特許文献1に係るトラウマスクリーニング装置は、前処理によって変換された一の画像データから所定の期間毎の複数の画像データを生成する場合において、所定の時間単位でシフトして複数の画像データを抽出することによって画像データを増幅することを特徴としている。
【先行技術文献】
【特許文献】
【0003】
特開2022-079446号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1の技術を利用して、音声データから感情等の特徴を推定する場合、抽出された複数のデータの各々において、異なる特徴が推定されることがある。そのため、一の音声データから複数のデータを抽出する場合、音声データが示す特徴を精度よく推定できるとは限らなかった。
【0005】
本発明は、一の音声データから複数のデータを抽出する場合において、音声データが示す特徴を精度よく推定できる情報処理装置、及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
請求項1に記載の情報処理装置は、ユーザの一の音声データを取得する取得部と、前記一の音声データから所定の期間毎に抽出された複数の音声データであって、所定の単位時間毎に前記期間を移転することによって、前記複数の音声データを抽出する抽出部と、抽出した前記複数の音声データからユーザの感情を示す特徴量を推定するための機械学習を実行した推定モデルを用いて、前記複数の音声データの各々から前記ユーザの感情を示す特徴量をそれぞれ推定する推定部と、前記複数の音声データにそれぞれ対応する特徴量を用いて、前記一の音声データが表すユーザの感情を判定する判定部と、を備えている。
【0007】
請求項1に記載の情報処理装置は、ユーザの一の音声データを取得し、抽出範囲である所定の期間を所定の単位時間毎に移転して、当該一の音声データから複数の音声データを抽出し、音声データからユーザの感情を推定するための機械学習を実行した推定モデルを用いて、抽出した複数の音声データの各々から感情を示す特徴量を推定し、推定した複数の特徴量を用いて、一の音声が示すユーザの感情を判定する。これにより、一の音声データから複数のデータを抽出する場合において、音声データが示す特徴を精度よく推定できる。
【0008】
請求項2に記載の情報処理装置は、請求項1に記載の情報処理装置において、前記所定の期間は、過去に取得した前記一の音声データにおいて、前記一の音声データのラベルとして設定されたユーザの感情に対応する感情を示す前記特徴量と、前記一の音声データのラベルとして設定されたユーザの感情とは異なる感情を示す前記特徴量と、に応じて設定される。
【0009】
請求項2に記載の情報処理装置によれば、一の音声データに、当該一の音声データ全体が示す特徴とは異なる特徴が含まれている場合において、音声データが示す特徴と異なる特徴の影響を抑制できる。
【0010】
請求項3に記載の情報処理装置は、請求項1又は請求項2に記載の情報処理装置において、前記抽出部は、前記一の音声データから抽出する音声データの数が予め定められた数となるように前記単位時間を設定して、前記複数の音声データを抽出する。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

トヨタ自動車株式会社
車両
今日
トヨタ自動車株式会社
車両
2日前
トヨタ自動車株式会社
車両
3日前
トヨタ自動車株式会社
サーバ
1日前
トヨタ自動車株式会社
連結管
1日前
トヨタ自動車株式会社
移動体
2日前
トヨタ自動車株式会社
充電装置
今日
トヨタ自動車株式会社
内燃機関
2日前
トヨタ自動車株式会社
蓄電装置
2日前
トヨタ自動車株式会社
電動車両
1日前
トヨタ自動車株式会社
通知装置
3日前
トヨタ自動車株式会社
伸縮装置
1日前
トヨタ自動車株式会社
搬送装置
今日
トヨタ自動車株式会社
蓄電セル
2日前
トヨタ自動車株式会社
蓄電セル
2日前
トヨタ自動車株式会社
蓄電装置
1日前
トヨタ自動車株式会社
水系電池
1日前
トヨタ自動車株式会社
蓄電セル
今日
トヨタ自動車株式会社
水電解装置
2日前
トヨタ自動車株式会社
電気自動車
今日
トヨタ自動車株式会社
受渡し機構
今日
トヨタ自動車株式会社
水電解装置
2日前
トヨタ自動車株式会社
電気自動車
1日前
トヨタ自動車株式会社
水電解装置
2日前
トヨタ自動車株式会社
車両前部構造
2日前
トヨタ自動車株式会社
情報処理装置
今日
トヨタ自動車株式会社
情報処理装置
今日
トヨタ自動車株式会社
情報処理方法
今日
トヨタ自動車株式会社
情報処理装置
今日
トヨタ自動車株式会社
溶湯供給装置
1日前
トヨタ自動車株式会社
運転支援装置
1日前
トヨタ自動車株式会社
車両誘導装置
1日前
トヨタ自動車株式会社
情報処理方法
1日前
トヨタ自動車株式会社
情報処理装置
1日前
トヨタ自動車株式会社
キーシステム
2日前
トヨタ自動車株式会社
故障予知装置
2日前
続きを見る