TOP特許意匠商標
特許ウォッチ Twitter
公開番号2024071824
公報種別公開特許公報(A)
公開日2024-05-27
出願番号2022182261
出願日2022-11-15
発明の名称学習装置、情報処理装置、学習方法、及びプログラム
出願人KDDI株式会社
代理人弁理士法人創光国際特許事務所,個人,個人,個人
主分類G06N 3/08 20230101AFI20240520BHJP(計算;計数)
要約【課題】感情の認識モデルの認識性能を向上させる。
【解決手段】情報処理システムの学習装置1は、所定のラベルが対応付けられている第1ベクトルデータを複数の層から構成される第1ニューラルネットワークに入力したときに、当該第1ベクトルデータに対応付けられているラベルを出力するように第1ニューラルネットワークの各層のパラメータを学習する第1学習部122と、第1学習部122が学習した第1ニューラルネットワークを構成する各層のパラメータを、複数の層から構成される第2ニューラルネットワークの各層に設定する設定部124と、第1ベクトルデータに対応付けられているラベルと同じラベルが対応付けられている第2ベクトルデータを第2ニューラルネットワークに入力したときに、当該第2ベクトルデータに対応付けられているラベルを出力するように第2ニューラルネットワークの各層のパラメータを学習する第2学習部123と、を有する。
【選択図】図2
特許請求の範囲【請求項1】
所定のラベルが対応付けられている第1ベクトルデータを複数の層から構成される第1ニューラルネットワークに入力したときに、当該第1ベクトルデータに対応付けられている前記ラベルを出力するように前記第1ニューラルネットワークを構成する各層のパラメータを学習する第1学習部と、
前記第1学習部が学習した前記第1ニューラルネットワークを構成する各層のパラメータを、複数の層から構成される第2ニューラルネットワークを構成する各層に設定する設定部と、
前記第1ベクトルデータに対応付けられている前記ラベルと同じ前記ラベルが対応付けられている第2ベクトルデータを前記第2ニューラルネットワークに入力したときに、当該第2ベクトルデータに対応付けられている前記ラベルを出力するように前記第2ニューラルネットワークを構成する各層のパラメータを学習する第2学習部と、
を有する学習装置。
続きを表示(約 1,700 文字)【請求項2】
前記ラベルが対応付けられているモーダルデータを取得するモーダルデータ取得部と、
前記モーダルデータを当該モーダルデータに対応するモーダルの種類とは異なる他の種類のモーダルの特徴が表現された前記第1ベクトルデータに変換する第1変換部と、
前記モーダルデータを当該モーダルデータに対応するモーダルの特徴が表現された前記第2ベクトルデータに変換する第2変換部と、
をさらに有する、
請求項1に記載の学習装置。
【請求項3】
前記第1変換部は、前記モーダルデータを、それぞれモーダルの種類が異なる複数の前記第1ベクトルデータに変換し、
前記第1変換部が変換した前記第1ベクトルデータごとに、前記第1学習部が実行する処理と、前記設定部が実行する処理と、前記第2学習部が実行する処理とを順番に実行させる学習制御部をさらに有し、
前記学習制御部は、前記第2学習部が実行する処理を実行させた後において、前記第1学習部が実行する処理を実行させる前に、前記設定部に対して、前記第2学習部が学習した前記第2ニューラルネットワークを構成する各層のパラメータを、前記第1ニューラルネットワークを構成する各層に設定する処理を実行させる、
請求項2に記載の学習装置。
【請求項4】
前記学習制御部は、前記第1変換部が変換した前記第1ベクトルデータごとに各処理を順番に実行させた後に、再度、前記第1変換部が変換した前記第1ベクトルデータごとに各処理を順番に実行させる、
請求項3に記載の学習装置。
【請求項5】
請求項2から4のいずれか一項に記載の学習装置が生成した前記第2ニューラルネットワークを構成する各層のパラメータを学習モデルとして記憶する記憶部と、
前記モーダルデータとモーダルが同じ種類の同種データを取得する同種データ取得部と、
前記記憶部が記憶する学習モデルを前記同種データ取得部が取得した前記同種データに適用することにより、前記同種データに対応するラベルを出力するモデル適用部と、
を有する情報処理装置。
【請求項6】
コンピュータが実行する、
所定のラベルが対応付けられている第1ベクトルデータを複数の層から構成される第1ニューラルネットワークに入力したときに、当該第1ベクトルデータに対応付けられている前記ラベルを出力するように前記第1ニューラルネットワークを構成する各層のパラメータを学習するステップと、
学習した前記第1ニューラルネットワークを構成する各層のパラメータを、複数の層から構成される第2ニューラルネットワークを構成する各層に設定するステップと、
前記第1ベクトルデータに対応付けられている前記ラベルと同じ前記ラベルが対応付けられている第2ベクトルデータを前記第2ニューラルネットワークに入力したときに、当該第2ベクトルデータに対応付けられている前記ラベルを出力するように前記第2ニューラルネットワークを構成する各層のパラメータを学習するステップと、
を有する学習方法。
【請求項7】
コンピュータを、
所定のラベルが対応付けられている第1ベクトルデータを複数の層から構成される第1ニューラルネットワークに入力したときに、当該第1ベクトルデータに対応付けられている前記ラベルを出力するように前記第1ニューラルネットワークを構成する各層のパラメータを学習する第1学習部、
前記第1学習部が学習した前記第1ニューラルネットワークを構成する各層のパラメータを、複数の層から構成される第2ニューラルネットワークを構成する各層に設定する設定部、及び
前記第1ベクトルデータに対応付けられている前記ラベルと同じ前記ラベルが対応付けられている第2ベクトルデータを前記第2ニューラルネットワークに入力したときに、当該第2ベクトルデータに対応付けられている前記ラベルを出力するように前記第2ニューラルネットワークを構成する各層のパラメータを学習する第2学習部、
として機能させるためのプログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、学習装置、情報処理装置、学習方法、及びプログラムに関する。
続きを表示(約 2,000 文字)【背景技術】
【0002】
従来、コミュニケーションシーンに参加している人間同士の雰囲気を認識する技術が提案されている。例えば、非特許文献1には、画像から顔、ポーズ、ジェスチャ、視線などの特徴量を抽出して、既知の深層学習手法を利用してグループレベルでの感情の認識モデルを実現するための技術が開示されている。
【先行技術文献】
【非特許文献】
【0003】
Xin Guo, Bin Zhu, Luisa F. Polania, Charles Boncelet, and Kenneth E. Barner. 2018. Group-Level Emotion Recognition using Hybrid Deep Models based on Faces, Scenes, Skeletons and Visual Attentions. ACM International Conference on Multimodal Interaction 2018.
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記の技術は、画像に含まれる視覚特徴を抽出して複数のモデルを構築し、それらのモデルで認識した結果を融合することで雰囲気認識の実現を試みる技術である。しかしながら、画像のような1つのモーダルの種類のデータから抽出された特徴(例えば、顔特徴や表情特徴等)だけでは、実用的な認識性能を担保することが難しい場合がある。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、モデルの認識性能を向上させることを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様にかかる学習装置は、所定のラベルが対応付けられている第1ベクトルデータを複数の層から構成される第1ニューラルネットワークに入力したときに、当該第1ベクトルデータに対応付けられている前記ラベルを出力するように前記第1ニューラルネットワークを構成する各層のパラメータを学習する第1学習部と、前記第1学習部が学習した前記第1ニューラルネットワークを構成する各層のパラメータを、複数の層から構成される第2ニューラルネットワークを構成する各層に設定する設定部と、前記第1ベクトルデータに対応付けられている前記ラベルと同じ前記ラベルが対応付けられている第2ベクトルデータを前記第2ニューラルネットワークに入力したときに、当該第2ベクトルデータに対応付けられている前記ラベルを出力するように前記第2ニューラルネットワークを構成する各層のパラメータを学習する第2学習部と、を有する。
【0007】
前記学習装置は、前記ラベルが対応付けられているモーダルデータを取得するモーダルデータ取得部と、前記モーダルデータを当該モーダルデータに対応するモーダルの種類とは異なる他の種類のモーダルの特徴が表現された前記第1ベクトルデータに変換する第1変換部と、前記モーダルデータを当該モーダルデータに対応するモーダルの特徴が表現された前記第2ベクトルデータに変換する第2変換部と、をさらに有してもよい。
【0008】
前記第1変換部は、前記モーダルデータを、それぞれモーダルの種類が異なる複数の前記第1ベクトルデータに変換してもよいし、前記学習装置は、前記第1変換部が変換した前記第1ベクトルデータごとに、前記第1学習部が実行する処理と、前記設定部が実行する処理と、前記第2学習部が実行する処理とを順番に実行させる学習制御部をさらに有してもよいし、前記学習制御部は、前記第2学習部が実行する処理を実行させた後において、前記第1学習部が実行する処理を実行させる前に、前記設定部に対して、前記第2学習部が学習した前記第2ニューラルネットワークを構成する各層のパラメータを、前記第1ニューラルネットワークを構成する各層に設定する処理を実行させてもよい。
【0009】
前記学習制御部は、前記第1変換部が変換した前記第1ベクトルデータごとに各処理を順番に実行させた後に、再度、前記第1変換部が変換した前記第1ベクトルデータごとに各処理を順番に実行させてもよい。
【0010】
本発明の第2の態様にかかる情報処理装置は、前記学習装置が生成した前記第2ニューラルネットワークを構成する各層のパラメータを学習モデルとして記憶する記憶部と、前記モーダルデータとモーダルが同じ種類の同種データを取得する同種データ取得部と、前記記憶部が記憶する学習モデルを前記同種データ取得部が取得した前記同種データに適用することにより、前記同種データに対応するラベルを出力するモデル適用部と、を有する。
(【0011】以降は省略されています)

特許ウォッチbot のツイートを見る
この特許をJ-PlatPatで参照する

関連特許

KDDI株式会社
光受信装置
1か月前
KDDI株式会社
ルーター及び試験方法
18日前
KDDI株式会社
移動通信ネットワーク
3日前
KDDI株式会社
光受信機及び光送信機
14日前
KDDI株式会社
通信システム及び通信方法
14日前
KDDI株式会社
光ニューラルネットワーク装置
27日前
KDDI株式会社
情報処理装置及び情報処理方法
10日前
KDDI株式会社
情報処理装置及び情報処理方法
3日前
KDDI株式会社
情報処理装置及び情報処理方法
17日前
KDDI株式会社
ノイズ除去装置及びプログラム
14日前
KDDI株式会社
情報処理装置及び情報処理方法
11日前
KDDI株式会社
リザバーコンピューティング装置
21日前
KDDI株式会社
パケット転送装置及びプログラム
11日前
KDDI株式会社
機能性デバイス及びその制御方法
24日前
KDDI株式会社
制御装置、制御方法及びプログラム
3日前
KDDI株式会社
通信装置、通信方法及び通信プログラム
18日前
KDDI株式会社
通信サーバ、通信方法及び通信プログラム
21日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
11日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
3日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
24日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
24日前
KDDI株式会社
端末装置、制御方法、制御装置及びプログラム
3日前
KDDI株式会社
暗号化装置、暗号化方法、及び暗号化プログラム
10日前
KDDI株式会社
端末装置、基地局装置、制御方法、及びプログラム
14日前
KDDI株式会社
基地局装置、端末装置、制御方法、及びプログラム
25日前
KDDI株式会社
ID生成装置、ID生成方法及びID生成プログラム
26日前
KDDI株式会社
画像符号化装置、画像符号化方法、およびプログラム
4日前
KDDI株式会社
ネットワークのデータ変化検知装置、方法及びプログラム
21日前
KDDI株式会社
暗号化装置、復号装置、暗号化方法及び暗号化プログラム
11日前
KDDI株式会社
通信端末、セッション制御装置、及び、ゲートウェイ装置
14日前
KDDI株式会社
データ処理装置、データ処理システム、及びデータ処理方法
4日前
KDDI株式会社
ユーザ装置、基地局、およびそれらの制御方法、プログラム
17日前
KDDI株式会社
配車管理システム、配車管理方法及びコンピュータプログラム
27日前
KDDI株式会社
移動通信に用いられる管理装置、方法、システム及びプログラム
11日前
KDDI株式会社
キャッシュされたファイルを推定するクライアント装置及びプログラム
3日前
KDDI株式会社
処置対象に対する処置を提案するプログラム、装置、システム及び方法
3日前
続きを見る