特許ウォッチ

公開番号2024065509
公報種別公開特許公報(A)
公開日2024-05-15
出願番号2022174410
出願日2022-10-31
発明の名称編集ラベル表現ベクトル生成装置、学習装置、編集ラベル表現ベクトル生成方法、学習方法及びプログラム
出願人日本電信電話株式会社,国立大学法人九州大学
代理人弁理士法人志賀国際特許事務所
主分類G06T 7/00 20170101AFI20240508BHJP(計算;計数)
要約【課題】ラベルから生成する画像の質を向上させる。
【解決手段】学習用データに付与された学習用ラベルに基づいて作成された、ラベルの共起頻度を示すラベル共起行列と、ラベルを示すラベル表現ベクトルとに基づいて、共起関係は強いが付与されていないラベルを補うベクトルである編集ラベル表現ベクトルを生成する、編集ラベル表現ベクトル生成装置。
【選択図】図2
特許請求の範囲【請求項１】
学習用データに付与された学習用ラベルに基づいて作成された、ラベルの共起頻度を示すラベル共起行列と、ラベルを示すラベル表現ベクトルとに基づいて、共起関係は強いが付与されていないラベルを補うベクトルである編集ラベル表現ベクトルを生成する、
編集ラベル表現ベクトル生成装置。
続きを表示（約 1,200 文字）【請求項２】
学習用画像に付与されるラベルを予測し、予測ラベル表現ベクトルを生成するラベル予測モデルと、
前記予測ラベル表現ベクトルの次元を削減し、次元数を元に戻し、圧縮ラベル表現ベクトルを生成するラベル圧縮モデルと、
前記圧縮ラベル表現ベクトルに基づいて画像を生成する画像生成モデルと、
前記画像生成モデルにより生成された画像がモデルにより生成された画像であるか否かを判定する画像判定モデルと、
前記学習用画像に対応する学習用ラベルに基づいて作成されたラベル表現ベクトルと前記圧縮ラベル表現ベクトルとの乖離を計算し、前記ラベル予測モデルと前記画像判定モデルとによる判定結果の乖離を計算する損失計算部と、
前記損失計算部により計算された前記乖離に基づいて前記画像生成モデルを更新するモデル更新部と、
を備える学習装置。
【請求項３】
前記損失計算部は、請求項１に記載された編集ラベル表現ベクトル生成装置により、前記学習用ラベルに基づいて作成された編集ラベル表現ベクトルと前記圧縮ラベル表現ベクトルとの乖離を計算する、
請求項２に記載の学習装置。
【請求項４】
学習用データに付与された学習用ラベルに基づいて作成された、ラベルの共起頻度を示すラベル共起行列と、ラベルを示すラベル表現ベクトルとに基づいて、共起関係は強いが付与されていないラベルを補うベクトルである編集ラベル表現ベクトルを生成する、
編集ラベル表現ベクトル生成方法。
【請求項５】
学習用画像に付与されるラベルを予測し、予測ラベル表現ベクトルを生成する及び前記学習用画像がモデルにより生成された画像であるか否かを判定するラベル予測ステップと、
前記予測ラベル表現ベクトルの次元を削減し、次元数を元に戻し、圧縮ラベル表現ベクトルを生成するラベル圧縮ステップと、
前記圧縮ラベル表現ベクトルに基づいて画像を生成する画像生成ステップと、
前記画像生成ステップにより生成された画像がモデルにより生成された画像であるか否かを判定する画像判定ステップと、
前記学習用画像に対応する学習用ラベルに基づいて作成されたラベル表現ベクトルと前記圧縮ラベル表現ベクトルとの乖離を計算し、前記ラベル予測ステップと前記画像判定ステップとによる判定結果の乖離を計算する損失計算ステップと、
前記損失計算ステップにより計算された前記乖離に基づいて前記画像生成ステップを更新するモデル更新ステップと、
を備える学習方法。
【請求項６】
請求項１に記載の編集ラベル表現ベクトル生成装置としてコンピュータを機能させるためのプログラム。
【請求項７】
請求項２に記載の学習装置としてコンピュータを機能させるためのプログラム。

発明の詳細な説明【技術分野】
【０００１】
本発明は、編集ラベル表現ベクトル生成装置、学習装置、編集ラベル表現ベクトル生成方法、学習方法及びプログラムに関する。
続きを表示（約 2,900 文字）【背景技術】
【０００２】
画像と画像に付けられたラベルのデータセットを用いて、画像を生成するモデルを作成し、当該モデルにラベルを入力することで、ラベルに対応する画像を出力させる技術がある。例えば非特許文献１及び２に開示がある。
【０００３】
しかしながら、データセットにおいて画像に付けられたラベルが過不足なく付けられているとは限らない。例えば、付けられるべき又は付けられていてもよいラベルが画像に付けられていないことがある。このとき、当該ラベルに対応する画像を生成することは難しい。
【先行技術文献】
【非特許文献】
【０００４】
Kaneko, Ushiku, Harada, “Class-distinct and class-mutual image generation with GANs,” Proc. British Machine Vision Conference (BMVC), 2019.
Matsuda, Kimura, Uchida, “Impressions2Font: Generating Fonts by Specifying Impressions,” Proc. International Conference on Document Analysis and Recognition (ICDAR), 2021.
Gulrajani, Ahmed, Arjovsky, Dumoulin, Couville, “Improving training of Wasserstein GANs,” Proc. Conference on Neural Information Processing Systems (NIPS), 2017.
Mirza, Osindero, “Conditional generative adversarial nets,” arXiv preprint 1411.1784, 2014.
Odena, Olah, Shlens, “Conditional image synthesis with auxiliary classifier GANs,” Proc. International Conference on Machine Learning (ICML), 2017.
Hausel, Ramsauer, Unterthiner, Nessler, Hochreiter, “GANs trained by a two time-scale update rule converge to a local Nash equilibrium,” Proc. Conference on Neural Information Processing Systems (NeurIPS), 2017.
Miyato, Koyama, “cGANs with projection discriminator,” Proc. International Conference on Learning Representations (ICLR), 2018.
Pennington, Socher, Manning, “GloVe: Global vectors for word representation,” Proc. Conference on Empirical Methods in Natural Language Processing (EMNLP), 2014.
【発明の概要】
【発明が解決しようとする課題】
【０００５】
本発明の目的は、ラベルから生成する画像の質を向上させる編集ラベル表現ベクトル生成装置、学習装置、編集ラベル表現ベクトル生成方法、学習方法及びプログラムを提供することにある。
【課題を解決するための手段】
【０００６】
本発明の一態様は、学習用データに付与された学習用ラベルに基づいて作成された、ラベルの共起頻度を示すラベル共起行列と、ラベルを示すラベル表現ベクトルとに基づいて、共起関係は強いが付与されていないラベルを補うベクトルである編集ラベル表現ベクトルを生成する編集ラベル表現ベクトル生成装置である。
【０００７】
本発明の一態様は、学習用画像に付与されるラベルを予測し、予測ラベル表現ベクトルを生成する及び前記学習用画像がモデルにより生成された画像であるか否かを判定するラベル予測モデルと、前記予測ラベル表現ベクトルの次元を削減し、次元数を元に戻し、圧縮ラベル表現ベクトルを生成するラベル圧縮モデルと、前記圧縮ラベル表現ベクトルに基づいて画像を生成する画像生成モデルと、前記画像生成モデルにより生成された画像がモデルにより生成された画像であるか否かを判定する画像判定モデルと、前記学習用画像に対応する学習用ラベルに基づいて作成されたラベル表現ベクトルと前記圧縮ラベル表現ベクトルとの乖離を計算し、前記ラベル予測モデルと前記画像判定モデルとによる判定結果の乖離を計算する損失計算部と、前記損失計算部により計算された前記乖離に基づいて前記画像生成モデルを更新するモデル更新部と、を備える学習装置である。
【発明の効果】
【０００８】
本発明によれば、ラベルから生成する画像の質を向上させることができる。
【図面の簡単な説明】
【０００９】
本実施形態に係る画像生成システム１の構成を示す図である。
本実施形態に係る編集ラベル表現ベクトル生成装置２の構成を示す図である。
本実施形態に係る学習装置３の構成を示す図である。
本実施形態に係る画像生成装置４の構成を示す図である。
本実施形態における学習過程を示すフローチャートである。
本実施形態における画像生成過程を示すフローチャートである。
既存の手法と本実施形態の手法との比較を示す図である。
実験により生成した画像の例である。
【発明を実施するための形態】
【００１０】
以下、図面を参照しながら本発明の実施形態について詳しく説明する。
〈全体構成〉
図１は、本実施形態に係る画像生成システム１の構成を示す図である。画像生成システム１は、編集ラベル表現ベクトル生成装置２、学習装置３及び画像生成装置４を備える。編集ラベル表現ベクトル生成装置２は、学習用ラベル又は画像生成用ラベルに基づいて編集ラベル表現ベクトルを生成する。学習装置３は、学習用画像と学習用ラベルから作成された編集ラベル表現ベクトルを用いて内部の画像生成モデルなどを学習させる。学習装置３は、学習させた画像生成モデルなどを画像生成装置４に出力する。画像生成装置４は、画像生成用ラベルから作成された編集ラベル表現ベクトルに基づいて画像を生成する。
（【００１１】以降は省略されています）

関連特許