発明の詳細な説明【技術分野】 【0001】 本発明は、編集ラベル表現ベクトル生成装置、学習装置、編集ラベル表現ベクトル生成方法、学習方法及びプログラムに関する。 続きを表示(約 2,900 文字)【背景技術】 【0002】 画像と画像に付けられたラベルのデータセットを用いて、画像を生成するモデルを作成し、当該モデルにラベルを入力することで、ラベルに対応する画像を出力させる技術がある。例えば非特許文献1及び2に開示がある。 【0003】 しかしながら、データセットにおいて画像に付けられたラベルが過不足なく付けられているとは限らない。例えば、付けられるべき又は付けられていてもよいラベルが画像に付けられていないことがある。このとき、当該ラベルに対応する画像を生成することは難しい。 【先行技術文献】 【非特許文献】 【0004】 Kaneko, Ushiku, Harada, “Class-distinct and class-mutual image generation with GANs,” Proc. British Machine Vision Conference (BMVC), 2019. Matsuda, Kimura, Uchida, “Impressions2Font: Generating Fonts by Specifying Impressions,” Proc. International Conference on Document Analysis and Recognition (ICDAR), 2021. Gulrajani, Ahmed, Arjovsky, Dumoulin, Couville, “Improving training of Wasserstein GANs,” Proc. Conference on Neural Information Processing Systems (NIPS), 2017. Mirza, Osindero, “Conditional generative adversarial nets,” arXiv preprint 1411.1784, 2014. Odena, Olah, Shlens, “Conditional image synthesis with auxiliary classifier GANs,” Proc. International Conference on Machine Learning (ICML), 2017. Hausel, Ramsauer, Unterthiner, Nessler, Hochreiter, “GANs trained by a two time-scale update rule converge to a local Nash equilibrium,” Proc. Conference on Neural Information Processing Systems (NeurIPS), 2017. Miyato, Koyama, “cGANs with projection discriminator,” Proc. International Conference on Learning Representations (ICLR), 2018. Pennington, Socher, Manning, “GloVe: Global vectors for word representation,” Proc. Conference on Empirical Methods in Natural Language Processing (EMNLP), 2014. 【発明の概要】 【発明が解決しようとする課題】 【0005】 本発明の目的は、ラベルから生成する画像の質を向上させる編集ラベル表現ベクトル生成装置、学習装置、編集ラベル表現ベクトル生成方法、学習方法及びプログラムを提供することにある。 【課題を解決するための手段】 【0006】 本発明の一態様は、学習用データに付与された学習用ラベルに基づいて作成された、ラベルの共起頻度を示すラベル共起行列と、ラベルを示すラベル表現ベクトルとに基づいて、共起関係は強いが付与されていないラベルを補うベクトルである編集ラベル表現ベクトルを生成する編集ラベル表現ベクトル生成装置である。 【0007】 本発明の一態様は、学習用画像に付与されるラベルを予測し、予測ラベル表現ベクトルを生成する及び前記学習用画像がモデルにより生成された画像であるか否かを判定するラベル予測モデルと、前記予測ラベル表現ベクトルの次元を削減し、次元数を元に戻し、圧縮ラベル表現ベクトルを生成するラベル圧縮モデルと、前記圧縮ラベル表現ベクトルに基づいて画像を生成する画像生成モデルと、前記画像生成モデルにより生成された画像がモデルにより生成された画像であるか否かを判定する画像判定モデルと、前記学習用画像に対応する学習用ラベルに基づいて作成されたラベル表現ベクトルと前記圧縮ラベル表現ベクトルとの乖離を計算し、前記ラベル予測モデルと前記画像判定モデルとによる判定結果の乖離を計算する損失計算部と、前記損失計算部により計算された前記乖離に基づいて前記画像生成モデルを更新するモデル更新部と、を備える学習装置である。 【発明の効果】 【0008】 本発明によれば、ラベルから生成する画像の質を向上させることができる。 【図面の簡単な説明】 【0009】 本実施形態に係る画像生成システム1の構成を示す図である。 本実施形態に係る編集ラベル表現ベクトル生成装置2の構成を示す図である。 本実施形態に係る学習装置3の構成を示す図である。 本実施形態に係る画像生成装置4の構成を示す図である。 本実施形態における学習過程を示すフローチャートである。 本実施形態における画像生成過程を示すフローチャートである。 既存の手法と本実施形態の手法との比較を示す図である。 実験により生成した画像の例である。 【発明を実施するための形態】 【0010】 以下、図面を参照しながら本発明の実施形態について詳しく説明する。 〈全体構成〉 図1は、本実施形態に係る画像生成システム1の構成を示す図である。画像生成システム1は、編集ラベル表現ベクトル生成装置2、学習装置3及び画像生成装置4を備える。編集ラベル表現ベクトル生成装置2は、学習用ラベル又は画像生成用ラベルに基づいて編集ラベル表現ベクトルを生成する。学習装置3は、学習用画像と学習用ラベルから作成された編集ラベル表現ベクトルを用いて内部の画像生成モデルなどを学習させる。学習装置3は、学習させた画像生成モデルなどを画像生成装置4に出力する。画像生成装置4は、画像生成用ラベルから作成された編集ラベル表現ベクトルに基づいて画像を生成する。 (【0011】以降は省略されています) この特許をJ-PlatPatで参照する