TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025092369
公報種別公開特許公報(A)
公開日2025-06-19
出願番号2024088711
出願日2024-05-31
発明の名称画像生成モデルの訓練方法、サービス実行方法、装置及び媒体
出願人個人
代理人弁理士法人ユニアス国際特許事務所
主分類G06V 10/774 20220101AFI20250612BHJP(計算;計数)
要約【課題】限られた訓練セットでサービス要件を満たすモデルを訓練するニーズを満たし、モデルの全体的な訓練効率を向上させる画像生成モデルの訓練方法、サービス実行方法、装置及び媒体を提供する。
【解決手段】画像生成モデルの訓練方法は、画像を取得することと、取得した原画像に対してノイズ付加処理を行い、ノイズ付加後画像を取得することと、ノイズ付加後画像を第1の画像生成モデルに入力し、前記第1の画像生成モデルを用いて、前記ノイズ付加後画像に対してノイズ除去を行って復元画像を得、前記復元画像から抽出された画像前景特徴を決定することと、原画像に対応する画像前景特徴と前記復元画像から抽出された画像前景特徴との間の差を最小化することを最適化目標として、前記第1の画像生成モデルを訓練することと、を含む。
【選択図】図1
特許請求の範囲【請求項1】
原画像を取得するステップと、
前記原画像に対してノイズ付加処理を行い、ノイズ付加後画像を得るステップと、
前記ノイズ付加後画像と、前記ノイズ付加後画像がノイズ付加された回数値とを第1の画像生成モデルに入力し、前記第1の画像生成モデルを用いて、復元画像が得られるまで、前記原画像に対して前記回数値のノイズ付加処理を行って前記ノイズ付加後画像に変換する際に使用される重畳ノイズ信号を予測し、前記重畳ノイズ信号に基づいて、k回目のノイズ付加処理を行う前のk-1枚目の遷移画像を予測し、前記重畳ノイズ信号と前記k-1枚目の遷移画像とに基づいて、k-1回目のノイズ付加処理を行う前のk-2枚目の遷移画像を予測し、前記復元画像から抽出された画像前景特徴を決定するステップであって、kは前記回数値を超えない正の整数であり、画像前景特徴は、画像内のターゲットオブジェクトの形態学的特徴を表すためのものであり、前記画像前景特徴には、前記ターゲットオブジェクトを表すための詳細な物理的特徴が含まれない、ステップと、
前記原画像に対応する画像前景特徴と前記復元画像から抽出された画像前景特徴との間の差を最小化することを最適化目標として、前記第1の画像生成モデルを訓練するステップと、を含む、
ことを特徴とする画像生成モデルの訓練方法。
続きを表示(約 2,200 文字)【請求項2】
前記原画像に対してノイズ付加処理を行い、ノイズ付加後画像を得るステップは、
前記原画像とノイズ信号の数とを予め構築された第2の画像生成モデルに入力し、前記第2の画像生成モデルに、前記ノイズ信号の数に対応する回数のノイズ付加処理が行われた前記原画像のノイズ付加後画像を出力させるステップを含む、
ことを特徴とする請求項1に記載の方法。
【請求項3】
前記第2の画像生成モデルの構築は、
サンプル画像を取得するステップと、
N個目のノイズ信号を用いて、N-1個目のノイズ信号でノイズ付加されたノイズ付加後画像に対してノイズ付加し、N個目のノイズ信号でノイズ付加されたノイズ付加後画像を得るステップであって、Nは1以上の正の整数であり、0個目のノイズ信号でノイズ付加されたノイズ付加後画像は前記サンプル画像である、ステップと、
N個目のノイズ信号でノイズ付加されたノイズ付加後画像と、N-m個目のノイズ信号でノイズ付加されたノイズ付加後画像と、N個目のノイズ信号と、N-m+1個目のノイズ信号とに基づいて、N-m個目のノイズ信号でノイズ付加されたノイズ付加後画像からN個目のノイズ信号でノイズ付加されたノイズ付加後画像までの変換関係を決定するステップであって、mはNより小さい正の整数である、ステップと、
前記変換関係に基づいて前記第2の画像生成モデルを構築するステップと、を含む、
ことを特徴とする請求項2に記載の方法。
【請求項4】
初期画像を取得するステップと、
前記初期画像を予め訓練された画像生成モデルに入力し、ターゲット画像を出力させるステップであって、前記画像生成モデルは、請求項1~3のいずれか1項に記載の訓練方法を用いて訓練して得られたモデルである、ステップと、
前記初期画像と前記ターゲット画像とに基づいて訓練セットを構築し、前記訓練セットを用いて所定の指定モデルを訓練し、訓練された指定モデルを用いてサービスを実行するステップと、を含む、
ことを特徴とするサービス実行方法。
【請求項5】
原画像を取得するための取得モジュールと、
前記原画像に対してノイズ付加処理を行い、ノイズ付加後画像を得るためのノイズ付加モジュールと、
前記ノイズ付加後画像と、前記ノイズ付加後画像がノイズ付加された回数値とを第1の画像生成モデルに入力し、前記第1の画像生成モデルを用いて、復元画像が得られるまで、前記原画像に対して前記回数値のノイズ付加処理を行って前記ノイズ付加後画像に変換する際に使用される重畳ノイズ信号を予測し、前記重畳ノイズ信号に基づいて、k回目のノイズ付加処理を行う前のk-1枚目の遷移画像を予測し、前記重畳ノイズ信号と前記k-1枚目の遷移画像とに基づいて、k-1回目のノイズ付加処理を行う前のk-2枚目の遷移画像を予測し、前記復元画像から抽出された画像前景特徴を決定するための入力モジュールであって、kは前記回数値を超えない正の整数であり、画像前景特徴は、画像内のターゲットオブジェクトの形態学的特徴を表すためのものであり、前記画像前景特徴には、前記ターゲットオブジェクトを表すための詳細な物理的特徴が含まれない、入力モジュールと、
前記原画像に対応する画像前景特徴と前記復元画像から抽出された画像前景特徴との間の差を最小化することを最適化目標として、前記第1の画像生成モデルを訓練するための訓練モジュールと、を含む、
ことを特徴とする画像生成モデルの訓練装置。
【請求項6】
前記ノイズ付加モジュールは、具体的に、
前記原画像とノイズ信号の数とを予め構築された第2の画像生成モデルに入力し、前記第2の画像生成モデルに、前記ノイズ信号の数に対応する回数のノイズ付加処理が行われた前記原画像のノイズ付加後画像を出力させるために用いられる、
ことを特徴とする請求項5に記載の装置。
【請求項7】
初期画像を取得するための取得モジュールと、
前記初期画像を予め訓練された画像生成モデルに入力し、ターゲット画像を出力させるための入力モジュールであって、前記画像生成モデルは、請求項1~3のいずれか1項に記載の訓練方法を用いて訓練して得られたモデルである、入力モジュールと、
前記初期画像と前記ターゲット画像とに基づいて訓練セットを構築し、前記訓練セットを用いて所定の指定モデルを訓練し、訓練された指定モデルを用いてサービスを実行するための訓練モジュールと、を含む、
ことを特徴とするサービス実行装置。
【請求項8】
コンピュータプログラムを記憶しているコンピュータ可読記憶媒体であって、前記コンピュータプログラムがプロセッサによって実行されると、請求項1~3のいずれか1項に記載の方法が実施される、
ことを特徴とするコンピュータ可読記憶媒体。
【請求項9】
プロセッサと、メモリに記憶され、プロセッサ上で動作可能なコンピュータプログラムとを含む電子デバイスであって、前記プロセッサが前記コンピュータプログラムを実行すると、請求項1~3のいずれか1項に記載の方法を実施する、
ことを特徴とする電子デバイス。

発明の詳細な説明【技術分野】
【0001】
本発明は、コンピュータビジョン分野に関し、特に、画像生成モデルの訓練方法、サービス実行方法、装置及び媒体に関する。
続きを表示(約 2,200 文字)【背景技術】
【0002】
コンピュータビジョン分野の急速な発展に伴い、深層学習技術に基づくモデルが、例えば、ユーザーのニーズに応じて画像の内容を判断する画像認識分野、得られた患者の病変情報に基づいて病変部の画像を生成する医療分野、プレイヤーの探索状況に応じてゲーム画像を生成するコンピュータゲーム分野など、様々な分野で利用されるようになってきている。
【0003】
しかし、既存のモデル訓練技術では、サービス要件を満たすモデルを訓練するために、上記モデルの訓練プロセスにおいて訓練データとして十分な量の画像データを使用する必要がある。画像データの量が十分でない場合、既存の技術では、サービス要件を満たすモデルを訓練することは困難である。例えば、芸術画像生成モデルにより生成される芸術画像の表現力や写実性が高いほど、訓練プロセスにおいてより多くの画像データが必要となり、画像データが不足すると、訓練された芸術画像生成モデルにより生成された芸術画像の表現力や写実性が要件を満たせなくなるという問題が生じる。
【0004】
したがって、量が十分でない画像データに基づいて、いかにしてサービス要件を満たすモデルを訓練するかは喫緊の課題である。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、従来技術に存在する上記問題を部分的に解決するために、画像生成モデルの訓練方法、サービス実行方法、装置及び媒体を提供する。
【課題を解決するための手段】
【0006】
本発明が採用する技術的解決手段は以下の通りである。
【0007】
本発明によって提供される画像生成モデルの訓練方法は、
原画像を取得するステップと、
前記原画像に対してノイズ付加処理を行い、ノイズ付加後画像を得るステップと、
前記ノイズ付加後画像と、前記ノイズ付加後画像がノイズ付加された回数値とを第1の画像生成モデルに入力し、前記第1の画像生成モデルを用いて、復元画像が得られるまで、前記原画像に対して前記回数値のノイズ付加処理を行って前記ノイズ付加後画像に変換する際に使用される重畳ノイズ信号を予測し、前記重畳ノイズ信号に基づいて、k回目のノイズ付加処理を行う前のk-1枚目の遷移画像を予測し、前記重畳ノイズ信号と前記k-1枚目の遷移画像とに基づいて、k-1回目のノイズ付加処理を行う前のk-2枚目の遷移画像を予測し、前記復元画像から抽出された画像前景特徴を決定するステップであって、kは前記回数値を超えない正の整数であり、画像前景特徴は、画像内のターゲットオブジェクトの形態学的特徴を表すためのものであり、前記画像前景特徴には、前記ターゲットオブジェクトを表すための詳細な物理的特徴が含まれない、ステップと、
前記原画像に対応する画像前景特徴と前記復元画像から抽出された画像前景特徴との間の差を最小化することを最適化目標として、前記第1の画像生成モデルを訓練するステップと、を含む。
【0008】
オプションで、前記原画像に対してノイズ付加処理を行い、ノイズ付加後画像を得るステップは、
前記原画像とノイズ信号の数とを予め構築された第2の画像生成モデルに入力し、前記第2の画像生成モデルに、前記ノイズ信号の数に対応する回数のノイズ付加処理が行われた前記原画像のノイズ付加後画像を出力させるステップを含む。
【0009】
オプションで、前記第2の画像生成モデルの構築は、
サンプル画像を取得するステップと、
N個目のノイズ信号を用いて、N-1個目のノイズ信号でノイズ付加されたノイズ付加後画像に対してノイズ付加し、N個目のノイズ信号でノイズ付加されたノイズ付加後画像を得るステップであって、Nは1以上の正の整数であり、0個目のノイズ信号でノイズ付加されたノイズ付加後画像は前記サンプル画像である、ステップと、
N個目のノイズ信号でノイズ付加されたノイズ付加後画像と、N-m個目のノイズ信号でノイズ付加されたノイズ付加後画像と、N個目のノイズ信号と、N-m+1個目のノイズ信号とに基づいて、N-m個目のノイズ信号でノイズ付加されたノイズ付加後画像からN個目のノイズ信号でノイズ付加されたノイズ付加後画像までの変換関係を決定するステップであって、mはNより小さい正の整数である、ステップと、
前記変換関係に基づいて前記第2の画像生成モデルを構築するステップと、を含む。
【0010】
本発明によって提供されるサービス実行方法は、
初期画像を取得するステップと、
前記初期画像を予め訓練された画像生成モデルに入力し、ターゲット画像を出力させるステップであって、前記画像生成モデルは、上記訓練方法を用いて訓練して得られたモデルである、ステップと、
前記初期画像と前記ターゲット画像とに基づいて訓練セットを構築し、前記訓練セットを用いて所定の指定モデルを訓練し、訓練された指定モデルを用いてサービスを実行するステップと、を含む。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
対話装置
8日前
個人
情報処理装置
8日前
個人
政治のAI化
1か月前
個人
物品給付年金
1か月前
個人
情報処理装置
4日前
個人
プラグインホームページ
22日前
個人
情報入力装置
8日前
個人
物価スライド機能付生命保険
8日前
キヤノン株式会社
通信装置
1か月前
個人
マイホーム非電子入札システム
8日前
個人
全アルゴリズム対応型プログラム
1か月前
キヤノン株式会社
画像処理装置
29日前
株式会社BONNOU
管理装置
1日前
サクサ株式会社
カードの制動構造
10日前
大同特殊鋼株式会社
輝線検出方法
1か月前
個人
決済手数料0%のクレジットカード
11日前
シャープ株式会社
電子機器
1か月前
村田機械株式会社
割当補助システム
14日前
パテントフレア株式会社
交差型バーコード
24日前
株式会社アジラ
データ転送システム
1か月前
トヨタ自動車株式会社
欠け検査装置
1か月前
株式会社ライト
情報処理装置
1日前
ミサワホーム株式会社
宅配ロッカー
28日前
トヨタ自動車株式会社
情報処理装置
14日前
ミサワホーム株式会社
情報処理装置
1か月前
オベック実業株式会社
端末用スタンド
1か月前
応研株式会社
業務支援システム
22日前
トヨタ自動車株式会社
管理装置
28日前
住友重機械工業株式会社
力覚伝達装置
3日前
株式会社ユピテル
電子機器及びプログラム等
1か月前
Sansan株式会社
組織図生成装置
17日前
個人
株管理システム
25日前
株式会社大林組
施工管理システム
24日前
株式会社豆蔵
ピッキング装置
10日前
西日本電信電話株式会社
評価装置
23日前
西日本電信電話株式会社
分析装置
23日前
続きを見る