TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025178111
公報種別
公開特許公報(A)
公開日
2025-12-05
出願番号
2025035602
出願日
2025-03-06
発明の名称
半生成人工知能
出願人
ザ・ボーイング・カンパニー
代理人
個人
,
個人
,
個人
主分類
G06T
11/80 20060101AFI20251128BHJP(計算;計数)
要約
【課題】ドメイン間の半生成人工知能モデリングを提供する。
【解決手段】本方法は、第1のドメインのオブジェクトのソース画像を受信するステップと、ソース拡散モデルを介してソース画像を拡散させて、第1のドメインの第1のガウス分布を生成するステップとを含む。埋め込みは、画像再構成のための制約を提供するメタデータから生成される。埋め込みは、二重拡散暗黙ブリッジに供給される。第1のガウス分布は、サンプリングされ、二重拡散暗黙ブリッジを介して、第1のガウス分布から第2のドメインの第2のガウス分布にマッピングされる。次いで、第2のガウス分布は、ターゲット拡散モデルを介して逆拡散され、メタデータに従う第2のドメインのオブジェクトのターゲット画像を生成する。
【選択図】図6
特許請求の範囲
【請求項1】
ドメイン間の半生成人工知能モデリングのためのコンピュータ実施方法であって、前記方法は、
いくつかのプロセッサを使用して実行される、
第1のドメインのオブジェクトのソース画像を受信するステップと、
ソース拡散モデルを介して前記ソース画像を拡散させて、前記第1のドメインに第1のガウス分布を生成するステップと、
メタデータから埋め込みを生成するステップであって、前記メタデータが画像再構成のための制約を提供する、ステップと、
前記埋め込みを二重拡散暗黙ブリッジに供給するステップと、
前記第1のガウス分布からサンプルを抽出するステップと、
前記二重拡散暗黙ブリッジを介して、前記サンプルを前記第1のガウス分布から第2のドメインの第2のガウス分布にマッピングするステップと、
ターゲット拡散モデルを介して前記第2のガウス分布を逆拡散させて、前記メタデータに従う前記第2のドメインの前記オブジェクトのターゲット画像を生成するステップと
を含む、コンピュータ実装方法。
続きを表示(約 1,200 文字)
【請求項2】
前記第1のドメインが、3次元CAD(コンピュータ支援設計)画像データを含む、請求項1に記載の方法。
【請求項3】
前記第2のドメインが、実世界画像データを含む、請求項1に記載の方法。
【請求項4】
前記ターゲット画像が、フォトリアリスティック画像を含む、請求項3に記載の方法。
【請求項5】
前記メタデータは、
データのクラスタリング、
プロンプト埋め込み、
セグメンテーションマスク、
2次元図面情報、
ターゲットオブジェクトのテキスト記述、
ターゲットオブジェクトの音声記述、
ターゲットオブジェクトのグラフ表現、
材料、または
背景
のうちの少なくとも1つを含む、請求項1に記載の方法。
【請求項6】
前記メタデータが、画像およびビデオに対してテキストおよび仕様を相互参照する人工知能設計パーサによって提供される情報を含む、請求項1に記載の方法。
【請求項7】
前記ソース拡散モデルおよび前記ターゲット拡散モデルが、シュレーディンガーブリッジを含む、請求項1に記載の方法。
【請求項8】
ドメイン間の半生成人工知能モデリングのためのシステムであって、前記システムは、
プログラム命令を記憶するストレージデバイスと、
前記ストレージデバイスに動作可能に接続された1つまたは複数のプロセッサと
を備え、
前記1つまたは複数のプロセッサは、前記プログラム命令を実行して、前記システムに、
第1のドメインのオブジェクトのソース画像を受信することと、
ソース拡散モデルを介して前記ソース画像を拡散させて、前記第1のドメインに第1のガウス分布を生成することと、
メタデータから埋め込みを生成することであって、前記メタデータが画像再構成のための制約を提供する、ことと、
前記埋め込みを二重拡散暗黙ブリッジに供給することと、
前記第1のガウス分布からサンプルを抽出することと、
前記二重拡散暗黙ブリッジを介して、前記サンプルを前記第1のガウス分布から第2のドメインの第2のガウス分布にマッピングすることと、
ターゲット拡散モデルを介して前記第2のガウス分布を逆拡散させて、前記メタデータに従う前記第2のドメインの前記オブジェクトのターゲット画像を生成することと
を行わせる、システム。
【請求項9】
前記第1のドメインが、3次元CAD(コンピュータ支援設計)画像データを含む、請求項8に記載のシステム。
【請求項10】
前記第2のドメインが、実世界画像データを含む、請求項8に記載のシステム。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本開示は、一般に、人工知能システムに関し、より具体的には、生成AIモデルにおけるランダム化されたノイズを制御することに関する。
続きを表示(約 2,600 文字)
【背景技術】
【0002】
人工知能を実装するオブジェクト検出システムは、高い精度、特異性、および多様性を有する、大きな現実的な視覚データセットを使用してターゲットオブジェクトを正確に検出するように訓練される。高い精度は、人間ラベラーからのバイアスを低減することによって達成される。様々な環境条件でターゲットオブジェクトの異なる画像を取り込むことにより、高い特異度が達成される。様々な視野角および視点からのターゲットオブジェクトの様々な画像を含めることによって、高い多様性が達成される。しかしながら、特にカメラを使用してターゲットオブジェクトの写真を手動で撮影し、人間のオペレータに各画像をグラウンドトゥルースターゲットオブジェクトクラスでラベル付けさせる従来の方法を使用して、高い精度、特異性、および多様性を伴う大きな現実的な視覚データセットを開発することは困難である。これらの制限は、大規模オブジェクト検出システムの開発および展開を遅らせている。
【発明の概要】
【課題を解決するための手段】
【0003】
例示的な実施形態は、ドメイン間の半生成(semi-generative)人工知能モデリングのための方法を提供する。本方法は、第1のドメインのオブジェクトのソース画像を受信するステップと、ソース拡散モデルを介してソース画像を拡散させて、第1のドメインの第1のガウス分布を生成するステップとを含む。埋め込みは、画像再構成のための制約を提供するメタデータから生成される。埋め込みは、二重拡散暗黙ブリッジに供給される。第1のガウス分布は、サンプリングされ、二重拡散暗黙ブリッジを介して、第1のガウス分布から第2のドメインの第2のガウス分布にマッピングされる。次いで、第2のガウス分布は、ターゲット拡散モデルを介して逆拡散され、メタデータに従う第2のドメインのオブジェクトのターゲット画像を生成する。
【0004】
別の例示的な実施形態は、ドメイン間の半生成人工知能モデリングのためのシステムを提供する。システムは、プログラム命令を記憶するストレージデバイスと、ストレージデバイスに動作可能に接続され、プログラム命令を実行して、システムに、第1のドメインのオブジェクトのソース画像を受信することと、ソース拡散モデルを介してソース画像を拡散させて、第1のドメインに第1のガウス分布を生成することと、メタデータから埋め込みを生成することであって、メタデータが画像再構成のための制約を提供する、ことと、埋め込みを二重拡散暗黙ブリッジに供給することと、第1のガウス分布からサンプルを抽出することと、二重拡散暗黙ブリッジを介して、サンプルを第1のガウス分布から第2のドメインの第2のガウス分布にマッピングすることと、ターゲット拡散モデルを介して第2のガウス分布を逆拡散させて、メタデータに従う第2のドメインのオブジェクトのターゲット画像を生成することとを行わせる、1つまたは複数のプロセッサとを備える。
【0005】
別の例示的な実施形態は、ドメイン間の半生成人工知能モデリングのためのコンピュータプログラム製品を提供する。コンピュータプログラム製品は、第1のドメインのオブジェクトのソース画像を受信することと、ソース拡散モデルを介してソース画像を拡散させて、第1のドメインに第1のガウス分布を生成することと、メタデータから埋め込みを生成することであって、メタデータが画像再構成のための制約を提供する、ことと、埋め込みを二重拡散暗黙ブリッジに供給することと、第1のガウス分布からサンプルを抽出することと、二重拡散暗黙ブリッジを介して、サンプルを第1のガウス分布から第2のドメインの第2のガウス分布にマッピングすることと、ターゲット拡散モデルを介して第2のガウス分布を逆拡散させて、メタデータに従う第2のドメインのオブジェクトのターゲット画像を生成することとを実行するために具現化されたプログラム命令を有するコンピュータ可読記憶媒体を備える。
【0006】
形態および機能は、本開示の様々な実施形態において独立して達成されることができ、あるいは以下の説明および図面を参照してさらなる詳細を理解することができるさらに他の実施形態において組み合わされてもよい。
【0007】
例示的な実施形態の特徴であると考えられる新規の形態が、添付の特許請求の範囲に記載されている。しかしながら、例示的な実施形態、ならびにそれらの好ましい使用の態様、さらなる目的、および形態は、本開示の例示的な実施形態の以下の詳細な説明を参照し、添付の図面と併せて検討することによって、最もよく理解されよう。
【図面の簡単な説明】
【0008】
例示的な実施形態による半生成システムのブロック図である。
例示的な実施形態を実施することができる拡散モデルを示す図である。
例示的な実施形態によるドメイン間の画像変換の一例を示す図である。
例示的な実施形態によるメタデータ制約を使用した半生成AI画像生成を示す図である。
例示的な実施形態による3D CADモデルからフォトリアリスティックモデルへの画像復号化の一例を示す図である。
例示的な実施形態によるドメイン間の半生成人工知能モデリングのためのプロセスを示すフローチャートである。
例示的な実施形態によるデータ処理システムのブロック図である。
【発明を実施するための形態】
【0009】
例示的な実施形態は、生成人工知能(AI)モデルが、生成されたコンテンツの完全性を検証するための精度および検証層を欠いていることを認識し、考慮に入れる。
【0010】
例示的な実施形態は、生成AIモデルから生成されたコンテンツに精度および忠実度の追加の層を追加する半生成AIモデリングの方法を提供する。製造および生産環境で設計、生産、および検査データからのメタデータを利用することにより、例示的な実施形態は、デュアルフュージョン技術を介して生成AIモデルの出力を制御する。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
個人
詐欺保険
1か月前
個人
縁伊達ポイン
1か月前
個人
5掛けポイント
1か月前
個人
職業自動販売機
24日前
個人
RFタグシート
1か月前
個人
QRコードの彩色
1か月前
個人
ペルソナ認証方式
1か月前
個人
自動調理装置
1か月前
個人
情報処理装置
1か月前
個人
立体グラフの利用方法
3日前
個人
農作物用途分配システム
1か月前
個人
残土処理システム
2か月前
個人
タッチパネル操作指代替具
1か月前
NISSHA株式会社
入力装置
4日前
個人
インターネットの利用構造
1か月前
個人
サービス情報提供システム
26日前
個人
学習用データ生成装置
5日前
個人
携帯端末障害問合せシステム
1か月前
個人
スケジュール調整プログラム
1か月前
個人
エリアガイドナビAIシステム
1か月前
キラル株式会社
顧客体験提供システム
6日前
エッグス株式会社
情報処理装置
1か月前
キヤノン株式会社
印刷システム
1か月前
キヤノン株式会社
情報処理装置
1か月前
キヤノン株式会社
情報処理装置
18日前
キヤノン株式会社
画像認識装置
18日前
トヨタ自動車株式会社
通知装置
1か月前
株式会社ワコム
電子ペン
1か月前
株式会社ワコム
電子ペン
1か月前
株式会社ケアコム
項目選択装置
1か月前
株式会社ケアコム
項目選択装置
1か月前
キヤノン株式会社
情報処理装置
18日前
個人
請求金額算出システム
10日前
トヨタ自動車株式会社
車両
1か月前
キヤノン電子株式会社
情報処理システム
3日前
大同特殊鋼株式会社
棒材計数方法
2か月前
続きを見る
他の特許を見る