TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025168666
公報種別公開特許公報(A)
公開日2025-11-11
出願番号2025074273
出願日2025-04-28
発明の名称産業用途向けのドメイン固有検索拡張生成
出願人アイトマティック インコーポレイテッド
代理人弁理士法人谷・阿部特許事務所
主分類G06F 16/3329 20250101AFI20251104BHJP(計算;計数)
要約【課題】産業用生成AIにおける改善された質問回答を提供する。
【解決手段】大規模言語モデル(LLM)を使用して検索拡張生成を使用して自然言語の質問に回答するシステムは、一連のドメイン固有の文書をLLMで利用可能にベクトルデータベースに格納し、自然言語の質問を受信し、ベクトルデータベースから自然言語の質問に関連する文書のサブセットを検索し、自然言語の質問に回答するためにベクトルデータベースから検索した文書のサブセットに追加して必要な事前知識情報を決定し、機械学習ベースの言語モデルの訓練中に機械学習ベースの言語モデルによって得られた事前知識を使用しないようにする機械学習ベースの言語モデルへの命令を含む機械学習ベースの言語モデルのプロンプトを生成し、プロンプトに基づいて機械学習ベースの言語モデルを実行することで生成された応答を受信し、応答に基づいてアクションを実行する。
【選択図】図5
特許請求の範囲【請求項1】
自然言語の質問の検索拡張生成に基づく回答のためのコンピュータ実装方法であって:
ベクトルデータベースに一連の文書を格納することであって、前記ベクトルデータベースは、前記一連の文書のそれぞれのベクトル表現を格納する、前記格納することと;
自然言語の質問を受信することと;
前記自然言語の質問のベクトル表現を生成することと;
前記自然言語の質問の前記ベクトル表現に基づいて、前記自然言語の質問に関連する文書のサブセットを検索することと;
前記自然言語の質問に回答するために前記ベクトルデータベースから検索された前記文書のサブセットに追加して必要な事前知識情報を決定することと;
前記事前知識情報にアクセスするための事前知識ソースシステムを識別することと;
前記事前知識ソースシステムにアクセスして、前記事前知識情報を抽出することと;
機械学習ベースの言語モデルのプロンプトを生成することであって:
前記自然言語の質問と,
前記ベクトルデータベースから検索された前記文書のサブセットと,
前記事前知識情報と,
前記機械学習ベースの言語モデルの訓練中に前記機械学習ベースの言語モデルによって得られた事前知識を使用しないようにする前記機械学習ベースの言語モデルへの命令と,を含む前記プロンプトを生成することと;
前記プロンプトを前記機械学習ベースの言語モデルに提供することと;
前記プロンプトに基づいて前記機械学習ベースの言語モデルを実行することによって生成された応答を受信することと;
前記応答に基づいてアクションを実行することと、
を含む、コンピュータ実装方法。
続きを表示(約 1,900 文字)【請求項2】
前記ベクトルデータベースは、特定のドメインのドメイン固有の文書を格納する、請求項1に記載のコンピュータ実装方法。
【請求項3】
前記特定のドメインは、
半導体産業、
石油及び天然ガス産業、または
製造業、
のうちの1つの産業ドメインを表す、請求項2に記載のコンピュータ実装方法。
【請求項4】
前記文書のサブセットは、前記自然言語の質問の前記ベクトル表現と前記文書のサブセットのそれぞれの前記ベクトル表現との間のベクトル距離を表す距離メトリックに基づいて、前記自然言語の質問に最も近いと決定される前記一連の文書からの文書を表す、請求項1に記載のコンピュータ実装方法。
【請求項5】
前記事前知識情報にアクセスするための前記事前知識ソースシステムを識別することは、前記機械学習ベースの言語モデルに基づいている、請求項1に記載のコンピュータ実装方法。
【請求項6】
前記プロンプトは第1のプロンプトであり、前記応答は第1の応答であり、前記事前知識情報にアクセスするための前記事前知識ソースシステムを識別することは;
前記機械学習ベースの言語モデルに、前記自然言語の質問を解決するための事前知識を含むと予想される特定の事前知識ソースシステムを識別するように要求する第2のプロンプトを生成することと;
前記第2のプロンプトを前記機械学習ベースの言語モデルに提供することと;
前記第2のプロンプトに基づいて前記機械学習ベースの言語モデルを実行することによって生成された第2の応答を受信することと;
前記第2のプロンプトから前記事前知識ソースシステムを識別することと;
を含む請求項1に記載のコンピュータ実装方法。
【請求項7】
前記事前知識情報を含む1つまたは複数の文書を前記ベクトルデータベースに追加すること、をさらに含む:請求項1に記載のコンピュータ実装方法。
【請求項8】
1つまたは複数のコンピュータプロセッサによって実行されると、前記1つまたは複数のコンピュータプロセッサに、自然言語の質問の検索拡張生成に基づく回答のためのステップを実行させる命令を格納する非一時的コンピュータ可読記憶媒体であって、前記ステップは:
ベクトルデータベースに一連の文書を格納することであって、前記ベクトルデータベースは、前記一連の文書のそれぞれのベクトル表現を格納する、前記格納することと;
自然言語の質問を受信することと;
前記自然言語の質問のベクトル表現を生成することと;
前記自然言語の質問の前記ベクトル表現に基づいて、前記自然言語の質問に関連する文書のサブセットを検索することと;
前記自然言語の質問に回答するために前記ベクトルデータベースから検索された前記文書のサブセットに追加して必要な事前知識情報を決定することと;
前記事前知識情報にアクセスするための事前知識ソースシステムを識別することと;
前記事前知識ソースシステムにアクセスして、前記事前知識情報を抽出することと;
機械学習ベースの言語モデルのプロンプトを生成することであって:
前記自然言語の質問と,
前記ベクトルデータベースから検索された前記文書のサブセットと,
前記事前知識情報と,
前記機械学習ベースの言語モデルの訓練中に前記機械学習ベースの言語モデルによって得られた事前知識を使用しないようにする前記機械学習ベースの言語モデルへの命令と,を含む前記プロンプトを生成することと;
前記プロンプトを前記機械学習ベースの言語モデルに提供することと;
前記プロンプトに基づいて前記機械学習ベースの言語モデルを実行することによって生成された応答を受信することと;
前記応答に基づいてアクションを実行することと、
を含む、非一時的コンピュータ可読記憶媒体。
【請求項9】
前記ベクトルデータベースは、特定のドメインのドメイン固有の文書を格納する、請求項8に記載の非一時的コンピュータ可読記憶媒体。
【請求項10】
前記特定のドメインは、
半導体産業,
石油及び天然ガス産業,または
製造業,
のうちの1つの産業ドメインを表す、請求項9に記載の非一時的コンピュータ可読記憶媒体。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本開示は、一般に、人工知能及び機械学習技術に関するものであり、より具体的には、産業応用のためのドメイン特化型の検索拡張生成ベースの人工知能技術に関するものである。
続きを表示(約 3,000 文字)【0002】
(関連出願の相互参照)
本出願は、参照によりその全体が組み込まれる、2024年4月29日に出願された米国仮特許出願第63/640,155号の米国特許法第119条(e)に基づく利益を主張する。
【背景技術】
【0003】
人工知能(AI)技術は、いくつかの産業システムに有用である。例えば、機械学習ベースの言語モデルは、様々な環境で遭遇する様々な問題に対する答えを生成するために使用される。そのような機械学習ベースの言語モデルの例としては、GPT(生成型事前学習済みトランスフォーマ)などの大規模言語モデル(LLM)が含まれる。これらのモデルは、インターネット、書籍のライブラリなどの大規模なテキストのコーパスを使用して訓練される。その結果、そのような言語モデルは、一般的な一連の質問に答えるように訓練される。しかしながら、これらの言語モデルは、例えば、特定の産業環境に関連する質問など、ドメイン固有の問題に関連する質問に答えるために必要なドメイン固有の知識を欠いている。このような質問には専門知識が必要である。さらに、これらの重要なアプリケーションは、最先端の言語モデルで経験される幻覚(hallucination)を許容することはできない。たとえば、大規模言語モデルでは、事実を作り出して、回答に使用し得る。そのような作り出された事実は現実ではなく、実際の産業環境では使用し得ない。その結果、そのような言語モデルから得られる答えはしばしば不十分である。
【発明の概要】
【0004】
システムは、検索拡張生成(retrieval-augmented generation)を使用して自然言語の質問に回答する。システムは、一連の文書をベクトルデータベースに格納する。実施形態によれば、ベクトルデータベースは、例えば、半導体産業、石油及び天然ガス産業、または製造業などの産業からの産業ドメインに関する特定のドメインに関するドメイン固有の文書を格納する。
【0005】
ベクトルデータベースは、各文書のベクトル表現を格納する。システムは、自然言語の質問を受信し、自然言語の質問のベクトル表現を生成する。システムは、自然言語の質問のベクトル表現に基づいて、自然言語の質問に関連する文書のサブセットを検索する。システムは、自然言語の質問に答えるためにベクトルデータベースから検索された文書のサブセットに追加して必要な事前知識情報を決定する。システムは、事前知識情報にアクセスするための事前知識ソースシステムを特定する。システムは、事前知識ソースシステムにアクセスして、事前知識情報を抽出する。
【0006】
システムは、(1)自然言語の質問、(2)ベクトルデータベースから検索された文書のサブセット、(3)事前知識情報、及び(4)機械学習ベースの言語モデルに対して、機械学習ベースの言語モデルの訓練中に機械学習ベースの言語モデルによって得られた事前知識を使用しないようにする命令を含む機械学習ベースの言語モデルのためのプロンプトを生成する。システムは、プロンプトを機械学習ベースの言語モデルに提供し、プロンプトに基づいて機械学習ベースの言語モデルを実行することによって生成された応答を受信する。システムは、応答に基づいてアクションを実行する。
【0007】
実施形態は、本明細書に記載の自然言語の質問に基づく検索拡張生成に基づく応答のためのステップを実行するコンピュータ実装方法と;1つまたは複数のコンピュータプロセッサによって実行されると、1つまたは複数のコンピュータプロセッサに本明細書に記載の自然言語の質問の検索拡張生成に基づく回答のためのステップを実行させる命令を格納する非一時的コンピュータ可読記憶媒体と;1つまたは複数のコンピュータプロセッサと、1つまたは複数のコンピュータプロセッサによって実行されると、1つまたは複数のコンピュータプロセッサに本明細書に記載の自然言語の質問の検索拡張生成に基づく回答のためのステップを実行させる命令を格納する非一時的コンピュータ可読記憶媒体とを含むコンピュータシステムとを含む。
【図面の簡単な説明】
【0008】
開示された実施形態は、詳細な説明、添付の特許請求の範囲、及び添付の図(または図面)からより容易に明らかとなる他の利点、及び特徴を有する。図面の簡単な説明は、以下のとおりである。
図1Aは、実施形態によるシステムによって実行される全体的なプロセスを示す図である。
図1Bは、実施形態による、サブタスクへのタスクの階層的分解を示す図である。
図1Cは、実施形態による、システムによって実行される階層的なタスク計画を示す図である。
図1Dは、実施形態による、システムが従うOODAプロセスを示す図である。
図2は、実施形態による、システムがクエリに回答するために従うプロセスの詳細を示す図である。
図3は、実施形態による、システムが現在利用可能な情報に基づいてクエリに回答できるかどうかを決定するための評価フレームワークを示す図である。
図4は、実施形態による、結果の精度の向上を提供するLLMに基づく例示的なRAGベースのシステムを示す図である。
図5は、実施形態による、検索拡張生成を使用してドメイン固有の自然言語の質問に回答するための全体的なプロセスを示すフローチャートである。
図6は、実施形態による、例示的なシステムを示すハイレベルブロック図である。
【0009】
明細書に記載された特徴及び利点は、すべてを網羅するものではなく、特に、図面、明細書、及び特許請求の範囲を考慮すれば、多くの追加の特徴及び利点が当業者には明らかであろう。さらに、本明細書で使用される用語は、主に読みやすさと説明の目的で選択されており、開示された主題を限定または制限するために選択されたものではないことに留意すべきである。
【発明を実施するための形態】
【0010】
実施形態によるシステムは、産業用生成AIにおける改善された質問回答を提供する。このシステムは、ドメイン固有のモデル微調整と反復推論メカニズムを、検索拡張生成(RAG)ワークフローに統合する。このシステムは、より優れたリトリーバー(retriever)とジェネレーター(generator)を利用し、多段階推論を使用することによって、パフォーマンスの向上を達成する。システムは、階層的なタスク計画を実行し、複雑なタスクをサブタスクに分解し、タスクごとに実行される多段階推論ループであるOODA推論を実行する。 このシステムは、OODA(観察、方向付け、決定、及び行動)ループを使用して反復的な推論を行い、観察(observe)、方向付け(orientation)、決定(decision)及び行動(action)のフェーズを通じてプロセスを洗練させることで、人間の専門家の品質に近づく回答をもたらす。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

個人
詐欺保険
28日前
個人
縁伊達ポイン
28日前
個人
RFタグシート
15日前
個人
5掛けポイント
4日前
個人
工程設計支援装置
2か月前
個人
QRコードの彩色
1か月前
個人
ペルソナ認証方式
12日前
個人
地球保全システム
1か月前
個人
情報処理装置
7日前
個人
自動調理装置
14日前
個人
冷凍食品輸出支援構造
2か月前
個人
為替ポイント伊達夢貯
2か月前
個人
表変換編集支援システム
2か月前
個人
残土処理システム
1か月前
個人
農作物用途分配システム
27日前
個人
携帯情報端末装置
2か月前
個人
知的財産出願支援システム
1か月前
個人
インターネットの利用構造
11日前
個人
知財出願支援AIシステム
2か月前
個人
タッチパネル操作指代替具
21日前
個人
結婚相手紹介支援システム
2か月前
個人
パスワード管理支援システム
2か月前
個人
AIによる情報の売買の仲介
2か月前
個人
行動時間管理システム
2か月前
個人
スケジュール調整プログラム
20日前
個人
携帯端末障害問合せシステム
20日前
個人
パスポートレス入出国システム
2か月前
個人
食品レシピ生成システム
1か月前
株式会社キーエンス
受発注システム
1か月前
個人
システム及びプログラム
1か月前
株式会社アジラ
進入判定装置
2か月前
株式会社キーエンス
受発注システム
1か月前
日本精機株式会社
施工管理システム
2か月前
株式会社キーエンス
受発注システム
1か月前
個人
AIキャラクター制御システム
2か月前
個人
エリアガイドナビAIシステム
12日前
続きを見る