TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025087598
公報種別
公開特許公報(A)
公開日
2025-06-10
出願番号
2024194737
出願日
2024-11-06
発明の名称
大型言語モデルのためのプロンプトのテーブルを処理する方法及びシステム
出願人
Allganize Japan株式会社
代理人
弁理士法人秀和特許事務所
主分類
G06F
40/177 20200101AFI20250603BHJP(計算;計数)
要約
【課題】大型言語モデルのためのプロンプトのテーブルを処理する方法およびシステムを提供する。
【解決手段】テーブル処理方法は、大型言語モデル(Large Language Models, LLM)のためのプロンプトに利用される文書の文書形式を確認するステップ、前記文書形式に従って前記文書に含まれたテーブルを認識するステップ、前記認識されたテーブルの内容をマークダウン形態または自然語形態に変換するステップおよび前記変換されたテーブルの内容を前記プロンプトへの使用またはRAG(Retrieval Augmented Generation)のリトリーバ(retriever)のテーブル検索のための使用のためにストレージに保存するステップを含む。
【選択図】図3
特許請求の範囲
【請求項1】
少なくとも1つのプロセッサを含むコンピュータ装置のテーブル処理方法において、
前記少なくとも1つのプロセッサによって、大型言語モデル(Large Language Models, LLM)のプロンプトに利用される文書の文書フォーマットを確認するステップ;
前記少なくとも1つのプロセッサによって、前記文書フォーマットに基づいて前記文書
に含まれるテーブルを認識するステップ;
前記少なくとも1つのプロセッサによって、前記認識されたテーブルの内容をマークダ
ウン形態または自然言語形態に変換するステップ;および
前記少なくとも1つのプロセッサによって、前記変換されたテーブルの内容を前記プロ
ンプトへの使用またはRAG(Retrieval Augmented Generation)のリトリーバー(retriever)のテーブル検索のための使用のためにストレージに保存するステップ
を含むテーブル処理方法。
続きを表示(約 1,700 文字)
【請求項2】
請求項1において、
前記変換する段階は、
前記認識されたテーブルに統合されたセル(mergedcell)が存在するか否か及び前記認識されたテーブルに含まれるテキストの全長の少なくとも一つに基づいて前記認識されたテーブルの内容をマークダウン形態または自然語形態に変換することを特徴とするテーブル処理方法。
【請求項3】
請求項2において、
前記変換する段階は、
前記認識されたテーブルが結合されたセルを含まず、前記認識されたテーブルに含まれるテキストの全体の長さが予め設定された基準値未満である場合に、前記認識されたテーブルの内容をマークダウン形式に変換し、前記認識されたテーブルが結合されたセルを含むか、または前記全体の長さが前記予め設定された基準値以上である場合に、前記認識されたテーブルの内容を自然言語形式に変換することを特徴とするテーブル処理方法。
【請求項4】
請求項1において、
前記変換する段階は、
前記認識されたテーブルの内容を自然言語形式に変換する場合、
前記テーブルのヘッダーを抽出する段階;
前記テーブルの読み取り方向を決定する段階;及び
前記読み取り方向に従って、前記テーブルからヘッダーと前記テーブルの値を一行ずつ読み取って自然言語を生成する段階
を含むことを特徴とするテーブル処理方法。
【請求項5】
請求項4において、
前記テーブルのリーディング方向を決定するステップは、
前記リーディング方向を前記テーブルの列基準方向及び行基準方向のうち一つに決定することを特徴とするテーブル処理方法。
【請求項6】
請求項1において、
前記文書フォーマットを確認するステップは、
前記文書に対応するファイルの拡張子を通じて前記文書フォーマットを確認することを特徴とするテーブル処理方法。
【請求項7】
請求項1において、
前記文書フォーマットはDOCXファイルフォーマット、エクセル(Excel)ファイルフォー
マット、PDF(Portable Document Format)ファイルフォーマットのうち少なくとも1つに分類されることを特徴とするテーブル処理方法。
【請求項8】
請求項1において、
前記テーブルを認識する段階は、
前記文書フォーマットがPDFファイルフォーマットである場合に人工知能モデルを通じ
て前記テーブルが存在する領域を検出して前記テーブルを検出する段階;
前記文書フォーマットがDOCXファイルフォーマットである場合にDOCXファイルが含むテーブル構造に関する情報を利用して前記テーブルを認識する段階;及び
前記文書フォーマットがエクセルファイルフォーマットである場合に前記文書を画像に変換し、前記変換された画像から前記テーブルが存在する領域を検出して前記テーブルを検出する段階
を含むことを特徴とするテーブル処理方法。
【請求項9】
請求項1から請求項8のうちいずれか一項の方法を前記コンピュータ装置に実行させるためにコンピュータ読み取り可能な記録媒体に保存されるコンピュータプログラム。
【請求項10】
コンピュータ装置で読み取り可能な命令を実行するように具現される少なくとも1つの
プロセッサを含み、
前記少なくとも1つのプロセッサにより、
大型言語モデル(Large Language Models, LLM)のためのプロンプトに利用される文書の文書フォーマットを確認し、
前記文書フォーマットに従って前記文書に含まれたテーブルを認識し、
前記認識されたテーブルの内容をマークダウン形態または自然語形態に変換し、
前記変換されたテーブルの内容を前記プロンプトでの使用またはRAG(Retrieval Augmented Generation)のretrieverのテーブル検索のための使用のために保存所に保存することを特徴とするコンピュータ装置。
発明の詳細な説明
【技術分野】
【0001】
下記の説明は、大型言語モデルのためのプロンプトのテーブルを処理する方法及びシステムに関するものである。
続きを表示(約 1,900 文字)
【背景技術】
【0002】
大型言語モデル又は巨大言語モデル(Large Language Models, LLM)は、自然言語入力に対して人間と類似した応答を生成するために大規模テキストデータ集合で訓練された人工知能の一種であり、膨大なパラメータ(通常は数十億ウェイト以上)を保有する人工ニューラルネットワークで構成される言語モデルである。このようなLLMは、自己教師あり学
習や半自己教師あり学習を使用してラベル付けされていない相当な量のテキストで学習することができる。
【0003】
このようなLLMは、単一の文書をプロンプトとして入力し、回答を生成するRAG(Retrieval Augmented Generation)能力が非常に優れている。しかし、一般的に文書にはグラフやテーブルのような非文字データが含まれることがある。特に、プロンプトに含まれるテーブル情報をどのようにLLMに入力するかによって、LLMの性能が大きく異なる可能性がある。また、特定の質問に対する回答が文書内のテーブルにあるかどうかをRAGのリトリーバ
ー(Retriever)で見つける必要があるが、この場合もテーブルをどのように表記するかに
よってリトリーバの性能が大きく異なる。特に、結合されたセル(merged cell)を含む複
雑なテーブルの場合、LLMとリトリーバの性能に非常に大きな影響を与える可能性がある
。
【先行技術文献】
【特許文献】
【0004】
韓国登録特許第10-2551531号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
大型言語モデルのためのプロンプトのテーブルを処理する方法およびシステムを提供する。
【課題を解決するための手段】
【0006】
少なくとも1つのプロセッサを含むコンピュータ装置のテーブル処理方法において、前
記少なくとも1つのプロセッサによって、大型言語モデル(Large Language Models, LLM)
のためのプロンプトに利用される文書の文書フォーマットを確認するステップ;前記少な
くとも1つのプロセッサによって、前記文書フォーマットに従って前記文書に含まれたテ
ーブルを認識するステップ;前記少なくとも1つのプロセッサによって、前記認識されたテーブルの内容をマークダウン形態または自然語形態に変換するステップ;および前記少な
くとも1つのプロセッサによって、前記変換されたテーブルの内容を前記プロンプトでの
使用またはRAG(Retrieval Augmented Generation)のリトリーバー(retriever)のテーブル検索のための使用のためにストレージに保存するステップを含むテーブル処理方法を提供する。
【0007】
一側面によれば、前記変換する段階は、前記認識されたテーブルに結合されたセル(merged cell)が存在するか否か及び前記認識されたテーブルに含まれるテキストの全体の長
さの中の少なくとも一つに基づいて前記認識されたテーブルの内容をマークダウン形態又
は自然語形態に変換することを特徴とすることができる。
【0008】
他の側面によれば、前記変換する段階は、前記認識されたテーブルが結合されたセルを含まずかつ前記認識されたテーブルに含まれるテキストの全体の長さが予め設定された基準値未満である場合に前記認識されたテーブルの内容をマークダウン形態に変換し、前記認識されたテーブルが結合されたセルを含むか又は前記全体の長さが前記予め設定された基準値以上である場合に前記認識されたテーブルの内容を自然語形態に変換することを特徴とすることができる。
【0009】
さらに他の側面によれば、前記変換する段階は、前記認識されたテーブルの内容を自然語形態に変換する場合、前記テーブルのヘッダーを抽出する段階;前記テーブルのリーディング方向を決定する段階;及び前記リーディング方向に従って前記テーブルでヘッダーと前記テーブルの値を一行ずつ読み取って自然語を生成する段階を含むことを特徴とすることができる。
【0010】
さらに他の側面によれば、前記テーブルのリーディング方向を決定する段階は、前記リーディング方向を前記テーブルの列基準の方向及び行基準の方向のうちの一つに決定することを特徴とすることができる。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
対話装置
2日前
個人
情報処理装置
2日前
個人
政治のAI化
25日前
個人
物品給付年金
1か月前
個人
RFタグ読取装置
1か月前
個人
在宅介護システム
1か月前
個人
プラグインホームページ
16日前
個人
情報入力装置
2日前
キヤノン株式会社
通信装置
1か月前
個人
物価スライド機能付生命保険
2日前
個人
マイホーム非電子入札システム
2日前
個人
全アルゴリズム対応型プログラム
26日前
キヤノン株式会社
画像処理装置
23日前
個人
決済手数料0%のクレジットカード
5日前
サクサ株式会社
カードの制動構造
4日前
株式会社CROSLAN
支援装置
1か月前
大同特殊鋼株式会社
輝線検出方法
25日前
シャープ株式会社
電子機器
25日前
村田機械株式会社
割当補助システム
8日前
トヨタ自動車株式会社
情報処理装置
8日前
株式会社アジラ
データ転送システム
25日前
長屋印刷株式会社
画像形成システム
1か月前
ミサワホーム株式会社
宅配ロッカー
22日前
パテントフレア株式会社
交差型バーコード
18日前
トヨタ自動車株式会社
欠け検査装置
25日前
ミサワホーム株式会社
情報処理装置
1か月前
オベック実業株式会社
端末用スタンド
26日前
応研株式会社
業務支援システム
16日前
Sansan株式会社
組織図生成装置
11日前
トヨタ自動車株式会社
管理装置
22日前
株式会社ユピテル
電子機器及びプログラム等
1か月前
株式会社mov
情報処理システム
2日前
西日本電信電話株式会社
分析装置
17日前
株式会社豆蔵
ピッキング装置
4日前
シャープ株式会社
通信装置
2日前
シャープ株式会社
通信装置
15日前
続きを見る
他の特許を見る