TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025161756
公報種別
公開特許公報(A)
公開日
2025-10-24
出願番号
2025060910
出願日
2025-04-02
発明の名称
データ変換のための方法と装置及びコンピュータプログラム
出願人
富士通株式会社
代理人
弁理士法人ITOH
主分類
G06F
16/90 20190101AFI20251017BHJP(計算;計数)
要約
【課題】本発明は。データ変換方法と装置及びプログラムを提供する。
【解決手段】かかる方法は、少なくとも1つの大規模言語モデルに少なくとも1つの指示を送信することで第一大規模言語モデルエージェント及び第二大規模言語モデルエージェントをエージェントシステムとして定義し;ユーザーにより提供される第一構造化データファイル及び質問セットを受信し;第一構造化データファイル及び質問セットに基づいて第二構造化データファイルを生成するための指示をエージェントシステムに提供し;及び、エージェントシステムから、第二大規模言語モデルエージェントの検証済みの、質問セットにおけるすべての質問に回答し得る第二構造化データファイルを得ることを含む。
【選択図】図1
特許請求の範囲
【請求項1】
データを変換する方法であって、
少なくとも1つの大規模言語モデルに2つの指示を提供することで、第一大規模言語モデルエージェント及び第二大規模言語モデルエージェントをエージェントシステムとして定義し、前記2つの指示は、
前記エージェントシステムが前記第一大規模言語モデルエージェントと前記第二大規模言語モデルエージェントとの間の連携により、第一構造化データファイルに基づいて、前記第一構造化データファイルに関する質問を含む質問セットにおけるすべての質問に回答し得る第二構造化データファイルを生成し;
前記第一大規模言語モデルエージェントが以下のデータ変換タスクを実行するように定義され、即ち、未回答質問情報により未回答の質問があると示される場合に、前記第一構造化データファイルから、前記質問セットにおけるすべての質問に回答するためのデータを前記第二構造化データファイルとして抽出し;及び
前記第二大規模言語モデルエージェントが以下の検証タスクを実行するように定義され、即ち、前記第二構造化データファイルに基づいて前記質問セットにおける各質問に回答し得るかを検証することで、前記未回答質問情報を更新する
ように構成され;
ユーザーにより提供される前記第一構造化データファイル及び前記質問セットを受信し;
前記エージェントシステムに、前記第一構造化データファイル及び前記質問セットに基づいて前記第二構造化データファイルを生成するための指示を送信し;及び
前記エージェントシステムから、前記第二大規模言語モデルエージェントの検証済みの、前記質問セットにおけるすべての質問に回答し得る前記第二構造化データファイルを取得することを含む、方法。
続きを表示(約 1,000 文字)
【請求項2】
請求項1に記載の方法であって、
前記2つの指示のうち、前記第一大規模言語モデルエージェントを定義する指示は、前記第一構造化データファイルの内容に関する説明を含む、方法。
【請求項3】
請求項1に記載の方法であって、
前記ユーザーが前記第一大規模言語モデルエージェントとの間でデータ抽出及び/又は前記第二構造化データファイルのデータ配置様式についてインタラクションを行うためのインターフェースを提供することをさらに含む、方法。
【請求項4】
請求項1に記載の方法であって、
前記2つの指示のうち、前記第二大規模言語モデルエージェントを定義する指示は、前記第二大規模言語モデルエージェントが前記第二構造化データファイル及び前記質問セットに基づいて拡張質問を生成し、かつ前記拡張質問を前記質問セットに追加して前記質問セットを更新するように構成される、方法。
【請求項5】
請求項1に記載の方法であって、
前記少なくとも1つの大規模言語モデルは生成型事前訓練変換器モデルである、方法。
【請求項6】
請求項1に記載の方法であって、
前記2つの指示のうち、前記第一大規模言語モデルエージェントを定義する指示は、前記第一大規模言語モデルエージェントがユーザーフレンドリーのデータ配置様式を有する前記第二構造化データファイルを生成するように構成される、方法。
【請求項7】
請求項1に記載の方法であって、
前記第二構造化データファイルのデータ配置様式は前記第一構造化データファイルのデータ配置様式とは異なる、方法。
【請求項8】
請求項1に記載の方法であって、
前記第一構造化データファイルにはデータを説明する自然言語文(sentence)が含まれない、方法。
【請求項9】
データを変換する装置であって、
プログラムを記憶している記憶器;及び
前記記憶器に接続される少なくとも1つの処理器を含み、
前記処理器は前記プログラムを実行して請求項1乃至8のうちの任意の1項に記載の方法を実現するように構成される、装置。
【請求項10】
コンピュータに、請求項1乃至8のうちの任意の1項に記載の方法を実行させるためのプログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、データ処理に関し、特に、データを変換するための方法、データを変換するための装置、及びコンピュータプログラムに関する。
続きを表示(約 2,300 文字)
【背景技術】
【0002】
タスク駆動型データ自動変換方法が高度な技術である。それはデータマイニング、自然言語処理(Natural Language Processing、NLP)、機械学習などの分野における最新のテクノロジーを組み合わせることで、データ処理の効率及び精度を向上させる。該技術の中核は複雑なデータ構造及びユーザーのニーズを理解し、これに基づいてデータを自動で変換することによって、特定の解析目標や業務目標を満足できる。変換の対象となるデータは様々な技術分野、例えば、輸送、販売、工業生産、世論、環境監視、リモートセンシング、気象、金融、SNSなどからのものであっても良い。
【0003】
データマイニング技術は大規模なデータセットから有用な情報及びパターンを抽出することを目的とする。該技術は分類、回帰、クラスタリング、関連付けルールのマイニングなどの処理に関するが、これらに限定されない。これらの処理はすべてデータの内在構造を認識するための強力なツールである。例えば、クラスタリングアルゴリズムはデータを類似した特徴を有する集合(セット)に自動的にグループ化でき、これはデータの本質的な特徴への理解及び後続のデータ変換にとって非常に重要である。関連付けルールのマイニングはデータ属性間の興味深い関係を明らかにすることによって、データの変換にルールベースのガイダンス(指導)を提供できる。
【0004】
NLPはコンピュータが人間の言語を理解、解釈及び生成できるようにさせるための技術である。それは一連のサブ分野、例えば、文法解析、語義解析、情感解析などを含む。これらはすべてデータ自動変換に必要不可欠な技術である。NLPを適用することで、コンピュータは自然言語形式のクエリ及び命令(指令)を理解し、そして、これに基づいてデータに対して対応する変換及び処理を行うことができる。例えば、語義解析はシステムがクエリの意味を理解することを助けることによって、データ変換の結果がユーザーの意図と一致するように確保できる。
【0005】
機械学習アルゴリズムはコンピュータがデータから学習してそのパフォーマンスを改善できるようにさせる。データ自動変換の背景の下で、機械学習はデータのパターン及び構造を認識することによって、データの変換プロセスをガイド(指導)するために利用され得る。特に、GPT(Generative Pre-Trained Transformer)やBERT(Bidirectional Encoder Representations from Transformers)などの大規模言語モデルは、大量のテキストデータをもとに訓練を行うことでテキストの理解及び生成の面において強力な能力を有することが実証されている。これらのモデルの出現により、テキストベースのデータの自動処理及び変換の新しい可能性が開かれるため、テキストデータからの構造化情報の抽出はより効果的かつ正確になっている。
【0006】
現代のデータ自動変換方法はより統合的かつインテリジェントな方向に向かって発展している。これはデータマイニング、NLP、機械学習などの技術を密接に統合する総合的なフレームワーク構造を要する。このような総合的なフレームワークは複雑なデータ及びユーザーのクエリを理解できるだけでなく、データ変換プロセスを自動で訓練して最適化することもできる。このような方式により、システムはそのパフォーマンスを適応的に改善できるため、より正確でパーソナライズされるデータ処理サービスをユーザーに提供できる。
【0007】
これらの技術の組み合わせにより、タスク駆動型データ自動変換方法は様々な分野、例えば、財務分析、市場調査、社会科学などで重要な役割を果たすことができる。一部の分野ではデータの処理及び解析への要求が特に高い。また、データ量及びデータ類型が増加し続けるにつれて、より強力かつ柔軟なサポートをデータ駆動型意思決定に提供するために、このような自動化方法の重要性がさらに高まる。
【0008】
要約すると、タスク駆動型データ自動変換方法は学際的な分野であり、それは様々な高度な技術を結集し、データ処理の効率及び知能化レベルの向上を目指す。技術の進歩及び応用分野の拡大に伴い、このような方法は将来のデータ処理及び解析においてより重要な役割を果たすことが予想され得る。
【0009】
既存の人工知能言語モデルはデータ変換の面において能力が不十分である。例えば、或る入力データセットについての質問をモデルに知らせる(提示する)場合に、例えば、データフォーマット、データ類型、データ複製度合いなどの問題が原因で、モデルは「エラー」を出力する可能性がある。即ち、モデルは、エラーが発生し、提示された質問に回答できないことをユーザーに知らせることがある。
【発明の概要】
【発明が解決しようとする課題】
【0010】
発明者は、既存のAI(Artificial Intelligence)モデルによるデータ自動変換に関する研究及び実験を行い、本発明の解決策を提案しており、データ変換の自動化レベルの向上及び変換後のデータ品質の改善により、変換後のデータがユーザーのニーズと十分に一致するようにさせることができる。
【課題を解決するための手段】
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
富士通株式会社
半導体装置
1か月前
富士通株式会社
行列演算回路
1か月前
富士通株式会社
周波数変換器
1か月前
富士通株式会社
画像処理モデル
29日前
富士通株式会社
メッシュ微細化
1か月前
富士通株式会社
半導体デバイス
1か月前
富士通株式会社
演算器及び演算方法
1か月前
富士通株式会社
ポイントクラウド分類
1か月前
富士通株式会社
冷却装置及び電子機器
1か月前
富士通株式会社
アレイアンテナモジュール
1か月前
富士通株式会社
電子機器筐体及び電子機器
1か月前
富士通株式会社
OLT及びPONシステム
13日前
富士通株式会社
光送信器及び光トランシーバ
1か月前
富士通株式会社
基板及びこれを備えた電子装置
1か月前
富士通株式会社
通信制御装置及び移動中継装置
1か月前
富士通株式会社
演算処理装置及び情報処理装置
23日前
富士通株式会社
プログラム及びデータ処理装置
7日前
富士通株式会社
演算処理装置及び演算処理方法
2か月前
富士通株式会社
テキスト案内される画像エディタ
1か月前
富士通株式会社
波長変換装置および波長変換方法
26日前
富士通株式会社
メモリ管理装置及びメモリ管理方法
1か月前
富士通株式会社
動的多次元メディアコンテンツ投影
2か月前
富士通株式会社
ラックマウント装置及びラック装置
26日前
富士通株式会社
異常予測方法および異常予測プログラム
2か月前
富士通株式会社
受光デバイス及び受光デバイスの製造方法
12日前
富士通株式会社
通知プログラム、通知方法および通知装置
12日前
富士通株式会社
コンパイルプログラムおよびコンパイル方法
7日前
富士通株式会社
演算システムおよび演算システムの制御方法
2か月前
富士通株式会社
管理装置、管理方法、および管理プログラム
1か月前
富士通株式会社
検出プログラム、検出方法および情報処理装置
26日前
富士通株式会社
プログラム、情報処理方法および情報処理装置
1か月前
富士通株式会社
シストリック型の演算アレイ装置及び制御方法
2か月前
富士通株式会社
予測プログラム、予測方法および情報処理装置
2か月前
富士通株式会社
交通シミュレーションのための方法および装置
2か月前
富士通株式会社
生成プログラム、生成方法および情報処理装置
1か月前
富士通株式会社
キャッシュ装置およびキャッシュ装置の制御方法
1か月前
続きを見る
他の特許を見る