TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025100333
公報種別
公開特許公報(A)
公開日
2025-07-03
出願番号
2024168492
出願日
2024-09-27
発明の名称
大規模言語モデルを使用したデータ調整
出願人
富士通株式会社
代理人
弁理士法人ITOH
主分類
G06N
20/00 20190101AFI20250626BHJP(計算;計数)
要約
【課題】大規模言語モデルを使用して機械学習モデルのためのデータを調整する方法、システム及び非一時的なコンピュータ可読媒体を提供する。
【解決手段】方法は、データセットのある特徴に対応する複数のデータサブセットを含むデータセットにアクセスし、データサブセット内のデータを、データの特性を決定するために解析し、決定した特性に基づいて、データサブセットのうちの1つのための複数のプロンプト・テンプレートからプロンプト・テンプレートを選択し、プロンプト・テンプレートと、データサブセットのうちの1つからのデータとを使用して、プロンプトを生成し、大規模言語モデル(LLM)に提供する。プロンプトは、LLMに、データサブセットのうちの1つのデータに関して一つ又は複数の動作を実行するように指令し、1つ又は複数の追加のデータサブセットを、LLMの応答に基づいてデータセットのために作成する。
【選択図】図1B
特許請求の範囲
【請求項1】
複数のデータサブセットを含むデータセットにアクセスする段階であって、各データサブセットは、前記データセットのある特徴に対応する、段階と;
前記データサブセットのうちの1つのデータサブセットにおけるデータを解析して、該データの特性を決定する段階と;
前記データサブセットのうちの前記1つのデータサブセットの前記データの決定された特性に基づいて、前記データサブセットのうちの前記1つのデータサブセットのための複数のプロンプト・テンプレートからプロンプト・テンプレートを選択する段階と;
前記プロンプト・テンプレートと、前記データサブセットのうちの前記1つのデータサブセットからの前記データとを使用して、複数の大規模言語モデル・プロンプトを生成する段階と;
前記複数の大規模言語モデル・プロンプトを、大規模言語モデルに提供する段階であって、前記複数の大規模言語モデル・プロンプトは、前記大規模言語モデルに、前記データサブセットのうちの前記1つのデータサブセットの前記データに関して一つまたは複数の動作を実行するように指令する、段階と;
前記大規模言語モデルの応答に基づいて前記データセットについて一つまたは複数の追加のデータサブセットを生成する段階であって、前記一つまたは複数の追加のデータサブセットのそれぞれは、前記データセットの新しい特徴に対応する、段階とを含む、
方法。
続きを表示(約 1,300 文字)
【請求項2】
前記データセットを使用して機械学習(ML)モデルをトレーニングする段階と;
前記MLモデルを使用して一つまたは複数の動作を実行する段階と
をさらに含む、請求項1に記載の方法。
【請求項3】
前記データサブセットのうちの前記1つのデータサブセットからの前記データは、キャラクタ・ストリングを含み、前記複数の大規模言語モデル・プロンプトは、前記キャラクタ・ストリングのそれぞれを2つ以上のサブストリングに分割することを含み、前記一つまたは複数の追加のデータサブセットは、前記2つ以上のサブストリングを使用して生成される、請求項1に記載の方法。
【請求項4】
前記データサブセットのうちの前記1つのデータサブセットの前記データの一部が前記大規模言語モデルに提供され、当該方法は:
前記大規模言語モデルの前記応答に基づいてストリング分割規則を決定する段階と;
前記ストリング分割規則を使用して、前記データサブセットのうちの前記1つのデータサブセットの前記データの残りの部分を2つ以上のサブストリングに分割する段階と
をさらに含む、請求項3に記載の方法。
【請求項5】
前記ストリング分割規則の品質が機械学習モデルのために十分であるかどうかを判定する段階と;
前記ストリング分割規則が前記機械学習モデルのために十分でないと判定したことに応答して、新しいストリング分割規則を決定する段階と
をさらに含む、請求項4に記載の方法。
【請求項6】
前記複数の大規模言語モデル・プロンプトは、前記データサブセットのうちの前記1つのデータサブセットの前記データをクラスタリングすることを含み、当該方法は、前記大規模言語モデルの前記応答によって識別された各クラスターのために識別子を割り当てることをさらに含み、前記一つまたは複数の追加のデータサブセットは、前記クラスターに関する情報を含む、請求項1に記載の方法。
【請求項7】
前記複数の大規模言語モデル・プロンプトは、前記大規模言語モデルに並列に提供される、請求項1に記載の方法。
【請求項8】
前記データサブセットのうちの前記1つのデータサブセットを前記一つまたは複数の追加のデータサブセットのうちの1つで置き換える段階をさらに含む、請求項1に記載の方法。
【請求項9】
前記データサブセットのうちの前記1つのデータサブセットからのデータが、テキスト・データであり、前記複数の大規模言語モデル・プロンプトは、前記テキストに関する追加情報を要求することを含み、前記一つまたは複数の追加データサブセットは、前記大規模言語モデルからの前記追加情報を含む、請求項1に記載の方法。
【請求項10】
前記データサブセットのうちの前記1つのデータサブセットからのデータが、テキスト・データであり、前記一つまたは複数の追加のデータサブセットは、前記データサブセットにおける個々のフレーズのサブフレーズに関する情報を含む、請求項1に記載の方法。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本開示は、概括的には、大規模言語モデルを使用して機械学習モデルのためのデータを調整することに関する。
続きを表示(約 1,400 文字)
【背景技術】
【0002】
機械学習(ML)モデルは、トレーニング・データセットを使用してトレーニングされる。トレーニング・データセットの品質は、MLモデルによって行われる予測の精度およびリアルさに影響を及ぼす。たとえば、トレーニング・データセットは、MLモデルの予測パターンを定義してもよい。さまざまなシナリオおよび特徴を含む、十分に多様化された代表的なトレーニング・データセットは、MLモデルが、異なるさまざまな入力データに対して有効な予測を行うことを許容しうる。
【0003】
本開示において請求される主題は、何らかの欠点を解決する実施形態、または、上述したような環境においてのみ動作する実施形態に限定されない。むしろ、この背景は、本開示に記載されるいくつかの実施形態が実施されうる1つの例示的な技術分野を示すためにのみ提供される。
【発明の概要】
【課題を解決するための手段】
【0004】
ある実施形態のある側面によれば、方法は、複数のデータサブセットを含むデータセットにアクセスすることを含んでいてもよく、各データサブセットは、データセットのある特徴に対応する。前記1つまたはそれらのデータサブセット内のデータは、該データの特性を決定するために解析されうる。加えて、データサブセットのうちの1つのデータの決定された特性に基づいて、データサブセットのうちの1つのための複数のプロンプト・テンプレートからプロンプト・テンプレートが選択されうる。プロンプト・テンプレートと、データサブセットのうちの1つからのデータとを使用して、複数の大規模言語モデル・プロンプトが生成されうる。複数の大規模言語モデル・プロンプトは、大規模言語モデルに提供されうる。複数の大規模言語モデル・プロンプトは、大規模言語モデルに、データサブセットのうちの1つのデータに関して一つまたは複数の動作を実行するように指令することができる。一つまたは複数の追加のデータサブセットが、大規模言語モデルの応答に基づいてデータセットのために作成されうる。一つまたは複数の追加のデータサブセットのそれぞれは、データセットの新しい特徴に対応してもよい。
【0005】
実施形態の目的および利点は、少なくとも、特許請求の範囲において特に指摘される要素、特徴、および組み合わせによって実現され、達成される。上記の一般的な記述および以下の詳細な説明はいずれも説明するものであり、特許請求される発明を制約するものではないことが理解される。
【図面の簡単な説明】
【0006】
例示的な実施形態が、添付の図面を通して、さらなる具体さおよび詳細とともに記載され、説明される。
【0007】
機械学習モデルをトレーニングするための例示的なシステムを示す。
【0008】
機械学習モデルをトレーニングするために使用されるデータセットを調整するように構成された例示的なシステムを示す。
【0009】
機械学習モデルをトレーニングするために使用されるデータセットを調整するように構成された別の例示的なシステムを示す。
【0010】
データセットの一つまたは複数のデータサブセットを調整する例示的な方法のフローチャートを示す。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
富士通株式会社
マーキング方法及びプログラム
2日前
富士通株式会社
量子デバイス及び量子デバイスの制御方法
2日前
富士通株式会社
カメラ制御プログラム、カメラ制御方法及び情報処理装置
2日前
富士通株式会社
カメラ制御プログラム、カメラ制御方法及び情報処理装置
2日前
富士通株式会社
競争位置表示処理プログラムおよび競争位置表示処理方法
3日前
富士通株式会社
特徴抽出装置、画像マッチング機器及びコンピュータプログラム
10日前
個人
対話装置
1か月前
個人
裁判のAI化
9日前
個人
情報処理装置
1か月前
個人
情報処理システム
16日前
個人
記入設定プラグイン
1か月前
個人
情報処理装置
1か月前
個人
検査システム
18日前
個人
設計支援システム
1日前
個人
プラグインホームページ
1か月前
個人
設計支援システム
1日前
キヤノン電子株式会社
携帯装置
17日前
個人
情報入力装置
1か月前
株式会社サタケ
籾摺・調製設備
17日前
個人
不動産売買システム
24日前
株式会社カクシン
支援装置
4日前
個人
物価スライド機能付生命保険
1か月前
個人
備蓄品の管理方法
16日前
個人
マイホーム非電子入札システム
1か月前
キヤノン株式会社
情報処理装置
17日前
キヤノン株式会社
情報処理装置
17日前
株式会社BONNOU
管理装置
1か月前
サクサ株式会社
中継装置
17日前
アスエネ株式会社
排水量管理方法
17日前
東洋電装株式会社
操作装置
17日前
東洋電装株式会社
操作装置
17日前
株式会社東芝
電子機器
25日前
サクサ株式会社
カードの制動構造
1か月前
株式会社ワコム
電子消去具
24日前
キヤノン電子株式会社
名刺管理システム
18日前
個人
決済手数料0%のクレジットカード
1か月前
続きを見る
他の特許を見る