TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025081253
公報種別
公開特許公報(A)
公開日
2025-05-27
出願番号
2024196434
出願日
2024-11-11
発明の名称
方法、システム、コンピュータプログラム(トレーニングデータ識別及びモデル選択)
出願人
インターナショナル・ビジネス・マシーンズ・コーポレーション
,
INTERNATIONAL BUSINESS MACHINES CORPORATION
代理人
個人
,
個人
,
弁理士法人RYUKA国際特許事務所
主分類
G06F
40/44 20200101AFI20250520BHJP(計算;計数)
要約
【課題】トレーニングデータ識別及びモデル選択のための技術が提供される。
【解決手段】一実施形態において、この技術は、第1のクエリで第1の言語学習モデルにクエリする段階、ここで第1の言語学習モデルは、第1のクエリに対するテキスト出力応答を生成する;テキスト出力応答のグルーピングを生成する段階、ここでグルーピングは、複数のn-グラムを含む;第1のトレーニングデータ及び第2のトレーニングデータに基づきグルーピングのソーススコアを生成する段階;及びソーススコアに基づき、第1のトレーニングデータを第1の言語学習モデルのトレーニングデータとして識別する段階を含む。
【選択図】図3
特許請求の範囲
【請求項1】
第1のクエリで第1の言語学習モデルにクエリする段階、ここで前記第1の言語学習モデルは、前記第1のクエリに対するテキスト出力応答を生成する;
前記テキスト出力応答のグルーピングを生成する段階、ここで前記グルーピングは、複数のn-グラムを含む;
第1のトレーニングデータ及び第2のトレーニングデータに基づき前記グルーピングのソーススコアを生成する段階;及び
前記ソーススコアに基づき、前記第1のトレーニングデータを前記第1の言語学習モデルのトレーニングデータとして識別する段階
を備える方法。
続きを表示(約 2,400 文字)
【請求項2】
クエリ、及び言語学習モデルのセットの対応する応答のレーティングに基づき、トレーニングデータのランク付けを生成する段階、ここで前記トレーニングデータのランク付けは、前記第1のトレーニングデータのランク付けを含む;
前記トレーニングデータのランク付け及び第2のクエリに基づき、前記言語学習モデルのセットのうちの第2の言語学習モデルを選択する段階;及び
前記第2の言語学習モデルに基づき、前記第2のクエリに対する応答を生成する段階
をさらに備える、請求項1に記載の方法。
【請求項3】
前記ソーススコアは、前記第1の言語学習モデルをトレーニングするために前記第1のトレーニングデータが使用された可能性を表し、前記ソーススコアを生成する段階は、
前記第1のトレーニングデータに基づき前記グルーピングの第1のスコアを生成する段階、ここで前記第1のトレーニングデータは、前記第1の言語学習モデルによって使用された前記トレーニングデータの潜在的なソースを表す;及び
前記第2のトレーニングデータに基づき前記グルーピングの第2のスコアを生成する段階、ここで前記第2のトレーニングデータは、所与の母集団の標準的な通信データを表す、
を含む、請求項1に記載の方法。
【請求項4】
前記ソーススコアは、スコアs=最大(0,(スコア
1
-スコア
2
))として判断され、ここでスコア
S
は前記ソーススコアを表し、スコア
1
は前記グルーピングの前記第1のスコアを表し、スコア
2
は前記グルーピングの前記第2のスコアを表す、請求項3に記載の方法。
【請求項5】
前記第1のスコアは
JPEG
2025081253000012.jpg
51
170
として判断され、ここでスコア
1
は、前記第1のスコアを表し、n-グラム
重複
は、前記n-グラムのそれぞれ及び前記第1のトレーニングデータの重複の個数を表し、n-グラム
一意
は、前記テキスト出力応答における一意のn-グラムの個数を表し、第1のトレーニングデータ
バイト
は、前記第1のトレーニングデータのサイズをバイトで表す、請求項4に記載の方法。
【請求項6】
前記第2のスコアは
JPEG
2025081253000013.jpg
51
170
として判断され、ここでスコア
2
は、前記第2のスコアを表し、n-グラム
重複
は、前記n-グラムのそれぞれ及び前記第2のトレーニングデータの重複の個数を表し、n-グラム
一意
は、前記テキスト出力応答における一意のn-グラムの個数を表し、第2のトレーニングデータ
バイト
は、前記第2のトレーニングデータのサイズをバイトで表す、請求項4または5に記載の方法。
【請求項7】
プロセッサ;及び
前記プロセッサによって実行されたときに、
第1のクエリで第1の言語学習モデルにクエリする手順、ここで前記第1の言語学習モデルは、前記第1のクエリに対するテキスト出力応答を生成する;
前記テキスト出力応答のグルーピングを生成する手順、ここで前記グルーピングは、複数のn-グラムを含む;
第1のトレーニングデータ及び第2のトレーニングデータに基づき前記グルーピングのソーススコアを生成する手順;及び
前記ソーススコアに基づき、前記第1のトレーニングデータを前記第1の言語学習モデルのトレーニングデータとして識別する手順
を含む動作を行うアルゴリズム又はコンピュータ命令を有するメモリ又はストレージ
を備えるシステム。
【請求項8】
前記動作は、
クエリ、及び言語学習モデルのセットの対応する応答のレーティングに基づき、トレーニングデータのランク付けを生成する手順、ここで前記トレーニングデータのランク付けは、前記第1のトレーニングデータのランク付けを含む;
前記トレーニングデータのランク付け及び第2のクエリに基づき、前記言語学習モデルのセットのうちの第2の言語学習モデルを選択する手順;及び
前記第2の言語学習モデルに基づき、前記第2のクエリに対する応答を生成する手順
をさらに含む、請求項7に記載のシステム。
【請求項9】
前記ソーススコアは、前記第1の言語学習モデルをトレーニングするために前記第1のトレーニングデータが使用された可能性を表し、前記ソーススコアを生成する手順は、
前記第1のトレーニングデータに基づき前記グルーピングの第1のスコアを生成する手順、ここで前記第1のトレーニングデータは、前記第1の言語学習モデルによって使用された前記トレーニングデータの潜在的なソースを表す;及び
前記第2のトレーニングデータに基づき前記グルーピングの第2のスコアを生成する手順、ここで前記第2のトレーニングデータは、所与の母集団の標準的な通信データを表す、
を含む、請求項7に記載のシステム。
【請求項10】
前記ソーススコアは、スコアs=最大(0,(スコア
1
-スコア
2
))として判断され、ここでスコア
S
は前記ソーススコアを表し、スコア
1
は前記グルーピングの前記第1のスコアを表し、スコア
2
は前記グルーピングの前記第2のスコアを表す、請求項9に記載のシステム。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本開示は、言語学習モデル(language learning model:LLM)に関し、より具体的には、LLMをトレーニングするために使用されるトレーニングデータを識別し、識別されたトレーニングデータに基づき使用するLLMを選択することに関する。
続きを表示(約 2,300 文字)
【発明の概要】
【発明が解決しようとする課題】
【0002】
従来のLLMは、トレーニングデータを分析して言語ベースのパターン、意味論、及びコンテキストの手がかりを学習することにより、人間の言語を理解及び再生するように設計されている。LLMは、ニューラルネットワークアーキテクチャ及び深層学習技術を用いてトレーニングデータを処理し、入力データ及び人間の言語の出力の間の相関関係又は因果関係を確立することができる。しかしLLMは概して、それらがトレーニングされたデータセットを明らかにせず、それによりトレーニングデータに関連する潜在的な問題を識別する取り組みを困難にする。
【課題を解決するための手段】
【0003】
本開示の一実施形態により、方法が提供される。
方法は、第1のクエリで第1の言語学習モデルにクエリする段階、ここで前記第1の言語学習モデルは、前記第1のクエリに対するテキスト出力応答を生成する;前記テキスト出力応答のグルーピングを生成する段階、ここで前記グルーピングは、複数のn-グラムを含む;第1のトレーニングデータ及び第2のトレーニングデータに基づき前記グルーピングのソーススコアを生成する段階;及び前記ソーススコアに基づき、前記第1のトレーニングデータを前記第1の言語学習モデルのトレーニングデータとして識別する段階を含む。
【0004】
本開示の一実施形態により、システムが提供される。
システムは、プロセッサ;及び前記プロセッサによって実行されたときに、第1のクエリで第1の言語学習モデルにクエリする手順、ここで前記第1の言語学習モデルは、前記第1のクエリに対するテキスト出力応答を生成する;前記テキスト出力応答のグルーピングを生成する手順、ここで前記グルーピングは、複数のn-グラムを含む;第1のトレーニングデータ及び第2のトレーニングデータに基づき前記グルーピングのソーススコアを生成する手順;及び前記ソーススコアに基づき、前記第1のトレーニングデータを前記第1の言語学習モデルのトレーニングデータとして識別する手順を含む動作を行うアルゴリズム又はコンピュータ命令を有するメモリ又はストレージを含む。
【0005】
本開示の一実施形態により、具現化されるコンピュータ可読プログラムコードを有するコンピュータ可読記憶媒体であって、前記コンピュータ可読プログラムコードは、動作を行うために、1つ又は複数のコンピュータプロセッサによって実行可能である、コンピュータ可読記憶媒体が提供される。
動作は、第1のクエリで第1の言語学習モデルにクエリする手順、ここで前記第1の言語学習モデルは、前記第1のクエリに対するテキスト出力応答を生成する;前記テキスト出力応答のグルーピングを生成する手順、ここで前記グルーピングは、複数のn-グラムを含む;第1のトレーニングデータ及び第2のトレーニングデータに基づき前記グルーピングのソーススコアを生成する手順;及び前記ソーススコアに基づき、前記第1のトレーニングデータを前記第1の言語学習モデルのトレーニングデータとして識別する手順を含む。
【0006】
本開示の一実施形態により、システムが提供される。
システムは、プロセッサ;及び前記プロセッサによって実行されたときに、ソーススコアに基づき、第1のトレーニングデータを第1の言語学習モデルのトレーニングデータとして識別する手順;クエリ、及び言語学習モデルのセットの対応する応答のレーティングに基づき、トレーニングデータのランク付けを生成する手順、ここで前記トレーニングデータのランク付けは、第1のトレーニングデータのランク付けを含む;前記トレーニングデータのランク付け及びクエリに基づき、前記言語学習モデルのセットのうちの第2の言語学習モデルを選択する手順;及び前記第2の言語学習モデルに基づき、前記クエリに対する応答を生成する手順を含む動作を行うアルゴリズム又はコンピュータ命令を有するメモリ又はストレージを備える。
【0007】
本開示の一実施形態により、具現化されるコンピュータ可読プログラムコードを有するコンピュータ可読記憶媒体であって、前記コンピュータ可読プログラムコードは、動作を行うために、1つ又は複数のコンピュータプロセッサによって実行可能である、コンピュータ可読記憶媒体が提供される。
動作は、ソーススコアに基づき、第1のトレーニングデータを第1の言語学習モデルのトレーニングデータとして識別する手順;クエリ、及び言語学習モデルのセットの対応する応答のレーティングに基づき、トレーニングデータのランク付けを生成する手順、ここで前記トレーニングデータのランク付けは、第1のトレーニングデータのランク付けを含む;前記トレーニングデータのランク付け及びクエリに基づき、前記言語学習モデルのセットのうちの第2の言語学習モデルを選択する手順;及び前記第2の言語学習モデルに基づき、前記クエリに対する応答を生成する手順を含む。
【図面の簡単な説明】
【0008】
一実施形態による、コンピューティング環境を示す。
【0009】
一実施形態による、トレーニングデータ識別及びモデル選択の環境を示す。
【0010】
一実施形態による、言語学習モデルをトレーニングするために所与のトレーニングデータが使用されたことを判断する方法のフローチャートを示す。
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
ピンポイントフォトニクス株式会社
画像観察機能付き分光装置
1か月前
東邦瓦斯株式会社
ウェアラブル機器用防熱カバー
18日前
沖電気工業株式会社
情報処理装置、情報処理方法、プログラムおよび情報処理システム
11日前
トヨタ自動車株式会社
電池スタックの製造方法
1か月前
ダイハツ工業株式会社
切削液の油分分離装置
1か月前
パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ
送信デバイス、受信デバイス、送信方法、受信方法及び集積回路
26日前
TOYO TIRE株式会社
空気入りタイヤ
1か月前
舩木商事有限会社
落下防止用柵
1か月前
株式会社コナミアミューズメント
遊技体
12日前
キヤノンメディカルシステムズ株式会社
樹脂組成物
1か月前
トヨタ自動車株式会社
脳波検出システム、脳波検出方法及びノイズ低減処理プログラム
1か月前
株式会社タイトー
ゲーム機
10日前
ファーストアカウンティング株式会社
情報処理装置、情報処理方法及びプログラム
1か月前
キヤノン株式会社
光電変換装置
1か月前
株式会社アルバック
成膜装置、および搬送方法
21日前
国立大学法人九州大学
センサー装置
1か月前
京セラ株式会社
固体電解質層、電気化学セル、電気化学セル装置、モジュールおよびモジュール収容装置
1か月前
国立大学法人京都大学
ブラックボックスシステムのテストのためのコンピュータ実装方法及びコンピュータシステム
24日前
住友電気工業株式会社
管理サーバ、PONシステム、及び切替方法
24日前
株式会社LIXIL
カウンター、それを備えるキッチンキャビネットおよび家具
1か月前
株式会社クボタ
レールシステム
1か月前
ナカ工業株式会社
開扉器具、レバーハンドル操作器具及び開扉装置
5日前
ヤンセン ファーマシューティカルズ,インコーポレーテッド
薬物投与システムの相互接続
20日前
株式会社三洋物産
遊技機
3日前
株式会社カネカ
パン酵母の菌株識別用プライマーセット又はプライマーセットの組み合わせ、及びパン酵母の菌株識別方法
1か月前
株式会社半導体エネルギー研究所
電子機器
18日前
株式会社デンソー
電子制御システム、ソフトウェアパッケージのデータ構造及びコンピュータプログラム
1か月前
パナソニックIPマネジメント株式会社
物体検出装置及び物体検出方法
1か月前
大阪瓦斯株式会社
電力供給システム
1か月前
ポリプラ・エボニック株式会社
歯科ブロック材及び歯科ブロック
1か月前
ダビデ、コーエン
装薬および装薬を備えた砲弾
1か月前
三浦工業株式会社
流体供給装置
7日前
横河電機株式会社
設定装置、設定方法及び設定プログラム
24日前
株式会社 サステック
食品加熱用トレイ
1か月前
株式会社三共
遊技機
1か月前
日本無線株式会社
受信信号の異常の検出方法および検出装置、並びに、受信信号の異常の検出方法および検出装置を用いた船舶システム
26日前
続きを見る
他の特許を見る