TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025104256
公報種別公開特許公報(A)
公開日2025-07-09
出願番号2024195424
出願日2024-11-07
発明の名称方法、コンピュータプログラム、及び装置(人工知能システムをトレーニングするための組み合わせコード生成)
出願人インターナショナル・ビジネス・マシーンズ・コーポレーション,INTERNATIONAL BUSINESS MACHINES CORPORATION
代理人個人,個人,弁理士法人RYUKA国際特許事務所
主分類G06N 20/00 20190101AFI20250702BHJP(計算;計数)
要約【課題】人工知能システムをトレーニングするための組み合わせコード生成のためのシステム、方法、装置及び製品を提供する。
【解決手段】コンピューティング環境における方法は、組み合わせ削減を使用して、複数のコード部分の組み合わせを、1つ又は複数の制約を満たすコード部分の組み合わせの部分集合に削減する段階、コード部分の組み合わせの部分集合を使用して、1つ又は複数の合成プログラムを生成する段階及び合成プログラムを使用して、人工知能システムをトレーニングする段階を備える。
【選択図】図2
特許請求の範囲【請求項1】
人工知能システムをトレーニングするための組み合わせコード生成の方法であって:
組み合わせ削減を使用して、複数のコード部分の組み合わせを、1つ又は複数の制約を満たすコード部分の組み合わせの部分集合に削減する段階;
前記コード部分の組み合わせの部分集合を使用して、1つ又は複数の合成プログラムを生成する段階;及び
前記1つ又は複数の合成プログラムを使用して、人工知能システムをトレーニングする段階
を備える方法。
続きを表示(約 1,300 文字)【請求項2】
前記組み合わせ削減を使用して、前記複数のコード部分の組み合わせを前記コード部分の組み合わせの部分集合に削減する段階は:
前記複数のコード部分の組み合わせのnワイズ削減を実行する段階
を更に有する、請求項1に記載の方法。
【請求項3】
前記組み合わせ削減を使用して、前記複数のコード部分の組み合わせを前記コード部分の組み合わせの部分集合に削減する段階は:
首尾よくコンパイルされた1つ又は複数のコード部分の組み合わせを識別する段階
を更に有する、請求項1又は2に記載の方法。
【請求項4】
前記複数のコード部分の組み合わせを前記コード部分の組み合わせの部分集合に削減する段階は:
1つ又は複数の実行可能なプログラムをもたらす1つ又は複数のコード部分の組み合わせを識別する段階
を更に有する、請求項1又は2に記載の方法。
【請求項5】
前記複数のコード部分の組み合わせを前記コード部分の組み合わせの部分集合に削減する段階は:
実行された場合、1つ又は複数の予期された結果を生成する1つ又は複数のコード部分の組み合わせを識別する段階
を更に有する、請求項1又は2に記載の方法。
【請求項6】
前記複数のコード部分の組み合わせは、複数のコード部分を使用して生成され、前記複数のコード部分の組み合わせを前記部分集合に削減する段階は:
各コード部分が前記部分集合の少なくとも1つのコード部分の組み合わせに含まれるように、前記部分集合についてのコード部分の組み合わせを選択する段階
を更に有する、請求項1又は2に記載の方法。
【請求項7】
前記複数のコード部分の組み合わせを前記コード部分の組み合わせの部分集合に削減する段階は:
特定のコード部分の集合を有するコード部分の組み合わせを前記部分集合に含める段階
を更に有する、請求項1又は2に記載の方法。
【請求項8】
前記人工知能システムをトレーニングする段階は、前記人工知能システムによって使用される大規模言語モデルをトレーニングする段階を有する、請求項1又は2に記載の方法。
【請求項9】
前記人工知能システムをトレーニングする段階は、1つ又は複数の他のコード部分の組み合わせを前記トレーニングから除外する一方で、前記コード部分の組み合わせの部分集合の前記コード部分の組み合わせを使用して前記人工知能システムをトレーニングする段階を有する、請求項1又は2に記載の方法。
【請求項10】
コンピュータに:
組み合わせ削減を使用して、複数のコード部分の組み合わせを、1つ又は複数の制約を満たすコード部分の組み合わせの部分集合に削減する手順;
前記コード部分の組み合わせの部分集合を使用して、1つ又は複数の合成プログラムを生成する手順;及び
前記1つ又は複数の合成プログラムを使用して、人工知能システムをトレーニングする手順
を実行させるための、コンピュータプログラム。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本開示は、人工知能システムをトレーニングするための組み合わせコード生成のための方法、装置、及び製品に関する。現代のコンピュータ環境は、使用のために広範な構成を必要とする人工知能システムの使用を伴い得る。例えば、一部の人工知能システムは、様々なアルゴリズムで構成された人工知能又は機械学習モデルを含む。これらのアルゴリズムは、予測、分析、又は同等のものなどの目的に供するために、特定のデータセットでトレーニングされる必要がある。これらのトレーニングデータセットは、多くの場合、大きく、複雑で、かつ生成又は維持することが困難であり得る。生のテキストではなく、何らかの他の方式で構造化されているデータなどの異なるタイプのデータについて、データがいかにして生成又は取得され得るか、及び、どれほどのデータが人工知能又は機械学習モデルによって使用可能であるかに関する制限が存在し得る。更に、とりわけ、データが任意のユーザにとって自由に利用可能ではなく、取得するために許可又はライセンスを必要とする場合において、トレーニングデータを取得することは他の課題を呈する可能性がある。
続きを表示(約 2,000 文字)【発明の概要】
【発明が解決しようとする課題】
【0002】
トレーニングデータセットは、多くの場合、大きく、複雑で、かつ生成又は維持することが困難であり得る。
【課題を解決するための手段】
【0003】
本開示の実施形態によれば、人工知能システムをトレーニングするための組み合わせコード生成のための様々な方法、装置、及び製品が本明細書で説明される。幾つかの態様において、人工知能システムをトレーニングするための組み合わせコード生成は、組み合わせ削減を使用して、複数のコード部分の組み合わせを、1つ又は複数の制約を満たすコード部分の組み合わせの部分集合に削減する段階、前記コード部分の組み合わせの部分集合を使用して、1つ又は複数の合成プログラムを生成する段階、及び、前記合成プログラムを使用して、人工知能システムをトレーニングする段階、を備える。
【図面の簡単な説明】
【0004】
本開示の幾つかの実施形態による、人工知能システムをトレーニングするための組み合わせコード生成のための例示的なコンピューティング環境のブロック図を示す。
【0005】
本開示の幾つかの実施形態による、人工知能システムをトレーニングするための組み合わせコード生成のための例示的な方法のフローチャートを示す。
【0006】
本開示の幾つかの実施形態による、人工知能システムをトレーニングするための組み合わせコード生成のための別の例示的な方法のフローチャートを示す。
【0007】
本開示の幾つかの実施形態による、人工知能システムをトレーニングするための組み合わせコード生成のための別の例示的な方法のフローチャートを示す。
【0008】
本開示の幾つかの実施形態による、人工知能システムをトレーニングするための組み合わせコード生成のための別の例示的な方法のフローチャートを示す。
【発明を実施するための形態】
【0009】
本明細書の開示は、人工知能システムをトレーニングするための組み合わせコード生成のためのシステム及び方法を含む。合成プログラムの生成は、コンピュータコードのコード部分の組み合わせを生成することを含み得る。多くの場合、組み合わせの集合は、非常に多数の可能な組み合わせを速やかに構成し得る。従って、組み合わせの集合は、別の集合に削減されてよく、削減された集合は、特定の特性を有し得る。削減された組み合わせの集合は、次に、様々な方式で組み合わされるか又は再び組み合わされて、合成プログラム又はコードファイルを生成し得る。特に、当該プログラムは、次に、大規模言語モデル(large language model:LLM)のトレーニングのためなど、人工知能システム用のトレーニングデータとして使用され得る。LLMは、例えば、或るプログラミング言語から別のプログラミング言語におけるコードへのコードの変換として生成される他の合成コードを出力するようにトレーニングされたLLMであり得る。
【0010】
図1は、本開示の態様による、例示的なコンピューティング環境を示す。コンピューティング環境100は、合成プログラムモジュール107など、本明細書で説明される様々な方法を実行することに関与するコンピュータコードのうちの少なくとも幾つかの実行のための環境の例を含む。合成プログラムモジュール107に加えて、コンピューティング環境100は、例えば、コンピュータ101、ワイドエリアネットワーク(wide area network:WAN)102、エンドユーザデバイス(end user device:EUD)103、リモートサーバ104、パブリッククラウド105、及びプライベートクラウド106を含む。本実施形態において、コンピュータ101は、プロセッサセット110(処理回路120及びキャッシュ121を含む)、通信ファブリック111、揮発性メモリ112、永続ストレージ113(上記で特定された通り、オペレーティングシステム122及び合成プログラムモジュール107を含む)、周辺デバイスセット114(ユーザインタフェース(user interface:UI)デバイスセット123、ストレージ124、及びモノのインターネット(Internet of Things:IoT)センサセット125を含む)、及びネットワークモジュール115、を含む。リモートサーバ104は、リモートデータベース130を含む。パブリッククラウド105は、ゲートウェイ140、クラウドオーケストレーションモジュール141、ホスト物理マシンセット142、仮想マシンセット143、及びコンテナセット144を含む。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
対話装置
1か月前
個人
情報処理装置
1か月前
個人
情報処理システム
5日前
個人
情報処理装置
29日前
個人
記入設定プラグイン
21日前
個人
検査システム
7日前
株式会社サタケ
籾摺・調製設備
6日前
個人
不動産売買システム
13日前
キヤノン電子株式会社
携帯装置
6日前
個人
情報入力装置
1か月前
個人
物価スライド機能付生命保険
1か月前
個人
備蓄品の管理方法
5日前
個人
マイホーム非電子入札システム
1か月前
株式会社BONNOU
管理装置
26日前
キヤノン株式会社
情報処理装置
6日前
キヤノン株式会社
情報処理装置
6日前
サクサ株式会社
中継装置
6日前
ホシデン株式会社
タッチ入力装置
13日前
東洋電装株式会社
操作装置
6日前
株式会社ワコム
電子消去具
13日前
個人
決済手数料0%のクレジットカード
1か月前
サクサ株式会社
カードの制動構造
1か月前
株式会社東芝
電子機器
14日前
アスエネ株式会社
排水量管理方法
6日前
キヤノン電子株式会社
名刺管理システム
7日前
東洋電装株式会社
操作装置
6日前
株式会社ライト
情報処理装置
26日前
株式会社JVCケンウッド
管理装置
7日前
トヨタ自動車株式会社
情報処理装置
1か月前
村田機械株式会社
割当補助システム
1か月前
個人
パターン抽出方法及び通信多重化方法
12日前
大王製紙株式会社
RFIDタグ
12日前
株式会社CBE-A
情報処理システム
12日前
Sansan株式会社
組織図生成装置
1か月前
住友重機械工業株式会社
力覚伝達装置
28日前
株式会社mov
情報処理システム
1か月前
続きを見る