TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024062241
公報種別公開特許公報(A)
公開日2024-05-09
出願番号2022170107
出願日2022-10-24
発明の名称出力プログラム、出力方法、および情報処理装置
出願人富士通株式会社
代理人弁理士法人扶桑国際特許事務所
主分類G06F 8/74 20180101AFI20240430BHJP(計算;計数)
要約【課題】動的スライシングに利用するデータ量を削減する。
【解決手段】情報処理装置は、機械学習プログラムから、機械学習プログラムへの入力データに対するデータ操作に関する操作記述を抽出する。次に情報処理装置は、抽出した操作記述に基づいて、データ操作において操作対象となる対象データの抽出条件を決定する。さらに情報処理装置は、入力データから、決定した抽出条件を満たす対象データを抽出する。そして情報処理装置は、抽出した対象データを含むサンプリングデータを出力する。
【選択図】図13
特許請求の範囲【請求項1】
機械学習プログラムから、前記機械学習プログラムへの入力データに対するデータ操作に関する操作記述を抽出し、
抽出した前記操作記述に基づいて、前記データ操作において操作対象となる対象データの抽出条件を決定し、
前記入力データから、決定した前記抽出条件を満たす前記対象データを抽出し、
抽出した前記対象データを含むサンプリングデータを出力する、
処理をコンピュータに実行させる出力プログラム。
続きを表示(約 1,200 文字)【請求項2】
前記抽出条件を特定する処理では、テーブル形式の前記入力データ内の前記対象データが格納された列のカラム名を、抽出した前記操作記述から特定し、特定した前記カラム名のカラムに格納されているという条件を前記抽出条件に含める、
請求項1記載の出力プログラム。
【請求項3】
前記抽出条件を特定する処理では、抽出した前記操作記述において指定されているインデックスに対応する行の特定した前記カラム名のカラムに格納されているという条件を、前記抽出条件に含める、
請求項2記載の出力プログラム。
【請求項4】
前記対象データを抽出する処理では、前記入力データから、前記抽出条件を満たさない非対象データを削除する、
請求項1記載の出力プログラム。
【請求項5】
前記対象データを抽出する処理では、前記入力データから、決定した前記抽出条件を満たす前記対象データと、前記機械学習プログラムを用いた機械学習における予測対象のラベルデータとを抽出し、
サンプリングデータを出力する処理では、抽出した前記対象データと前記ラベルデータとを含むサンプリングデータを出力する、
請求項1記載の出力プログラム。
【請求項6】
前記操作記述を特定する処理では、複数の前記機械学習プログラムそれぞれから、複数の前記機械学習プログラムに共通の前記入力データに対する前記操作記述を抽出し、
前記抽出条件を決定する処理では、複数の前記機械学習プログラムそれぞれについての前記抽出条件を決定し、
前記対象データを抽出する処理では、複数の前記機械学習プログラムに対応する複数の前記抽出条件のいずれかを満たす前記対象データを、前記入力データから抽出する、
請求項1から5までのいずれかに記載の出力プログラム。
【請求項7】
機械学習プログラムから、前記機械学習プログラムへの入力データに対するデータ操作に関する操作記述を抽出し、
抽出した前記操作記述に基づいて、前記データ操作において操作対象となる対象データの抽出条件を決定し、
前記入力データから、決定した前記抽出条件を満たす前記対象データを抽出し、
抽出した前記対象データを含むサンプリングデータを出力する、
処理をコンピュータが実行する出力方法。
【請求項8】
機械学習プログラムから、前記機械学習プログラムへの入力データに対するデータ操作に関する操作記述を抽出し、抽出した前記操作記述に基づいて、前記データ操作において操作対象となる対象データの抽出条件を決定し、前記入力データから、決定した前記抽出条件を満たす前記対象データを抽出し、抽出した前記対象データを含むサンプリングデータを出力する処理部、
を有する情報処理装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、出力プログラム、出力方法、および情報処理装置に関する。
続きを表示(約 1,300 文字)【背景技術】
【0002】
データ・タスクを入力として適切な機械学習プログラムを自動的に生成する、AutoML(Automated Machine Learning)の開発が現在盛んに行われている。AutoMLを実現するためには、大量の既存の機械学習プログラム内の有用な部品(コードスニペット)を蓄積することが重要となる。そこで、既存の複数の機械学習プログラムの中からコードスニペットを抽出する処理が行われる。
【0003】
機械学習プログラムからコードスニペットを抽出する際には、コードを動的に実行させて命令間の依存関係を抽出する動的スライシングが行われる。動的スライシングでは、例えば複数の命令を含む機械学習プログラムから、所定の変数に関係する命令群が抽出される。抽出された命令群が、コードスニペットとして出力される。
【0004】
機械学習プログラムなどのプログラムの解析に有用な技術としては、例えばプログラム間の呼び出し関係を正確に抽出する抽出方法が提案されている。
【先行技術文献】
【特許文献】
【0005】
特開2021-165902号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
動的スライシングでは実際に機械学習プログラムを実行させるため、機械学習に利用するデータ量が多いほど処理に時間がかかってしまう。例えば機械学習プログラムを用いたモデル生成に利用する訓練データが大量にある場合、その訓練データを用いて機械学習プログラムの動的スライシングを行うと、処理に長い時間を要する。
【0007】
そこで動的スライシングを実行する前に、入力する訓練データのデータ量を削減することが考えられる。すなわち、機械学習に利用する訓練データのデータ量を削減することで機械学習の処理に要する時間を削減し、結果として、動的スライシングの実行時間も短縮できると考えられる。
【0008】
しかし、確実に既存の機械学習プログラムを実行させる必要がある動的スライシングにおいては、例えば、訓練データをランダムに削除するような手法では、訓練データの削減によって動的スライシングの実行が妨げられるおそれがある。
【0009】
1つの側面では、本件は、動的スライシングに利用するデータ量を削減することを目的とする。
【課題を解決するための手段】
【0010】
1つの案では、以下の処理をコンピュータに実行させる出力プログラムが提供される。
コンピュータは、機械学習プログラムから、機械学習プログラムへの入力データに対するデータ操作に関する操作記述を抽出する。コンピュータは、抽出した操作記述に基づいて、データ操作において操作対象となる対象データの抽出条件を決定する。コンピュータは、入力データから、決定した抽出条件を満たす対象データを抽出する。そしてコンピュータは、抽出した対象データを含むサンプリングデータを出力する。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

富士通株式会社
算出方法及び算出プログラム
3日前
富士通株式会社
光通信装置および伝送制御方法
18日前
富士通株式会社
画像探索方法及び画像探索プログラム
9日前
富士通株式会社
画像識別方法および画像識別プログラム
3日前
富士通株式会社
情報処理装置,プログラムおよび制御方法
23日前
富士通株式会社
類似度判定方法および類似度判定プログラム
18日前
富士通株式会社
設定プログラム、設定方法および情報処理装置
1日前
富士通株式会社
特定プログラム、特定方法および情報処理装置
1日前
富士通株式会社
パターン抽出方法及びパターン抽出プログラム
1日前
富士通株式会社
プログラム、情報処理方法および情報処理装置
2日前
富士通株式会社
特定プログラム、特定方法および情報処理装置
23日前
富士通株式会社
判定プログラム、判定方法および情報処理装置
3日前
富士通株式会社
評価プログラム、評価方法および情報処理装置
4日前
富士通株式会社
検出プログラム、検出方法および情報処理装置
4日前
富士通株式会社
移動時間予測方法および移動時間予測プログラム
1日前
富士通株式会社
半導体装置、半導体装置の製造方法及び電子装置
19日前
富士通株式会社
署名支援プログラム、署名支援方法、署名支援装置
19日前
富士通株式会社
カメラキャリブレーション方法の評価方法及び装置
8日前
富士通株式会社
並列処理プログラム,並列処理装置及び並列処理方法
8日前
富士通株式会社
情報処理プログラム、情報処理方法、およびシステム
8日前
富士通株式会社
取引処理プログラム、取引処理方法および情報処理装置
17日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
23日前
富士通株式会社
情報処理プログラム、情報処理方法および情報処理装置
10日前
富士通株式会社
機械学習プログラム、機械学習方法、及び、情報処理装置
17日前
富士通株式会社
広告管理プログラム、広告管理方法、および情報処理装置
18日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
23日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
19日前
富士通株式会社
情報処理プログラム、情報処理方法、および情報処理装置
19日前
富士通株式会社
温度調整プログラム、データ処理装置及びデータ処理方法
19日前
富士通株式会社
モデル生成方法、画像分類方法及び補助分類モデル訓練装置
16日前
富士通株式会社
データ生成プログラム、データ生成方法および情報処理装置
23日前
富士通株式会社
パイプライン数縮退コンパイラおよびパイプライン数縮退方法
1日前
富士通株式会社
アラート生成プログラム、アラート生成方法および情報処理装置
23日前
富士通株式会社
アラート生成プログラム、アラート生成方法および情報処理装置
23日前
富士通株式会社
アラート生成プログラム、アラート生成方法および情報処理装置
23日前
富士通株式会社
ニューロモルフィックコンピューティング回路、及び、制御方法
17日前
続きを見る