TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2024062241
公報種別公開特許公報(A)
公開日2024-05-09
出願番号2022170107
出願日2022-10-24
発明の名称出力プログラム、出力方法、および情報処理装置
出願人富士通株式会社
代理人弁理士法人扶桑国際特許事務所
主分類G06F 8/74 20180101AFI20240430BHJP(計算;計数)
要約【課題】動的スライシングに利用するデータ量を削減する。
【解決手段】情報処理装置は、機械学習プログラムから、機械学習プログラムへの入力データに対するデータ操作に関する操作記述を抽出する。次に情報処理装置は、抽出した操作記述に基づいて、データ操作において操作対象となる対象データの抽出条件を決定する。さらに情報処理装置は、入力データから、決定した抽出条件を満たす対象データを抽出する。そして情報処理装置は、抽出した対象データを含むサンプリングデータを出力する。
【選択図】図13
特許請求の範囲【請求項1】
機械学習プログラムから、前記機械学習プログラムへの入力データに対するデータ操作に関する操作記述を抽出し、
抽出した前記操作記述に基づいて、前記データ操作において操作対象となる対象データの抽出条件を決定し、
前記入力データから、決定した前記抽出条件を満たす前記対象データを抽出し、
抽出した前記対象データを含むサンプリングデータを出力する、
処理をコンピュータに実行させる出力プログラム。
続きを表示(約 1,200 文字)【請求項2】
前記抽出条件を特定する処理では、テーブル形式の前記入力データ内の前記対象データが格納された列のカラム名を、抽出した前記操作記述から特定し、特定した前記カラム名のカラムに格納されているという条件を前記抽出条件に含める、
請求項1記載の出力プログラム。
【請求項3】
前記抽出条件を特定する処理では、抽出した前記操作記述において指定されているインデックスに対応する行の特定した前記カラム名のカラムに格納されているという条件を、前記抽出条件に含める、
請求項2記載の出力プログラム。
【請求項4】
前記対象データを抽出する処理では、前記入力データから、前記抽出条件を満たさない非対象データを削除する、
請求項1記載の出力プログラム。
【請求項5】
前記対象データを抽出する処理では、前記入力データから、決定した前記抽出条件を満たす前記対象データと、前記機械学習プログラムを用いた機械学習における予測対象のラベルデータとを抽出し、
サンプリングデータを出力する処理では、抽出した前記対象データと前記ラベルデータとを含むサンプリングデータを出力する、
請求項1記載の出力プログラム。
【請求項6】
前記操作記述を特定する処理では、複数の前記機械学習プログラムそれぞれから、複数の前記機械学習プログラムに共通の前記入力データに対する前記操作記述を抽出し、
前記抽出条件を決定する処理では、複数の前記機械学習プログラムそれぞれについての前記抽出条件を決定し、
前記対象データを抽出する処理では、複数の前記機械学習プログラムに対応する複数の前記抽出条件のいずれかを満たす前記対象データを、前記入力データから抽出する、
請求項1から5までのいずれかに記載の出力プログラム。
【請求項7】
機械学習プログラムから、前記機械学習プログラムへの入力データに対するデータ操作に関する操作記述を抽出し、
抽出した前記操作記述に基づいて、前記データ操作において操作対象となる対象データの抽出条件を決定し、
前記入力データから、決定した前記抽出条件を満たす前記対象データを抽出し、
抽出した前記対象データを含むサンプリングデータを出力する、
処理をコンピュータが実行する出力方法。
【請求項8】
機械学習プログラムから、前記機械学習プログラムへの入力データに対するデータ操作に関する操作記述を抽出し、抽出した前記操作記述に基づいて、前記データ操作において操作対象となる対象データの抽出条件を決定し、前記入力データから、決定した前記抽出条件を満たす前記対象データを抽出し、抽出した前記対象データを含むサンプリングデータを出力する処理部、
を有する情報処理装置。

発明の詳細な説明【技術分野】
【0001】
本発明は、出力プログラム、出力方法、および情報処理装置に関する。
続きを表示(約 1,300 文字)【背景技術】
【0002】
データ・タスクを入力として適切な機械学習プログラムを自動的に生成する、AutoML(Automated Machine Learning)の開発が現在盛んに行われている。AutoMLを実現するためには、大量の既存の機械学習プログラム内の有用な部品(コードスニペット)を蓄積することが重要となる。そこで、既存の複数の機械学習プログラムの中からコードスニペットを抽出する処理が行われる。
【0003】
機械学習プログラムからコードスニペットを抽出する際には、コードを動的に実行させて命令間の依存関係を抽出する動的スライシングが行われる。動的スライシングでは、例えば複数の命令を含む機械学習プログラムから、所定の変数に関係する命令群が抽出される。抽出された命令群が、コードスニペットとして出力される。
【0004】
機械学習プログラムなどのプログラムの解析に有用な技術としては、例えばプログラム間の呼び出し関係を正確に抽出する抽出方法が提案されている。
【先行技術文献】
【特許文献】
【0005】
特開2021-165902号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
動的スライシングでは実際に機械学習プログラムを実行させるため、機械学習に利用するデータ量が多いほど処理に時間がかかってしまう。例えば機械学習プログラムを用いたモデル生成に利用する訓練データが大量にある場合、その訓練データを用いて機械学習プログラムの動的スライシングを行うと、処理に長い時間を要する。
【0007】
そこで動的スライシングを実行する前に、入力する訓練データのデータ量を削減することが考えられる。すなわち、機械学習に利用する訓練データのデータ量を削減することで機械学習の処理に要する時間を削減し、結果として、動的スライシングの実行時間も短縮できると考えられる。
【0008】
しかし、確実に既存の機械学習プログラムを実行させる必要がある動的スライシングにおいては、例えば、訓練データをランダムに削除するような手法では、訓練データの削減によって動的スライシングの実行が妨げられるおそれがある。
【0009】
1つの側面では、本件は、動的スライシングに利用するデータ量を削減することを目的とする。
【課題を解決するための手段】
【0010】
1つの案では、以下の処理をコンピュータに実行させる出力プログラムが提供される。
コンピュータは、機械学習プログラムから、機械学習プログラムへの入力データに対するデータ操作に関する操作記述を抽出する。コンピュータは、抽出した操作記述に基づいて、データ操作において操作対象となる対象データの抽出条件を決定する。コンピュータは、入力データから、決定した抽出条件を満たす対象データを抽出する。そしてコンピュータは、抽出した対象データを含むサンプリングデータを出力する。
【発明の効果】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
暗号化記憶媒体
27日前
個人
プロジェクター
1か月前
個人
管理装置
1か月前
個人
求人支援システム
16日前
キヤノン電子株式会社
周辺機器
1か月前
個人
求人マッチングサーバ
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
カゴメ株式会社
営農支援プログラム
1か月前
シャープ株式会社
情報出力装置
14日前
トヨタ自動車株式会社
検査装置
1か月前
株式会社ゼロボード
価格決定システム
2か月前
アスエネ株式会社
水管理の方法
1か月前
株式会社ワコム
電子ペン
2日前
株式会社ワコム
電子ペン
28日前
株式会社ワコム
電子ペン
1か月前
株式会社アジラ
姿勢推定システム
2か月前
東洋電装株式会社
操作装置
2日前
大日本印刷株式会社
作業台
1か月前
株式会社寺岡精工
システム
1か月前
株式会社NGA
画像投稿システム
1か月前
東洋電装株式会社
操作装置
2日前
CKD株式会社
遠隔支援システム
1か月前
東洋電装株式会社
操作装置
2日前
株式会社カロニマ
情報発信システム
6日前
日本信号株式会社
料金精算システム
12日前
個人
ポイント増量アプリ「太陽光銭サー」
1か月前
トヨタ紡織株式会社
検査装置
23日前
株式会社小野測器
移動量計測システム
1か月前
株式会社アジラ
異常行動検出システム
23日前
BH株式会社
商品販売システム
1か月前
株式会社小野測器
移動量計測システム
1か月前
個人
言語翻訳システム及びプログラム
1か月前
株式会社三富
取引管理システム
1か月前
株式会社mov
情報処理システム
22日前
続きを見る