TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2024120233
公報種別
公開特許公報(A)
公開日
2024-09-05
出願番号
2023026890
出願日
2023-02-24
発明の名称
バッチデータ生成プログラム、バッチデータ生成装置、及びバッチデータ生成方法
出願人
富士通株式会社
代理人
個人
,
個人
,
個人
主分類
G06F
9/50 20060101AFI20240829BHJP(計算;計数)
要約
【課題】時系列に受け付けられる複数のデータから、情報処理の効率を向上させるバッチデータを生成する。
【解決手段】コンピュータは、時系列に受け付けられる複数のデータ各々のデータ長に基づいて、複数のデータ各々を複数のグループのうち何れかのグループに割り当てる。コンピュータは、複数のグループ各々について、割り当てられた複数のデータのデータ長を揃えることで、グループ毎に異なるデータ長を有するバッチデータを生成する。
【選択図】図6
特許請求の範囲
【請求項1】
時系列に受け付けられる複数のデータ各々のデータ長に基づいて、前記複数のデータ各々を複数のグループのうち何れかのグループに割り当て、
前記複数のグループ各々について、割り当てられた複数のデータのデータ長を揃えることで、グループ毎に異なるデータ長を有するバッチデータを生成する、
処理をコンピュータに実行させるためのバッチデータ生成プログラム。
続きを表示(約 2,100 文字)
【請求項2】
前記複数のグループは、第1グループ及び第2グループを含み、
前記複数のデータ各々を複数のグループのうち何れかのグループに割り当てる処理は、
前記時系列に受け付けられる複数のデータのうち、閾値よりも短いデータ長を有するデータを前記第1グループに割り当てる処理と、
前記時系列に受け付けられる複数のデータのうち、前記閾値よりも長いデータ長を有するデータを前記第2グループに割り当てる処理と、
を含み、
前記バッチデータを生成する処理は、前記第1グループ及び前記第2グループのうち、前記割り当てられた複数のデータの個数が所定値に達したグループに属するデータに対して、パディング処理を行うことで、前記バッチデータを生成する処理を含み、
前記バッチデータ生成プログラムは、前記バッチデータに対する情報処理を前記コンピュータにさらに実行させることを特徴とする請求項1記載のバッチデータ生成プログラム。
【請求項3】
前記時系列に受け付けられる複数のデータのうち、所定期間内に受け付けられる複数のデータそれぞれのデータ長に関する統計情報に基づいて、前記閾値を決定する処理を、前記コンピュータにさらに実行させることを特徴とする請求項2記載のバッチデータ生成プログラム。
【請求項4】
前記パディング処理を行うことで前記バッチデータを生成する処理は、前記第1グループ及び前記第2グループのうち、前記割り当てられた複数のデータの個数が前記所定値に達していない一方のグループについて、前記一方のグループに割り当てられたデータが受け付けられてから経過した経過時間と、前記一方のグループに割り当てられたデータに対する許容遅延時間と、前記情報処理の推定処理時間と、の関係に基づいて、前記バッチデータを生成する処理を含むことを特徴とする請求項2記載のバッチデータ生成プログラム。
【請求項5】
前記経過時間と前記許容遅延時間と前記推定処理時間との関係に基づいて、前記バッチデータを生成する処理は、
前記経過時間が前記許容遅延時間と前記推定処理時間との差以上である場合、前記第1グループ及び前記第2グループのうち他方のグループに割り当てられたデータを、前記一方のグループに移動させることで、不足分のデータを補完する処理と、
補完された前記一方のグループに属するデータに対して、前記パディング処理を行うことで、前記バッチデータを生成する処理と、
を含むことを特徴とする請求項4記載のバッチデータ生成プログラム。
【請求項6】
前記第1グループに割り当てられた複数のデータの個数が前記所定値に達したことを契機として前記バッチデータが生成された回数と、前記第1グループに割り当てられたデータの前記経過時間が前記差以上になったことを契機として前記バッチデータが生成された回数と、前記第2グループに割り当てられた複数のデータの個数が前記所定値に達したことを契機として前記バッチデータが生成された回数と、前記第2グループに割り当てられたデータの前記経過時間が前記差以上になったことを契機として前記バッチデータが生成された回数と、に基づいて、前記閾値を決定する処理を、前記コンピュータにさらに実行させることを特徴とする請求項5記載のバッチデータ生成プログラム。
【請求項7】
前記第1グループ又は前記第2グループに割り当てられた複数のデータから前記バッチデータが生成された回数のうち、前記第1グループ又は前記第2グループに割り当てられたデータの前記経過時間が前記差以上になったことを契機として前記バッチデータが生成された回数の比率に基づいて、前記所定値を変更する処理を、前記コンピュータにさらに実行させることを特徴とする請求項5記載のバッチデータ生成プログラム。
【請求項8】
前記第1グループ又は前記第2グループについて生成された前記バッチデータにおいて、前記パディング処理により付加されたデータの比率に基づいて、前記所定値を変更する処理を、前記コンピュータにさらに実行させることを特徴とする請求項5記載のバッチデータ生成プログラム。
【請求項9】
時系列に受け付けられる複数のデータ各々のデータ長に基づいて、前記複数のデータ各々を複数のグループのうち何れかのグループに割り当てる割当部と、
前記複数のグループ各々について、割り当てられた複数のデータのデータ長を揃えることで、グループ毎に異なるデータ長を有するバッチデータを生成する生成部と、
を備えることを特徴とするバッチデータ生成装置。
【請求項10】
時系列に受け付けられる複数のデータ各々のデータ長に基づいて、前記複数のデータ各々を複数のグループのうち何れかのグループに割り当て、
前記複数のグループ各々について、割り当てられた複数のデータのデータ長を揃えることで、グループ毎に異なるデータ長を有するバッチデータを生成する、
処理をコンピュータが実行することを特徴とするバッチデータ生成方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、バッチデータ生成技術に関する。
続きを表示(約 1,000 文字)
【背景技術】
【0002】
カスタマーサポートにおけるQ&Aシステムのように、従来ではオペレータが処理していた業務においても、自然言語処理に対する深層学習の適用によって、処理を自動化することが可能になってきている。自然言語処理では、情報処理装置(コンピュータ)を用いてテキストデータに対する情報処理が行われる。
【0003】
テキストデータに対する情報処理に関して、音声認識結果を用いながら発話単位等の長さに依らない所定の限られた遅延時間で、認識結果を修正してテキストとして逐次出力するテキスト修正装置が知られている(例えば、特許文献1を参照)。
【先行技術文献】
【特許文献】
【0004】
特開2012-128188号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
深層学習を適用したQ&Aシステムのような自然言語処理システムでは、リアルタイムに発生する複数の問い合わせ文それぞれのテキストデータが、時系列に入力される。これらの複数のテキストデータをまとめてバッチデータを生成し、バッチデータを一括して処理する場合、パディング処理によって、システム全体としてのスループットが低下することがある。
【0006】
なお、かかる問題は、深層学習を適用した自然言語処理に限らず、時系列に受け付けられる複数のデータに対する様々な情報処理において生ずるものである。
【0007】
1つの側面において、本発明は、時系列に受け付けられる複数のデータから、情報処理の効率を向上させるバッチデータを生成することを目的とする。
【課題を解決するための手段】
【0008】
1つの案では、バッチデータ生成プログラムは、以下の処理をコンピュータに実行させる。
【0009】
コンピュータは、時系列に受け付けられる複数のデータ各々のデータ長に基づいて、複数のデータ各々を複数のグループのうち何れかのグループに割り当てる。コンピュータは、複数のグループ各々について、割り当てられた複数のデータのデータ長を揃えることで、グループ毎に異なるデータ長を有するバッチデータを生成する。
【発明の効果】
【0010】
1つの側面によれば、時系列に受け付けられる複数のデータから、情報処理の効率を向上させるバッチデータを生成することができる。
【図面の簡単な説明】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
富士通株式会社
ラック装置
5日前
富士通株式会社
リスクと診断
6日前
富士通株式会社
目標確定方法と装置
24日前
富士通株式会社
試験装置および試験方法
20日前
富士通株式会社
光受信機及び光受信方法
20日前
富士通株式会社
信号処理装置及び信号処理方法
4日前
富士通株式会社
動作認識装置と方法及び電子機器
24日前
富士通株式会社
光センサ及び光センサの製造方法
4日前
富士通株式会社
物品認識装置、方法及び電子機器
24日前
富士通株式会社
運転者上下車状態判断方法と装置
24日前
富士通株式会社
動作認識装置と方法及び電子機器
24日前
富士通株式会社
光送信器およびタイミング調整方法
11日前
富士通株式会社
機械学習プログラム、方法、及び装置
4日前
富士通株式会社
ネットワーク装置及びモデル学習方法
20日前
富士通株式会社
3点サポートイベント検出方法と装置
24日前
富士通株式会社
機械学習プログラム、方法、及び装置
4日前
富士通株式会社
表示制御プログラム、方法、及び装置
20日前
富士通株式会社
フォークリフト状態の検出装置及び方法
24日前
富士通株式会社
制御プログラム、制御方法及び情報処理装置
20日前
富士通株式会社
試験方法、試験プログラム及び情報処理装置
10日前
富士通株式会社
推定プログラム、推定方法および情報処理装置
10日前
富士通株式会社
プログラム、情報処理方法および情報処理装置
10日前
富士通株式会社
推定プログラム、推定方法および情報処理装置
10日前
富士通株式会社
光送信装置、遅延制御回路、及び遅延制御方法
24日前
富士通株式会社
機械学習のためのグラフセット分析及び可視化
20日前
富士通株式会社
撮影角度決定方法および撮影角度決定プログラム
24日前
富士通株式会社
撮影角度決定方法および撮影角度決定プログラム
24日前
富士通株式会社
プログラム、情報処理方法およびクラスタシステム
17日前
富士通株式会社
試験制御プログラム,試験システムおよび試験方法
4日前
富士通株式会社
プログラム、情報処理装置および情報処理システム
10日前
富士通株式会社
光ネットワーク管理装置及び光ネットワーク管理方法
10日前
富士通株式会社
デバッグプログラム、情報処理装置及びデバッグ方法
19日前
富士通株式会社
情報処理プログラム、情報処理方法及び情報処理装置
10日前
富士通株式会社
情報処理プログラム、情報処理装置および情報処理方法
20日前
富士通株式会社
光伝送ノード、波長変換器、及び波長変換器の駆動方法
24日前
富士通株式会社
画像生成プログラム、画像生成方法および情報処理装置
10日前
続きを見る
他の特許を見る