TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025139396
公報種別公開特許公報(A)
公開日2025-09-26
出願番号2024038312
出願日2024-03-12
発明の名称情報処理装置、情報処理システム、集団通信のオフロード方法及びプログラム
出願人日本電気株式会社
代理人個人,個人
主分類G06F 9/50 20060101AFI20250918BHJP(計算;計数)
要約【課題】計算プロセス間の通信をホスト上にバッファリングすることなく、通信と計算のオーバーラップを可能にする情報処理装置を提供する。
【解決手段】情報処理装置において、コプロセッサ・ホストメモリ変換機能は、情報処理装置に備えられるコプロセッサでの計算プロセスのための計算プロセス仮想メモリを集団通信オフロードのためのオフロード機能仮想アドレスにマッピングする。集団通信オフロード機能は、マッピングされた前記オフロード機能仮想アドレスを使用して、ネットワークで接続される他の情報処理装置に対して、リモート・ダイレクト・メモリ・アクセス (RDMA)を行い、前記計算プロセスと前記他の情報処理装置の計算プロセスとの間の通信を実施する。
【選択図】図1
特許請求の範囲【請求項1】
情報処理装置に備えられるコプロセッサでの計算プロセスのための計算プロセス仮想メモリを集団通信オフロードのためのオフロード機能仮想アドレスにマッピングするコプロセッサ・ホストメモリ変換手段と、
マッピングされた前記オフロード機能仮想アドレスを使用して、ネットワークで接続される他の情報処理装置に対して、リモート・ダイレクト・メモリ・アクセス (RDMA)を行い、前記計算プロセスと前記他の情報処理装置の計算プロセスとの間の通信を実施する集団通信オフロード手段と、
を備える、情報処理装置。
続きを表示(約 2,300 文字)【請求項2】
前記集団通信オフロード手段は、前記コプロセッサ・ホストメモリ変換手段を利用して準備した前記計算プロセス仮想メモリと前記オフロード機能仮想アドレスとの対応表を備え、前記計算プロセスのための前記計算プロセス仮想メモリを前記オフロード機能仮想アドレスに変換し、変換した前記オフロード機能仮想アドレスと前記計算プロセスを特定する情報と前記他の情報処理装置における計算プロセスを特定する情報とをパラメータとして含めて、前記他の情報処理装置に対して送信リクエストを送信する、
請求項1に記載の情報処理装置。
【請求項3】
前記集団通信オフロード手段は、前記他の情報処理装置の集団通信オフロード手段からの送信リクエストを受信すると、前記受信した送信リクエストから、自己の情報処理装置において前記送信リクエストの対象となる計算プロセスを特定するとともに、特定した前記計算プロセスのための前記オフロード機能仮想アドレスを求め、求めた前記オフロード機能仮想アドレスをパラメータとして含めて、前記送信リクエストを送信した前記他の情報処理装置に対して前記RDMAよる読み取りリクエストを発行する、
請求項1に記載の情報処理装置。
【請求項4】
前記計算プロセスのための前記計算プロセス仮想メモリに対応する物理アドレスと前記オフロード機能仮想アドレスとを対応付けたメモリ変換テーブルを備えたネットワークインタフェース手段をさらに備え、
前記ネットワークインタフェース手段は、前記RDMAよる読み取りリクエストを受信すると、前記メモリ変換テーブルを用いて、送信リクエストをした計算プロセスのための前記オフロード機能仮想アドレスを前記物理アドレスに変換し、変換した前記物理アドレスからデータを読み取り、読み取った前記データを前記RDMAよる読み取りリクエストを発行した情報処理装置に対して送信する、
請求項3に記載の情報処理装置。
【請求項5】
前記計算プロセスのための前記計算プロセス仮想メモリに対応する物理アドストと前記オフロード機能仮想アドレスとを対応付けたメモリ変換テーブルを備えたネットワークインタフェース手段をさらに備え、
前記ネットワークインタフェース手段は、前記メモリ変換テーブルを用いて、前記送信リクエストの受信対象となる計算プロセスのためのオフロード機能仮想アドレスを物理アドレスに変換し、前記他の情報処理装置に対して前記RDMAよる読み取りリクエストへの応答として受信したデータを、ダイレクト・メモリ・アクセス(DMA)により変換された前記物理アドレスに書き込む、
請求項3に記載の情報処理装置。
【請求項6】
前記コプロセッサ・ホストメモリ変換手段は、前記コプロセッサでの計算プロセス毎に、計算プロセス仮想メモリを集団通信オフロードのためのオフロード機能仮想アドレスにマッピングし、
前記集団通信オフロード手段は、集団通信オフロードの対象となる計算プロセスのためのマッピングされた前記オフロード機能仮想アドレスを使用して、ネットワークで接続される他の情報処理装置に対して、前記RDMAを行い、自己の情報処理装置の計算プロセスと前記他の情報処理装置の計算プロセスとの間の通信を実施する、
請求項1に記載の情報処理装置。
【請求項7】
前記コプロセッサ・ホストメモリ変換手段は、前記コプロセッサでの計算プロセス毎で、かつ、送信バッファおよび受信バッファ毎に、計算プロセス仮想メモリを集団通信オフロードのためのオフロード機能仮想アドレスにマッピングし、
前記集団通信オフロード手段は、通信内容に応じて、集団通信オフロードの対象となる計算プロセスのためのマッピングされた前記送信バッファまたは受信バッファの前記オフロード機能仮想アドレスを使用して、ネットワークで接続される他の情報処理装置に対して、前記RDMAを行い、自己の情報処理装置の計算プロセスと前記他の情報処理装置の計算プロセスとの間の通信を実施する、
請求項6に記載の情報処理装置。
【請求項8】
請求項1から請求項7のいずれか1項に記載の情報処理装置が複数接続されて構成される情報処理システム。
【請求項9】
情報処理装置に備えられるコプロセッサでの計算プロセスのための計算プロセス仮想メモリを集団通信オフロードのためのオフロード機能仮想アドレスにマッピングし、
マッピングされた前記オフロード機能仮想アドレスを使用して、ネットワークで接続される他の情報処理装置に対して、リモート・ダイレクト・メモリ・アクセス (RDMA)を行い、前記計算プロセスと前記他の情報処理装置の計算プロセスとの間の通信を実施する、
情報処理装置による集団通信のオフロード方法。
【請求項10】
情報処理装置に備えられるコプロセッサでの計算プロセスのための計算プロセス仮想メモリを集団通信オフロードのためのオフロード機能仮想アドレスにマッピングし、
マッピングされた前記オフロード機能仮想アドレスを使用して、ネットワークで接続される他の情報処理装置に対して、リモート・ダイレクト・メモリ・アクセス (RDMA)を行い、前記計算プロセスと前記他の情報処理装置の計算プロセスとの間の通信を実施する、
ことをコンピュータに実行させるプログラム。

発明の詳細な説明【技術分野】
【0001】
本開示は、情報処理装置、情報処理システム、集団通信のオフロード方法及びプログラムに関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
HPC(High Performance Computing)分野において、複数のホストやコプロセッサで構成される計算システムが広く用いられている。また、このような計算システムで実行される計算プロセスは、一般的に、並列コンピューティングを利用するための標準化された規格であるMPI(Message Passing Interface)を使用して計算プロセス間の通信を行う。
【0003】
このような計算システムでは、ホスト間は高速なインターコネクトで接続されており、計算プロセスから直接RDMA(Remote Direct Memory Access)を発行することが可能なInfiniBandが使用されることが多い。なお、「RDMA」とは、ローカルのコンピュータのメモリから、異なるリモートのコンピュータのメモリへ、両コンピュータのOSを介することなく、データを直接転送する行うことをいう。また、「InfiniBand」とは、サーバ/クラスター用高速I/Oバスアーキテクチャ及びインターコネクトのことをいう。
【0004】
また、CPUの処理の補助や代行をする回路であるコプロセッサにおいて、コプロセッサ上のメモリをInfiniBandで直接RDMA可能とする技術としてGPUDirect RDMAが知られている。InfiniBandを使用した通信では、通信の開始指示と通信の完了確認を別々に実施することが可能である。このため、計算プロセスは通信の開始から完了までの間に通信とは別の処理を行うことも可能であり、計算ジョブの実行時間を短縮するため計算と通信のオーバーラップも一般的に行われている。
【0005】
ところで、MPIを使用した計算プロセス間の通信では、特定の計算プロセス間で行われる1対1通信の他に、複数の計算プロセス間で通信を行う集団通信が使用される。集団通信は処理を完了するまでに複数の通信を行う必要があり、その処理を計算プロセスで行う必要があるため通信と計算のオーバーラップが困難である。
【0006】
MPIの集団通信と計算処理をオーバーラップ可能とする技術として、NVIDIA社のBlueField DPUを使用した集団通信のオフロード機能が存在する。BlueField DPUはネットワークインタフェース上にオフロード処理に使用できるCPUを実装しており、このCPU上で動作するオフロードプロセスが計算プロセスの通信データの読み出しであるRDMA READをし、他の計算プロセスにデータの書き込みであるRDMA WRITEをすることにより計算プロセス自身の通信処理を不要とし、オフロードを実現している。しかし、この技術では通信データをBlueField DPU上のメモリに一旦データをコピーする必要があり、本来は1回で完了する通信を2回実施する必要があるため、効率の良い処理を行っているとは言えない。
【0007】
例えば、RDMA通信に関する技術として、特許文献1は、RDMA通信要求及び転送データの送信に用いられた経路を用いずに、他の経路を用いてRDMAの受信応答を送信することで処理能力を向上させる技術を開示している。
【先行技術文献】
【特許文献】
【0008】
特開2017‐187973号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
特許文献1に記載された技術は、RDMAにおける処理能力の向上には貢献するものの、コプロセッサ上で動作する計算プロセス間で集団通信を行う際に、通信と計算のオーバーラップを可能とする技術ではない。ましてや、計算プロセス間の通信をホスト上にバッファリングすることなく、通信と計算のオーバーラップを可能するものでもない。
【0010】
本開示の目的は、上述の課題を解決する情報処理装置、情報処理システム、集団通信のオフロード方法及びプログラムを提供することにある。
【課題を解決するための手段】
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

日本電気株式会社
学習装置
23日前
日本電気株式会社
超伝導量子回路
19日前
日本電気株式会社
マルチバンドバラン
17日前
日本電気株式会社
端末装置および無線通信方法
10日前
日本電気株式会社
機器冷却装置及びその冷却方法
11日前
日本電気株式会社
プログラム、算出装置、及び方法
11日前
日本電気株式会社
処理装置、方法、及びプログラム
23日前
日本電気株式会社
推定装置、推定方法及びプログラム
2日前
日本電気株式会社
推定装置、推定方法及びプログラム
2日前
日本電気株式会社
ピーク抑圧装置及びピーク抑圧方法
9日前
日本電気株式会社
通信システム及びパケット順序補正方法
10日前
日本電気株式会社
予測システム、予測方法及びプログラム
2日前
日本電気株式会社
判定装置、判定方法、及び、プログラム
19日前
日本電気株式会社
管理システム、管理方法及びプログラム
9日前
日本電気株式会社
画像検索装置、画像検索方法及び記憶媒体
20日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
23日前
日本電気株式会社
マルチコアファイバ増幅器及び光増幅方法
17日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
23日前
日本電気株式会社
処理システム、処理方法およびプログラム
2日前
日本電気株式会社
情報処理装置、情報処理方法及びプログラム
2日前
日本電気株式会社
情報収集装置、情報収集方法及びプログラム
18日前
日本電気株式会社
自動可変チルト装置及び光信号利得等化方法
18日前
日本電気株式会社
人数計数装置、人数計数方法及びプログラム
9日前
日本電気株式会社
画像処理装置、画像処理方法、及びプログラム
10日前
日本電気株式会社
DMA転送方法、DMA転送装置、プログラム
9日前
日本電気株式会社
マッチング装置、マッチング方法、プログラム
18日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
9日前
日本電気株式会社
情報処理装置、情報処理方法およびプログラム
9日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
9日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
18日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
9日前
日本電気株式会社
販売促進装置、販売促進方法、及びプログラム
9日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
23日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
9日前
日本電気株式会社
ベクトル化装置、ベクトル化方法及びプログラム
2日前
日本電気株式会社
端末、システム、端末の制御方法及びプログラム
2日前
続きを見る