特許ウォッチ

公開番号2024127077
公報種別公開特許公報(A)
公開日2024-09-20
出願番号2023035942
出願日2023-03-08
発明の名称演算処理装置及び演算処理方法
出願人富士通株式会社
代理人弁理士法人酒井国際特許事務所
主分類G06F 17/16 20060101AFI20240912BHJP(計算;計数)
要約【課題】標準固有値問題の計算効率を向上させる演算処理装置及び演算処理方法を提供する。
【解決手段】計算実行部は、所定の対称行列に対する標準固有値問題の計算を分割して生成されたそれぞれが異なる計算を行う複数の計算単位について、各計算単位の計算がそれぞれで実行される複数のタスクのうちの第1タスクと第2タスクとの間にいずれか一方の結果に基づいて他方が計算を行うという依存関係が存在しない場合、第1タスクと第2タスクとを非同期で計算し、第1タスクと第2タスクとに依存関係が存在する場合、第1タスクと第2タスクとを逐次計算する。出力部は、計算実行部により計算された所定の対称行列に対する標準固有値問題の計算結果を出力する。
【選択図】図5
特許請求の範囲【請求項１】
所定の対称行列に対する標準固有値問題の計算を分割して生成されたそれぞれが異なる計算を行う複数の計算単位について、各前記計算単位がそれぞれで実行される複数のタスクのうちの第１タスクと第２タスクとの間にいずれか一方の結果に基づいて他方が計算を行うという依存関係が存在しない場合、前記第１タスクと前記第２タスクとを非同期で計算し、前記第１タスクと前記第２タスクとに前記依存関係が存在する場合、前記第１タスクと前記第２タスクとを逐次計算する計算実行部と、
前記計算実行部により計算された前記所定の対称行列に対する標準固有値問題の計算結果を出力する出力部と
を備えたことを特徴とする演算処理装置。
続きを表示（約 1,000 文字）【請求項２】
前記計算実行部は、前記第１タスク及び前記第２タスクのそれぞれについて、実行する前記計算単位の計算量が所定値以上の場合、前記計算単位の計算を複数スレッドで実行することを特徴とする請求項１に記載の演算処理装置。
【請求項３】
前記複数のタスク間の計算の結果の入出力関係を示す依存関係グラフを生成する依存関係グラフ生成部をさらに備え、
前記計算実行部は、前記依存関係グラフ生成部により生成された前記依存関係グラフを基に、前記第１タスクと前記第２タスクとの間の依存関係の存否を判定する依存関係判定部とを備える
ことを特徴とする請求項１に記載の演算処理装置。
【請求項４】
前記計算実行部は、前記所定の対称行列に対する標準固有値問題の計算に含まれる対称行列の三重対角化の計算を複数に分割した計算単位を含む前記複数の計算単位について、前記第１タスクと前記第２タスクとの間の依存関係の存否に基づいて計算を実行することを特徴とする請求項１に記載の演算処理装置。
【請求項５】
前記計算実行部は、前記所定の対称行列に対する標準固有値問題の計算に含まれる対称行列の三重対角化から得られる三重対角行列に対する固有値及び固有ベクトルの計算を複数に分割した計算単位を含む前記複数の計算単位について、前記第１タスクと前記第２タスクとの間の依存関係の存否に基づいて計算を実行することを特徴とする請求項１に記載の演算処理装置。
【請求項６】
前記計算実行部は、前記三重対角行列の固有ベクトルの逆変換で使用する三角行列の計算を行う計算単位を含む前記複数の計算単位について、前記第１タスクと前記第２タスクとの間の依存関係の存否に基づいて計算を実行することを特徴とする請求項５に記載の演算処理装置。
【請求項７】
所定の対称行列に対する標準固有値問題の計算を分割して生成されたそれぞれが異なる計算を行う複数の計算単位について、
各前記計算単位がそれぞれで実行される複数のタスクのうちの第１タスクと第２タスクとの間にいずれか一方の結果に基づいて他方が計算を行うという依存関係が存在しない場合、前記第１タスクと前記第２タスクとを非同期で計算し、
前記第１タスクと前記第２タスクとに前記依存関係が存在する場合、前記第１タスクと前記第２タスクとを逐次計算する
処理をプロセッサに実行させることを特徴とする演算処理方法。

発明の詳細な説明【技術分野】
【０００１】
本発明は、演算処理装置及び演算処理方法に関する。
続きを表示（約 2,400 文字）【背景技術】
【０００２】
行列の標準固有値問題は、特定の正方行列に対して、Ａν＝λνと表される固有値（λ）と固有ベクトル（ν）とをすべて求める問題である。特定の正方行列がｎ×ｎの大きさの場合、固有値（λ)と固有ベクトル（ν）のペアが一般にｎ個存在し、標準固有値問題を解くことでそれらを求めることができる。標準固有値問題は、科学技術分野において幅広く用いられている。特に対称行列の標準固有値問題は、新薬設計やビッグデータ解析などで用いられ、現代社会において重要なテーマである。
【０００３】
対称行列の標準固有値問題を計算機で求める場合、一般には次のように行列を変換しながら計算が進められる。第１に、計算機は、対称行列の三重対角化を行う。次に、計算機は、三重対角行列に対する固有値及び固有ベクトルの計算を行う。最後に、計算機は、三重対角行列の固有ベクトルの逆変換を行い、元の対称行列の固有値及び固有ベクトルを算出する。
【０００４】
ここで、三重対角行列は、対角成分と対角成分の上下隣り合う要素のみ非ゼロである行列である。また、三重対角化では、行列の相似変換により対称行列が三重対角行列へ変換される。この変換に用いられる行列として、ハウスホルダー変換を用いたハウスホルダー行列が知られている。
【０００５】
三重対角化では、一般には以下の３つの手法のいずれかが用いられる。第１の手法は、ＱＲ法と呼ばれる手法であり、直交行列による相似変換を用いて標準固有値問題を解くことが行われる。ＱＲ法は、固有値・固有ベクトルを安定して求めやすいという特徴を有する。第２の手法は、ＭＲＲＲ（Multiple Relatively Robust Representations）法と呼ばれる手法である。ＭＲＲＲ法は、精度良く標準固有値問題を解き易いという特徴を有する。第３の手法は、分割統治法と呼ばれる手法である。分割統治法は、行列を小さな行列に分割し、固有値及び固有ベクトルを計算する方法である。分割統治法は、高い並列度で計算し易いという特徴を有する。近年の計算機は、大規模化に伴い並列度が非常に高い。そこで、高い並列度により標準固有値問題を解くために、分割統治法が用いられることが多い。
【０００６】
標準固有値問題を始めとする様々な数学的問題では、行列演算などが多用される。そのため、線形代数の基本的な演算をまとめたBasic Linear Algebra Subprograms（ＢＬＡＳ）や標準固有値問題計算関数及び特異値問題計算関数をまとめたLinear Algebra Package（ＬＡＰＡＣＫ）等がオープンソースとして公開されている。一般的には、ＢＬＡＳやＬＡＰＡＣＫを組み合わせて対称行列の標準固有値問題を計算することができる。ＢＬＡＳやＬＡＰＡＣＫは頻繁に用いられるため、各ベンダーからチューニングされた様々なライブラリが提供されている。
【０００７】
ここで、近年のプロセッサの傾向として、より多くのコアを搭載することで計算性能の向上が図られている。例えば、富士通が開発したスーパーコンピュータ京とスーパーコンピュータ富岳向けのプロセッサのコア数は８から４８に増加している。その他、Ｎｖｉｄｉａ社が開発しているフラグシップ向けＧＰＵのコア数は、順に、５１２０（Ｖ１００）、６９１２（Ａ１００）、１６８９６（Ｈ１００）と増加している。このようなプロセッサを用いる場合、計算性能を高めるためには、すべてのコアを使い切るような高い並列度を持ったアルゴリズムを用いることが好ましい。
【０００８】
倍精度の対称行列の標準固有値問題をＬＡＰＡＣＫにより分割統治法で解く場合、倍精度の対称行列の標準固有値問題の専用関数（ＤＳＹＥＶＤと呼ばれる関数：Double to Symmetric Eigenvalue using Divide and conquer algorithm）が用いられる。ＤＳＹＥＶＤでは、主にＤＳＹＴＲＤ、ＤＳＴＥＤＣ及びＤＯＲＭＴＲと呼ばれる関数で処理が構成される。ＤＳＹＴＲＤ（Double to Symmetric tridiagonal form reduce）は、対称行列の三重対角化を行う関数である。ＤＳＴＥＤＣ（Double to Symmetric tridiagonal Eigenvalue using Divide and conquer algorithm）は、三重対角行列の標準固有値問題を分割統治法で解く関数である。ＤＯＲＭＴＲ（Double Overwrite Real M-by-N matrix with Trans）は、三重対角行列の固有ベクトルを行列積により逆変換を行う関数である。
【０００９】
ここで、各関数の特徴を挙げる。ＤＳＹＴＲＤは、キャッシュヒットし難い傾向があり、計算が進むにつれて並列度が減少する。また、ＤＳＴＥＤＣは、高い並列度と高い計算効率で計算することが可能である。また、ＤＯＲＭＴＲは、高い計算効率で計算することが可能である。そのため、一般に対称行列の標準固有値問題では、ＤＳＹＴＲＤが全体の計算時間のうち多くの時間を占める。このようなそれぞれの関数の特徴から、ＤＳＹＴＲＤにおけるパフォーマンスの問題を改善することで全体のパフォーマンスを向上することができると考えられる。
【００１０】
なお、並列処理の技術として、与えられた計算モデルを分割して、非相互依存の複数のサブ計算を構築し、複数のプロセッサがサブ計算をそれぞれ並列で処理する技術が提案されている。
【先行技術文献】
【特許文献】
（【００１１】以降は省略されています）

関連特許