NAS 並列ベンチマーク

NAS 並列ベンチマーク
原作者NASA数値空気力学シミュレーションプログラム
開発者NASA先進スーパーコンピューティング部門
初回リリース1991 (1991年
安定版リリース
3.4
Webサイトnas .nasa .gov /ソフトウェア/NPB /

NAS並列ベンチマークNPB )は、高度並列スーパーコンピュータの性能評価を目的としたベンチマーク群です。NASAエイムズ研究センターに拠点を置くNASA先進スーパーコンピューティング(NAS)部門(旧NASA数値空気力学シミュレーションプログラム)によって開発・保守されています。NASはNPBのためにあらゆる情報源から性能結果を募集しています。[ 1 ]

歴史

モチベーション

NPB以前に存在した従来のベンチマーク、例えばリバモアループLINPACKベンチマークNASカーネルベンチマークプログラムなどは、通常ベクトルコンピュータに特化しており、並列性を妨げるチューニング制約や問題サイズの不足といった問題を抱えていたため、高度並列システムには不向きでした。また、移植コストの高さや自動ソフトウェア並列化ツールの不足といった問題もあり、本格的なアプリケーションベンチマークにも同様に不向きでした。[ 2 ]結果として、高度並列マシンに適用可能なベンチマークの不足に対処するため 、1991年にNPBが開発され[ 3 ]、1992年にリリースされました[ 4 ] 。

NPB1

NPBの最初の仕様では、ベンチマークには以下の特徴が必要であると認識されていました。

  • 新しい並列処理を考慮したアルゴリズムとソフトウェア手法
  • 汎用性とアーキテクチャの中立性、
  • 結果とパフォーマンス数値の正確性の容易な検証可能性
  • 出力が向上した新しいシステムに対応する能力、
  • すぐに配布可能。

これらのガイドラインに照らして、一連の問題をアルゴリズム的にのみ指定し、実装の詳細の大部分を、一定の必要な制限の下で実装者の裁量に委ねる「紙と鉛筆」ベンチマークのコレクションを使用するのが、唯一実行可能なアプローチであると考えられました。

NPB 1では8つのベンチマークが定義され、それぞれクラスAクラスBと呼ばれる2つの問題サイズで実行されました。Fortran 77で記述されたサンプルコードが提供されました。これらのサンプルコードはクラスSという小さな問題サイズを使用しており、ベンチマーク目的には使用されていませんでした。[ 2 ]

NPB 2

NPB 1はリリース以来、2つの大きな弱点を抱えていました。第一に、その「紙と鉛筆」仕様のため、コンピュータベンダーは実装を高度にチューニングする傾向があり、科学技術プログラマーにとってパフォーマンスの達成が困難でした。第二に、これらの実装の多くはプロプライエタリで公開されておらず、最適化手法が事実上隠蔽されていました。第二に、NPB 1の問題規模は、スーパーコンピュータの進化に追いついておらず、スーパーコンピュータの進化に追いついていません。[ 3 ]

1996年にリリースされたNPB 2 [ 5 ] [ 6 ]には、NPB 1で定義された8つのベンチマークのうち5つのソースコード実装が付属していましたが、NPB 1を補完するものであり、置き換えるものではありませんでした。このバージョンでは、最新の問題サイズであるクラスCにベンチマークが拡張されました。また、ベンチマーク結果の提出ルールも改訂されました。新しいルールには、変更されたソースファイルとビルドスクリプトだけでなく、出力ファイルの明示的な要求も含まれており、変更内容の公開と結果の再現性を確保しています。[ 3 ]

NPB 2.2には、さらに2つのベンチマークの実装が含まれていました。[ 5 ] 1997年のNPB 2.3は、 MPIでの最初の完全な実装でした。[ 4 ]並列バージョンと一致するベンチマークのシリアルバージョンが付属し、小メモリシステムの問題サイズクラスWを定義しました。 [ 7 ] 2002年のNPB 2.4では、新しいMPI実装が提供され、さらに大きな問題サイズクラスDが導入されました。[ 6 ]また、1つのベンチマークにI/O集約型のサブタイプが追加されました。 [ 4 ]

NPB 3

NPB 3はNPB 2のMPI実装を維持し、OpenMP [ 8 ]Java [ 9 ]High Performance Fortran [ 10 ]など、より多くのフレーバーで提供されました。これらの新しい並列実装は、NPB 2.3のシリアルコードから派生し、追加の最適化が行われました。[ 7 ] NPB 3.1とNPB 3.2ではさらに3つのベンチマークが追加されましたが[ 11 ] [ 12 ]、すべての実装で利用できるわけではありませんでした。NPB 3.3ではクラスEの問題サイズが導入されました。[ 7 ]シングルゾーンのNPB 3に基づいて、MPI / OpenMPハイブリッドプログラミングモデルを利用したマルチゾーンベンチマークのセットがNPB-Multi-ZoneNPB-MZ)という名前でリリースされ、「マルチレベルおよびハイブリッド並列化パラダイムとツールの有効性をテストする」ことを目的としていました。[ 1 ] [ 13 ]

ベンチマーク

NPB 3.3 時点では、次の表にまとめられているように 11 個のベンチマークが定義されています。

ベンチマーク名前の由来は[ 2 ]利用可能開始日説明[ 2 ]備考
MGマルチグリッド​​ NPB 1 [ 2 ]Vサイクルマルチグリッド法を用いて3次元離散ポアソン方程式の解を近似する
CG共役G勾配​ 線形方程式系を解くためのサブルーチンとして共役勾配法を用いた逆反復法を用いて、大規模な疎対称正定値行列の最小固有値を推定する
FT高速フーリエ変換​​ 高速フーリエ変換(FFT)を使用して3次元偏微分方程式(PDE)を解く
整数ソート​​バケットソートを使用して小さな整数をソートする[ 5 ]
EP恥ずかしいほど平行マルサリア極座標法を用いて独立ガウス分布の乱数を生成する
BTブロックT二重 対角線ブロック三角法、スカラー五角法、対称逐次過剰緩和法(SSOR)ソルバーカーネル を含む3つの異なるアルゴリズムを使用して、非線形PDEの合成システムを解きます。
  • BTベンチマークにはI/O集約型のサブタイプがある[ 4 ]
  • これら3つのベンチマークにはマルチゾーンバージョンがある[ 13 ]
SPSスカラーP対角線[ 6 ]
LU上下対称ガウスザイデル[ 6 ]
アメリカ合衆国構造化A適応型[ 11 ]NPB 3.1 [ 7 ]移動する球からの対流と拡散を伴う熱方程式を解きます。メッシュは適応型で、5ステップごとに再計算されます。
DCデータキューブ演算子[ 12 ]
DTデータトラフィック[ 7 ]​​NPB 3.2 [ 7 ]

参考文献

  1. ^ a b「NAS並列ベンチマークの変更」 NASA先進スーパーコンピューティング部門. 2009年2月23日閲覧。
  2. ^ a b c d eベイリー、D.;バーシュチュ、E.バートン、J.ブラウニング、D.カーター、R.ダガム、L.ファトーヒ、R.ファインバーグ、S.フレデリクソン、P. Weeratunga, S. (1994 年 3 月)、「The NAS Parallel Benchmarks」(PDF)NAS Technical Report RNR-94-007、NASA Ames Research Center、モフェット フィールド、カリフォルニア州
  3. ^ a b cベイリー、D.;ハリス、T.サフィール、W.ファン・デル・ワインガート、R.ウー、A。 Yarrow, M. (1995 年 12 月)、「The NAS Parallel Benchmarks 2.0」(PDF)NAS Technical Report NAS-95-020、NASA Ames Research Center、モフェット フィールド、カリフォルニア州
  4. ^ a b c dウォン、P.; van der Wijngaart, R. (2003 年 1 月)、「NAS Parallel Benchmarks I/O Version 2.4」(PDF)NAS Technical Report NAS-03-002、NASA Ames Research Center、モフェット フィールド、カリフォルニア州
  5. ^ a b c Saphir, W.; van der Wijngaart, R.; Woo, A.; Yarrow, M., NAS Parallel Benchmarks 2 の新しい実装と結果(PDF)、NASA Ames Research Center、Moffett Field、CA
  6. ^ a b c d van der Wijngaart, R. (2002 年 10 月)、「NAS Parallel Benchmarks Version 2.4」(PDF)NAS Technical Report NAS-02-007、NASA Ames Research Center、モフェット フィールド、カリフォルニア州
  7. ^ a b c d e f「NAS並列ベンチマークの変更」 NASA先進スーパーコンピューティング部門. 2009年3月17日閲覧。
  8. ^ジン、H.フルムキン、M. Yan, J. (1999 年 10 月)、「The OpenMP Implementation of NAS Parallel Benchmarks and Its Performance」(PDF)NAS Technical Report NAS-99-011、NASA Ames Research Center、モフェット フィールド、カリフォルニア州
  9. ^ Frumkin, M.; Schultz, M.; Jin, H.; Yan, J.、「Java での NAS 並列ベンチマークの実装」(PDF)NASA 技術レポート NAS-02-009、NASA エイムズ研究センター、モフェットフィールド、カリフォルニア州
  10. ^ Frumkin, M.; Jin, H.; Yan, J. (1998年9月)、「高性能FortranにおけるNAS並列ベンチマークの実装」(PDF)NASA技術報告書NAS-98-009、NASAエイムズ研究センター、モフェットフィールド、カリフォルニア州
  11. ^ a bフェン、H.ファン・デル・ワインガート、F.ビスワス、R. Mavriplis, C. (2004 年 7 月)、「非構造化適応型 (UA) NAS 並列ベンチマーク、バージョン 1.0」(PDF)NAS テクニカル レポート NAS-04-006、NASA エイムズ研究センター、カリフォルニア州モフェット フィールド
  12. ^ a b Frumkin, M.; Shabanov, L. (2004年9月)、「データキューブ演算子によるメモリパフォーマンスのベンチマーク」(PDF)NASA技術報告書NAS-04-013、NASAエイムズ研究センター、モフェットフィールド、カリフォルニア州
  13. ^ a b van der Wijngaart, R.; Jin, H. (2003 年 7 月)、「NAS Parallel Benchmarks, Multi-Zone Versions」(PDF)NAS Technical Report NAS-03-010、NASA Ames Research Center、モフェット フィールド、カリフォルニア州