| NAS 並列ベンチマーク | |
|---|---|
| 原作者 | NASA数値空気力学シミュレーションプログラム |
| 開発者 | NASA先進スーパーコンピューティング部門 |
| 初回リリース | 1991 (1991年) |
| 安定版リリース | 3.4 |
| Webサイト | nas |
NAS並列ベンチマーク(NPB )は、高度並列スーパーコンピュータの性能評価を目的としたベンチマーク群です。NASAエイムズ研究センターに拠点を置くNASA先進スーパーコンピューティング(NAS)部門(旧NASA数値空気力学シミュレーションプログラム)によって開発・保守されています。NASはNPBのためにあらゆる情報源から性能結果を募集しています。[ 1 ]
歴史
モチベーション
NPB以前に存在した従来のベンチマーク、例えばリバモアループ、LINPACKベンチマーク、NASカーネルベンチマークプログラムなどは、通常ベクトルコンピュータに特化しており、並列性を妨げるチューニング制約や問題サイズの不足といった問題を抱えていたため、高度並列システムには不向きでした。また、移植コストの高さや自動ソフトウェア並列化ツールの不足といった問題もあり、本格的なアプリケーションベンチマークにも同様に不向きでした。[ 2 ]結果として、高度並列マシンに適用可能なベンチマークの不足に対処するため 、1991年にNPBが開発され[ 3 ]、1992年にリリースされました[ 4 ] 。
NPB1
NPBの最初の仕様では、ベンチマークには以下の特徴が必要であると認識されていました。
- 新しい並列処理を考慮したアルゴリズムとソフトウェア手法
- 汎用性とアーキテクチャの中立性、
- 結果とパフォーマンス数値の正確性の容易な検証可能性
- 出力が向上した新しいシステムに対応する能力、
- すぐに配布可能。
これらのガイドラインに照らして、一連の問題をアルゴリズム的にのみ指定し、実装の詳細の大部分を、一定の必要な制限の下で実装者の裁量に委ねる「紙と鉛筆」ベンチマークのコレクションを使用するのが、唯一実行可能なアプローチであると考えられました。
NPB 1では8つのベンチマークが定義され、それぞれクラスAとクラスBと呼ばれる2つの問題サイズで実行されました。Fortran 77で記述されたサンプルコードが提供されました。これらのサンプルコードはクラスSという小さな問題サイズを使用しており、ベンチマーク目的には使用されていませんでした。[ 2 ]
NPB 2
NPB 1はリリース以来、2つの大きな弱点を抱えていました。第一に、その「紙と鉛筆」仕様のため、コンピュータベンダーは実装を高度にチューニングする傾向があり、科学技術プログラマーにとってパフォーマンスの達成が困難でした。第二に、これらの実装の多くはプロプライエタリで公開されておらず、最適化手法が事実上隠蔽されていました。第二に、NPB 1の問題規模は、スーパーコンピュータの進化に追いついておらず、スーパーコンピュータの進化に追いついていません。[ 3 ]
1996年にリリースされたNPB 2 [ 5 ] [ 6 ]には、NPB 1で定義された8つのベンチマークのうち5つのソースコード実装が付属していましたが、NPB 1を補完するものであり、置き換えるものではありませんでした。このバージョンでは、最新の問題サイズであるクラスCにベンチマークが拡張されました。また、ベンチマーク結果の提出ルールも改訂されました。新しいルールには、変更されたソースファイルとビルドスクリプトだけでなく、出力ファイルの明示的な要求も含まれており、変更内容の公開と結果の再現性を確保しています。[ 3 ]
NPB 2.2には、さらに2つのベンチマークの実装が含まれていました。[ 5 ] 1997年のNPB 2.3は、 MPIでの最初の完全な実装でした。[ 4 ]並列バージョンと一致するベンチマークのシリアルバージョンが付属し、小メモリシステムの問題サイズクラスWを定義しました。 [ 7 ] 2002年のNPB 2.4では、新しいMPI実装が提供され、さらに大きな問題サイズクラスDが導入されました。[ 6 ]また、1つのベンチマークにI/O集約型のサブタイプが追加されました。 [ 4 ]
NPB 3
NPB 3はNPB 2のMPI実装を維持し、OpenMP [ 8 ] 、Java [ 9 ]、High Performance Fortran [ 10 ]など、より多くのフレーバーで提供されました。これらの新しい並列実装は、NPB 2.3のシリアルコードから派生し、追加の最適化が行われました。[ 7 ] NPB 3.1とNPB 3.2ではさらに3つのベンチマークが追加されましたが[ 11 ] [ 12 ]、すべての実装で利用できるわけではありませんでした。NPB 3.3ではクラスEの問題サイズが導入されました。[ 7 ]シングルゾーンのNPB 3に基づいて、MPI / OpenMPハイブリッドプログラミングモデルを利用したマルチゾーンベンチマークのセットがNPB-Multi-Zone(NPB-MZ)という名前でリリースされ、「マルチレベルおよびハイブリッド並列化パラダイムとツールの有効性をテストする」ことを目的としていました。[ 1 ] [ 13 ]
ベンチマーク
NPB 3.3 時点では、次の表にまとめられているように 11 個のベンチマークが定義されています。
| ベンチマーク | 名前の由来は[ 2 ] | 利用可能開始日 | 説明[ 2 ] | 備考 |
|---|---|---|---|---|
| MG | マルチグリッド | NPB 1 [ 2 ] | Vサイクルマルチグリッド法を用いて3次元離散ポアソン方程式の解を近似する | |
| CG | 共役G勾配 | 線形方程式系を解くためのサブルーチンとして共役勾配法を用いた逆反復法を用いて、大規模な疎対称正定値行列の最小固有値を推定する | ||
| FT | 高速フーリエ変換 | 高速フーリエ変換(FFT)を使用して3次元偏微分方程式(PDE)を解く | ||
| は | 整数ソート | バケットソートを使用して小さな整数をソートする[ 5 ] | ||
| EP | 恥ずかしいほど平行 | マルサリア極座標法を用いて独立ガウス分布の乱数を生成する | ||
| BT | ブロックT二重 対角線 | ブロック三角法、スカラー五角法、対称逐次過剰緩和法(SSOR)ソルバーカーネル を含む3つの異なるアルゴリズムを使用して、非線形PDEの合成システムを解きます。 | ||
| SP | SスカラーP対角線[ 6 ] | |||
| LU | 上下対称ガウス・ザイデル法[ 6 ] | |||
| アメリカ合衆国 | 非構造化A適応型[ 11 ] | NPB 3.1 [ 7 ] | 移動する球からの対流と拡散を伴う熱方程式を解きます。メッシュは適応型で、5ステップごとに再計算されます。 | |
| DC | データキューブ演算子[ 12 ] | |||
| DT | データトラフィック[ 7 ] | NPB 3.2 [ 7 ] |
参考文献
- ^ a b「NAS並列ベンチマークの変更」 NASA先進スーパーコンピューティング部門. 2009年2月23日閲覧。
- ^ a b c d eベイリー、D.;バーシュチュ、E.バートン、J.ブラウニング、D.カーター、R.ダガム、L.ファトーヒ、R.ファインバーグ、S.フレデリクソン、P. Weeratunga, S. (1994 年 3 月)、「The NAS Parallel Benchmarks」(PDF)、NAS Technical Report RNR-94-007、NASA Ames Research Center、モフェット フィールド、カリフォルニア州
- ^ a b cベイリー、D.;ハリス、T.サフィール、W.ファン・デル・ワインガート、R.ウー、A。 Yarrow, M. (1995 年 12 月)、「The NAS Parallel Benchmarks 2.0」(PDF)、NAS Technical Report NAS-95-020、NASA Ames Research Center、モフェット フィールド、カリフォルニア州
- ^ a b c dウォン、P.; van der Wijngaart, R. (2003 年 1 月)、「NAS Parallel Benchmarks I/O Version 2.4」(PDF)、NAS Technical Report NAS-03-002、NASA Ames Research Center、モフェット フィールド、カリフォルニア州
- ^ a b c Saphir, W.; van der Wijngaart, R.; Woo, A.; Yarrow, M., NAS Parallel Benchmarks 2 の新しい実装と結果(PDF)、NASA Ames Research Center、Moffett Field、CA
- ^ a b c d van der Wijngaart, R. (2002 年 10 月)、「NAS Parallel Benchmarks Version 2.4」(PDF)、NAS Technical Report NAS-02-007、NASA Ames Research Center、モフェット フィールド、カリフォルニア州
- ^ a b c d e f「NAS並列ベンチマークの変更」 NASA先進スーパーコンピューティング部門. 2009年3月17日閲覧。
- ^ジン、H.フルムキン、M. Yan, J. (1999 年 10 月)、「The OpenMP Implementation of NAS Parallel Benchmarks and Its Performance」(PDF)、NAS Technical Report NAS-99-011、NASA Ames Research Center、モフェット フィールド、カリフォルニア州
- ^ Frumkin, M.; Schultz, M.; Jin, H.; Yan, J.、「Java での NAS 並列ベンチマークの実装」(PDF)、NASA 技術レポート NAS-02-009、NASA エイムズ研究センター、モフェットフィールド、カリフォルニア州
- ^ Frumkin, M.; Jin, H.; Yan, J. (1998年9月)、「高性能FortranにおけるNAS並列ベンチマークの実装」(PDF)、NASA技術報告書NAS-98-009、NASAエイムズ研究センター、モフェットフィールド、カリフォルニア州
- ^ a bフェン、H.ファン・デル・ワインガート、F.ビスワス、R. Mavriplis, C. (2004 年 7 月)、「非構造化適応型 (UA) NAS 並列ベンチマーク、バージョン 1.0」(PDF)、NAS テクニカル レポート NAS-04-006、NASA エイムズ研究センター、カリフォルニア州モフェット フィールド
- ^ a b Frumkin, M.; Shabanov, L. (2004年9月)、「データキューブ演算子によるメモリパフォーマンスのベンチマーク」(PDF)、NASA技術報告書NAS-04-013、NASAエイムズ研究センター、モフェットフィールド、カリフォルニア州
- ^ a b van der Wijngaart, R.; Jin, H. (2003 年 7 月)、「NAS Parallel Benchmarks, Multi-Zone Versions」(PDF)、NAS Technical Report NAS-03-010、NASA Ames Research Center、モフェット フィールド、カリフォルニア州
外部リンク
- NAS Parallel Benchmarks の変更点(公式サイト)