HPCチャレンジは、高性能のベンチマークスイートです。 HPCチャレンジは、基本的に7ベンチマークで構成されています。
1. HPL - 線形連立方程式を解くための実行の浮動小数点速度を測定するのLinpack TPPベンチマーク。
2. DGEMMは - 倍精度実数行列 - 行列乗算の実行の浮動小数点率を測定します。
3. STREAM - (GB /秒)の持続可能なメモリ帯域幅とシンプルなベクトルカーネルに対応する計算速度を測定する簡単な合成ベンチマークプログラム。
4. PTRANS(並列行列転置は) - プロセッサのペアが同時に相互に通信の通信を行使する。これは、ネットワークの総通信容量の有用な試験です。
5.ランダム· - 対策メモリの整数ランダム更新のレート(GUPS)。
6. FFTE - 対策倍精度錯体の実行の浮動小数点レート一次元離散フーリエ変換(DFT)。
7.通信帯域幅と遅延 - 同時通信パターンの数の遅延と帯域幅を測定するための一連のテスト。 b_eff(有効帯域幅ベンチマーク)に基づきます。
コンパイル:
最初のステップは、あなたのマシンの特性を反映した設定ファイルを作成することです。設定ファイルには、HPLのディレクトリに作成する必要があります。このディレクトリには、設定ファイルを作成する方法について説明します(ファイルはREADMEやINSTALL)が含まれています。ディレクトリHPL /セットアップ、設定ファイルの多くの例が含まれています。良い方法は、HPLのディレクトリにそれらのいずれかをコピーして、それが動作しない場合、それを変更することです。このファイルは、HPC Challangeスイートのすべてのコンポーネントによって再利用されます。
設定が完了すると、ファイルは、名前がメイクで始まるHPLディレクトリに存在する必要があります。およびテストに使用されるシステムの名前で終わります。システムの名前がUNIXの場合たとえば、ファイルがMake.Unix名前を付ける必要があります。
(Unixの名前付きシステム用)ベンチマークの実行モジュールを構築するには、type:アーチ= Unixのを作ります。このコマンドは、トップディレクトリ(ないHPLディレクトリ内)で実行する必要があります。これは、構成ファイルのHPLディレクトリに見て、ベンチマーク実行可能ファイルを構築するためにそれを使用します。
構成:
HPC Challangeは、ほとんど(通例てHPL.datと呼ばれる)HPLの入力ファイルと同じである短い入力ファイルの名前hpccinf.txtによって駆動されます。 HPLの入力ファイルの詳細については、ファイルHPL / WWW / tuning.htmlを参照してください。サンプル入力ファイルは、HPC Challangeのディストリビューションに含まれています。
次のようにHPLの入力ファイルとHPC Challange入力ファイルの違いを要約することができます。
* 3行目および4行目は無視されます。出力は常にhpccoutf.txtという名前のファイルになります。
*は、(それだけにはありませんが)、HPCチャレンジベンチマークをカスタマイズするために使用される追加の行(33行目から始まる)があります。これらは、以下に説明します。
(HPL入力ファイルと比較して)、HPCチャレンジ入力ファイルの追加行は、次のとおりです。
線33と34はPTRANSベンチマーク(HPC Challangeベンチマークの構成要素のうちの1つ)を実行するために使用する追加のマトリクスサイズを記載しています。
*行35および36は、追加のブロッキング因子を説明はPTRANSベンチマークを実行するために使用されます。
ただ、完全を期すために、ここではその意味の簡単な説明とHPC Challangeの入力ファイルの行のリストです:
* 1行目:無視
* 2行目:無視
* 3行目:無視
* 4行目:無視
* 5行目:HPLのためのマトリックスのサイズの数(およびPTRANS)
* 6行目:HPL(およびPTRANS)のためのマトリックスサイズ
* 7行目:HPLのための要因をブロック数(およびPTRANS)
* 8行目:HPL(およびPTRANS)のための要因を遮断
* 9行目:HPLのためのプロセスの順序のタイプ
* 10行目:HPLのためのプロセスグリッドの数(およびPTRANS)
* 11行目:HPLのための各プロセスグリッドの処理行数(と
PTRANS)
* 12行目:HPLのための各プロセスグリッドのプロセス列の数
(とPTRANS)
* 13行目:のためにスケーリングされた残留を超えべきでない閾値
HPL(とPTRANS)
* 14行:HPLのためのパネルの分解方法の数
* 15行目:HPLのためのパネルの分解方法
* 16行:HPLのための再帰的な停止基準の数
* 17行目:HPLのための再帰の停止基準
* 18行目:再帰パネルの数は、HPLのカウント
* 19行目:再帰パネルはHPLのカウント
* 20行:HPLのための再帰的なパネルの分解方法の数
* 21行:HPLのための再帰的なパネルの分解方法
* 22行目:HPLのための放送法の数
* 23行:HPLのための放送法
* 24行:HPLのための先読みの深さの数
* 25行目:HPLのためのルックアヘッド深さ
* 26行目:HPLのためのスワップ方法
* 27行:HPLのしきい値をスワップ
* 28行目:HPLのためのL1の形
* 29行:HPLのためのU字の形
* 30行目:平衡化を使用するかどうかを指定する値
HPLによって
* 31行:HPLのためのメモリ配置
* 32行目:無視
* 33行目:別の問題の数がPTRANSのためサイズ
* 34行目:別の問題がPTRANSのためサイズ
* 35行目:PTRANSのための追加のブロッキング多くの要因
* 36行目:PTRANSのための追加のブロッキング要因
このリリースで新しい何が:乱数生成のための線形合同ジェネレータを使用するランダム·の
このバージョンの追加最適化変種。
グローバル減少は、より正確な誤差推定値を達成するために、MPI FFTの演算をエラーに追加されました。
HPL成分が最後に実行され、他の部品の性能は満足できるものではなかった場合に中止することができるように、ベンチマークの順序を並び替えました。
ランダム·コードのチューニングを支援するために、今最初のものです。
盛り合わせのバグが修正されました。
コメントが見つかりません