ソフトウェアの詳細:
TAU(チューニングと分析ユーティリティ)、高性能並列分散コンピューティングのためのプログラムとパフォーマンス解析ツールのフレームワークです。
TAUは、C、C ++、FORTRAN 90分の77、Pythonの、ハイパフォーマンスFORTRAN、Javaで書かれたプログラムの静的および動的解析のためのツール群を提供しています。
特に、TAUは、ノード、コンテキスト、およびスレッドに基づく一般スケーラブル並列実行モデルをサポートする最先端のパフォーマンスプロファイリングとトレース機能を提供しています。
TAUプロジェクトの目標は、スケーラブルな並列コンピューティング·システムの進化の課題や、次世代の科学的アプリケーションのために使用されるプログラミング方法論の両方のニーズを満たすプログラムと性能解析技術を開発することである。
TAUは、最適化し、拡張することができ、ポータブルで再構成可能な測定と分析コンポーネントのフレームワークを提供しながら計算パラダイムと機械の多様性をターゲットにすることができる必要があります。
のの新機能でこのリリース:
- このバージョンでは、LinuxをARMにポートを追加し、インテルMICプラットフォーム、CUDA 5.0のサポート、CrayのCCEとBUPCためのUPCランタイム計装、MPIラッパーの改善、サポートへIBM BG / Q、およびARM Linux用ParaProf 3Dます。
のバージョン2.21.2のの新機能:
- 主な変更点は、クレイおよびSGIのためにSHMEMプロファイリングを含むNVIDIAのOpenCLとAMDのOpenCLのサポート、MAQAOに基づくtau_rewriteツール、OpenSHMEMプロファイリング、スコア-Pアトミック/コンテキストイベント、Opari2、NVIDIA CUPTI v4.1を使用してOpenMP 3.0計装、PerfDMF、TAU_TRACK_SIGNALSとデバッグにH2データベース、ためのMinGWのコンパイラのサポートWindowsでは、クレイCCEコンパイラをサポートするために、ローズパーサーを使用してUPCソースレベルの計測、ローズとPDT 3.17とMAQAOバイナリinstrumentorます。
のバージョン2.19.1のの新機能:
- ParaProf:
- はParaProfはあなたが簡単に作成することができ、新しい表現のウィンドウがあります。
- 派生メトリック(オプション - >ショーメトリックパネルを派生またます を渡すことができる。
- での表現をparaprofと適用するファイル内の式のリスト
- 任意のレベル(アプリケーション、実験、プロファイルファイル内または で裁判
- データベース。このウィンドウには、perfexplorerに表示されます。
- はParaprofはスライダーを備えて更新した3D通信ウィンドウがあります。
- マトリックスディスプレイ、TAU_COMM_MATRIX環境ます を設定してください
- の前に、インストルメント済みアプリケーションを実行する変数を1にします。
- 新しいグループチェンジャーウィンドウがします。 グループを変更するための利用可能です
- 分析フェーズでのイベントのメンバーシップ。このウィンドウ(アクセス可能な
- は、Windows経由 - &GT。グループチェンジャーを使用すると、ルーチンのサブセットを選択することができます。
- 複数選択またはワイルドカード(例えば、HDF5を使用します。 に関連付けます
- 新しいグループ(例えば、IOは。あなたは、ファイルを保存し、それをデータベースにアップロードしてます。
- PerfExplorerのウィンドウ(例えば、「チャートでそれを使用する - >全ます。 のグループ%
- ランタイム」します。
- はフィルターボックスが表示され、どのフィルタするために正規表現を使用することができます。
- の機能/地域を変更したい。暗黙の*にあります追加されます。
- フィルタの終わり、あなただけのMPI_を入力することができ、あなたが表示されますようにします。
- すべてのMPIルーチンます。
- は、1つ以上の機能/地域を選択すると、現在、利用可能な
- のグループが表示されます。あなたが選択した機能は持っていない場合します。
- グループの同じセットが、その後彼らのグループの共通部分は
- 黒、そしてあなたがそのグループます を追加するかように、残りは、グレーになります
- 残りの部分への、またはそれらのすべてからそれを削除します。
- 固定ツリー選択モデルます。
- は今あなたが選択されていないオブジェクトを右クリックすると、選択します。 になる
- オブジェクトとポップアップは、このためにのみ表示されます。
- 3次元可視化は現在のppc64 JOGLを使用してIBM BG / Pに取り組んでいます。
- より良いPerfsuiteサポートします。
- PerfExplorer:
- Perfexplorerのコードはウェカ3.6.1に更新されました。あなたがする必要があります。
- を実行perfexplorer_configure
- perfexplorer。 DBSCANクラスタリングは現在動作している、あなたがします。 を起動することができます
- に直接データセットからウェカエクスプローラ。最初は、トップ10
- &QUOT、面白い&QUOT。機能は自動的にCSVファイルにエクスポートされており、
- 最初のk-距離を見つけるその後、データを正規化しますDBSCAN方法
- クラスタ。その後、K-距離は降順にソートされ、 されている
- K-距離がします。 のための様々な近所の距離として試されます
- クラスタリング。クラスターの新しい番号を見つけた任意のクラスタリングが保存されます。
- を更新するスクリプト( 2.5.1
- は、Python、バージョン2.5のための実際に最新の標準をサポートしています。新しい
- バージョンは、レジストリファイルを必要とし、ユーザーが書き込み可能な場所は、李>を入れて
- jarが前処理されたシンボルを見つけます。 ですcachefiles時
- TAU EBSサンプルからParaverトレースを再構築しますユーティリティを作成します。
- tau_instrumentor:
- tau_instrumentorツールがサポートするようになりまし自動ループレベルます。
- SPECモードの計装。スペックモードはにtau_instrumentorを可能にします。
- すべての のためのオリジナルのソースコードのコピーで計装呼び出しを挿入
- ツール。今年は、そのようなルーチンレベルScalascaます。 などのツールで使用されていた
- 計装のみ。さて、それはのためのループレベルの計測をサポートしています。
- 外部ツールにもします。
- ハイブリッドソースとコンパイラベースの計装:
- 自動ソースレベルの計測(PDTとを使用するときます。
- コンパイルが原因の可能な解析エラーに(.oファイルを生成しない、します。
- TAUは、オリジナルのコンパイルコマンドラインに戻すために使用する。さて、それは
- は挿入するために、コンパイラベースの機器を使用するようにコンパイラを呼び出します。
- コード内のルーチンレベルの計装。これはより良い につながる
- コードの計装報道。この変更は、 に透明であるべきである
- ユーザー。この新機能を無効にするには、ユーザーが明示的にします。 を渡す必要があります
- -optNoCompInst TAU_OPTIONS環境変数にオプション。ケアを行う必要があります。
- 取られる
- 選択的な計装ファイル。ルーチン名はPDTとのために(異なる場合があります。
- コンパイラベースの計測およびTAUのコンパイラスクリプトがケースである。
- 敏感な、しかし、彼らは名にワイルドカードを使用することができます。
- 外部のパッケージに対応します。
- TAUは現在、最近のPAPI-C 4.0.0のリリースと同様にScalasca 1.3.0とDyninstAPI 6.1のリリースをサポートしています。
- 新しいプラットフォーム:
- TAUがクレイます。 にC、C ++およびFortranのために(CrayのCCEのコンパイラをサポートしています
- XTシステムは、(単に構成する前に、「モジュールロードPrgEnv-クレイ」を呼び出すします。
- TAU。コンパイラベースの計測はまだサポートされていません。またTAUます。
- IBM BG / Pの設定の拡張機能を備えています。
- アウトリーチ:
- 私たちは中LCI'10カンファレンスで一日POINTチュートリアルを与えることになります。
- ピッツバーグ(3月8日には、私たちは、POINTを配布されるVI-HPSのLiveDVDsます。
- ます。
<李>と正確にポイント·ツー·ポイント李>の程度を評価するための十字
<李>送信側と受信側のノード間の通信。通信を使用するにします。
paraprofの
IO操作のスケーリングを参照するには
例えば
複数選択のために行われた変更後の
perfsuite 1.0.0a4プロファイルを解析するための
新しいで古いPerfDMFインストールを使用するには、
<李>ウェカにロードされる。そこから、あなたが楽しい、データマイニングのすべての種類を行うことができます。
kはポイントの最小数は、で発見されている各プロセスのために
Jythonの新しいバージョンをサポートするために、
内のルーチンやファイルの除外または含めるリストを定義しながら、
訓練のための
の新機能のバージョン2.18.1に:
- サポートは、PGIコンパイラでGPGPUs用とするために追加されましたMac OS XでのPGIコンパイラます。
- Eclipseの下のワークフローのサポート、チャーム++のサポート、およびOpenMPのサポートが改善されたします。
- PythonのAPIが加速したします。
- はドキュメントが更新されました。
- 盛り合わせのバグが修正されました。
アップデートは、インテル、GNUコンパイラベースのインストルメンテーションを含む
のバージョン2.17.3のの新機能である、とPathScaleコンパイラ、メモリトラッキング、IBM BG / Pの設定の修正、およびCQoS分析のためのサポートとPerfExplorerでスクリプトファイルからグラフを描画するための新しいPython APIます。
コメントが見つかりません