Skip to main content

循环内核分析和性能建模工具包

项目描述

https://github.com/RRZE-HPC/kerncraft/blob/master/doc/logo/logo-lightbg.svg

核心工艺

循环内核分析和性能建模工具包

该工具允许使用执行高速缓存 (ECM) 模型、Roofline 模型和实际基准测试来自动分析循环内核。kerncraft 提供了一个框架来通过静态代码分析来调查数据重用和缓存需求。结合英特尔 IACA 工具,kerncraft 可以很好地概述内核和内存瓶颈,并使用该数据来应用性能模型。

有关详细文档,请参阅doc/中的出版物。

https://github.com/RRZE-HPC/kerncraft/actions/workflows/test-n-publish.yml/badge.svg https://codecov.io/github/RRZE-HPC/kerncraft/coverage.svg?branch=master

安装

在大多数安装了 python pip 和 setuputils 的系统上,只需运行:

pip install --user kerncraft

最新版本。为了获得ECMECMCPURooflineASM性能模型所需的Intel Achitecture Code Analyzer (IACA) ,请阅读运行:

iaca_get --I -accept-the-Intel-What-If-Pre-Release-License-Agreement-and-please-take-my-soul

附加要求是:
  • likwid(用于基准模型和likwid_bench_auto

用法

  1. 从示例目录中获取示例内核和机器文件

wget https://raw.githubusercontent.com/RRZE-HPC/kerncraft/master/examples/machine-files/SandyBridgeEP_E5-2680.yml

wget https://raw.githubusercontent.com/RRZE-HPC/kerncraft/master/examples/kernels/2d-5pt.c

  1. 查看机器文件并更改它以匹配您的目标机器(上面我们下载了一个 Sandy Bridge EP 机器的文件)

  2. 运行内核工艺

kerncraft -p ECM -m SandyBridgeEP_E5-2680.yml 2d-5pt.c -D N 10000 -D M 10000 添加-vv以获取有关内核和 ECM 模型分析的更多信息。

引文

在您的工作中使用 Kerncraft 时,请考虑引用以下出版物:

Kerncraft:循环内核分析性能建模工具预印本

J. Hammer, J. Eitzinger, G. Hager, and G. Wellein: Kerncraft: A Tool for Analytic Performance Modeling of Loop Kernels. In: Tools for High Performance Computing 2016, ISBN 978-3-319-56702-0, 1-22 (2017). Proceedings of IPTW 2016, the 10th International Parallel Tools Workshop, October 4-5, 2016, Stuttgart, Germany. Springer, Cham. DOI: 10.1007/978-3-319-56702-0_1, Preprint: arXiv:1702.04653``

学分

实施:朱利安锤子;
ECM 模型(理论):Georg Hager、Holger Stengel、Jan Treibig;
LC 概括:Julian Hammer

执照

AGPLv3

项目详情


发布历史 发布通知| RSS订阅