循环内核分析和性能建模工具包
项目描述
核心工艺
循环内核分析和性能建模工具包
该工具允许使用执行高速缓存 (ECM) 模型、Roofline 模型和实际基准测试来自动分析循环内核。kerncraft 提供了一个框架来通过静态代码分析来调查数据重用和缓存需求。结合英特尔 IACA 工具,kerncraft 可以很好地概述内核和内存瓶颈,并使用该数据来应用性能模型。
有关详细文档,请参阅doc/中的出版物。
安装
在大多数安装了 python pip 和 setuputils 的系统上,只需运行:
pip install --user kerncraft
最新版本。为了获得ECM、ECMCPU和RooflineASM性能模型所需的Intel Achitecture Code Analyzer (IACA) ,请阅读并运行:
iaca_get --I -accept-the-Intel-What-If-Pre-Release-License-Agreement-and-please-take-my-soul
- 附加要求是:
likwid(用于基准模型和likwid_bench_auto)
用法
从示例目录中获取示例内核和机器文件
wget https://raw.githubusercontent.com/RRZE-HPC/kerncraft/master/examples/machine-files/SandyBridgeEP_E5-2680.yml
wget https://raw.githubusercontent.com/RRZE-HPC/kerncraft/master/examples/kernels/2d-5pt.c
查看机器文件并更改它以匹配您的目标机器(上面我们下载了一个 Sandy Bridge EP 机器的文件)
运行内核工艺
kerncraft -p ECM -m SandyBridgeEP_E5-2680.yml 2d-5pt.c -D N 10000 -D M 10000 添加-vv以获取有关内核和 ECM 模型分析的更多信息。
引文
在您的工作中使用 Kerncraft 时,请考虑引用以下出版物:
J. Hammer, J. Eitzinger, G. Hager, and G. Wellein: Kerncraft: A Tool for Analytic Performance Modeling of Loop Kernels. In: Tools for High Performance Computing 2016, ISBN 978-3-319-56702-0, 1-22 (2017). Proceedings of IPTW 2016, the 10th International Parallel Tools Workshop, October 4-5, 2016, Stuttgart, Germany. Springer, Cham. DOI: 10.1007/978-3-319-56702-0_1, Preprint: arXiv:1702.04653``
学分
执照
AGPLv3