使用FPChecker的编译器辅助浮点错误分析与性能分析

Hacker News Top 事件

摘要

ISC High Performance 2026上的半日教程,关于使用编译器辅助工具(FPChecker/LLVM)进行C/C++科学代码的浮点错误分析与性能分析。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/07/01 14:00

# 编译器辅助浮点误差分析与性能剖析:FPChecker 教程 · 入门指南 来源:https://fpanalysistools.org/ISC26/ #### ISC 高性能计算 2026 (ISC26),德国汉堡 2026年6月22日 时间:上午9:00 - 下午1:00 欧洲/柏林时间(半日教程) 地点:CCH – 汉堡会议中心,房间:X12 厅 - 1楼 ## 描述 浮点运算是科学计算的核心,但微小的舍入效应可能累积成显著的数值误差——尤其当应用程序为了性能和能效而移植到低精度时。本教程将介绍基于 FPChecker 框架 (https://fpchecker.org/) 和 clang/LLVM 构建的编译器辅助分析工具,用于插桩 C/C++ 代码并揭示浮点行为。 参与者将学习如何评估动态范围和精度需求,跟踪代码区域内的舍入与相对误差传播,以及检测由数值极限导致的无穷大和 NaN。动手实践环节将使用包括线性求解器、有限差分方法及其他 C/C++ 代码在内的示例,这些示例将运行在参与者的笔记本上。在进阶环节,参会者可以将工具应用于实际应用或广泛使用的数值库。所有工具和示例将通过 Conda 分发,并为无法使用 Conda 的参与者提供预配置的 AWS 实例。 ## 演讲者 - Ignacio Laguna (https://lagunaresearch.org/),劳伦斯利弗莫尔国家实验室 ## AWS 实例 https://fpchecker.org/usernames ## 演示文稿幻灯片 教程幻灯片在此:幻灯片 (https://fpanalysistools.org/ISC26/slides/ISC26-fpchecker_tutorial.pdf) ## 代码仓库: - FPChecker:https://github.com/LLNL/FPChecker - 文档 (https://fpchecker.org/)

相似文章

中间浮点精度

Lobsters Hottest

本文探讨了C++代码中的中间浮点精度如何依赖于编译器设置、CPU标志和架构,尤其是在x87 FPU上,以及这如何影响性能和计算结果。

FP8就是你所需的一切(第一部分):驳斥硬件FP64作为HPC圣杯的观点

arXiv cs.AI

本文认为,在使用Ozaki Scheme II的情况下,FP8张量核心可以替代原生FP64硬件,用于像NVIDIA B300这样的AI优化GPU上的高性能科学计算,以更高的吞吐量实现完全的双精度精度。作者提出了张量-内存均衡模型,并表明在所有工作负载中,模拟的FP64性能可以比原生FP64高出数个数量级。

libffi 的性能改进

Lobsters Hottest

本文详细介绍了 libffi 中的一项性能改进:将参数放置缓存为扁平移动列表(即“计划”),从而消除了每次函数调用时的冗余重新分类,在不使用 JIT 编译的情况下实现了显著的加速。