@PyTorch: 自动调优是Helion的支柱,Helion是PyTorch用于性能可移植ML内核的DSL。目前Helion搜索利用…

X AI KOLs Following 工具

摘要

本文探讨了使用LLM引导的自动调优来加速PyTorch的Helion DSL中的内核配置搜索,取代了较慢的Likelihood-Free Bayesian Optimization方法。

自动调优是Helion的支柱,Helion是PyTorch用于性能可移植ML内核的DSL。目前Helion搜索利用Likelihood-Free Bayesian Optimization (LFBO)来寻找最高性能的配置。虽然LFBO效果不错,但它需要每个内核经历数百次编译和基准测试循环。 如果,不是盲目开始搜索,而是可以询问LLM来推理内核并提出配置呢? 在本文中,我们探讨了LLM引导的自动调优如何成为一种实用的方法,能够以生产级质量实现显著更快的内核调优。 点击评论区链接了解更多。 @JongsokC @oguz_ulgen
查看原文
查看缓存全文

缓存时间: 2026/06/18 18:10

自动调优是 Helion(PyTorch 用于性能可移植 ML 内核的 DSL)的支柱。目前 Helion 的搜索使用无似然贝叶斯优化(LFBO)来寻找性能最优的配置。虽然 LFBO 表现良好,但它需要对每个内核进行数百次编译和基准测试周期。

如果不再盲目开始搜索,而是让 LLM 推理内核并提出配置,会怎么样?

在这篇博客中,我们探讨了 LLM 引导的自动调优如何成为一种实用方法,以生产质量大幅加快内核调优速度。

点击评论区中的链接了解更多信息。

@JongsokC @oguz_ulgen

相似文章