标签
PyTorch Foundation 项目 Helion 将在丹佛举办的 PLDI 2026 上开设 Helion DSL 教程。这是一个互动式工作坊,面向编译器研究人员、内核作者和机器学习系统工程师,参与者将编写、自动调优并运行真实的 Helion 内核。
一条推文展示了一个CuTe DSL内核示例,该示例使用布局来表达转置,是FlashAttention-4内核的一部分。
Prism is a semantic document DSL for AI agents that enables structured writing with hierarchy and evidence, rendering as self-contained HTML. It provides 45 production-ready components to replace messy markdown, helping agents produce cleaner, organized outputs.
一篇详细分析ThunderKittens的博客文章,ThunderKittens是用于高性能AI内核的紧凑型DSL。文章包括从底向上的抽象分析,以及一个实现非因果注意力预填充内核的基准测试,该内核比FlashAttention-2快约1.55倍,与FlashAttention-3性能相当。
CPPL是一个编译器中介框架,通过使用Python领域特定语言和基于JSON的中间表示,连接大语言模型与硬件设计,从而实现可静态检查、可优化的RTL生成。
这篇评论文章认为,由于根本性的硬件差异,AI内核在不同硬件(TPU、GPU等)上的可移植性在结构上是不可能的,并且尽管业界渴望可移植性,但最好的AI堆栈始终需要特定于硬件的DSL才能获得最佳性能。
Nanopass Framework 是一种嵌入在 Scheme 中的领域特定语言,用于通过小的遍历和中间表示来创建编译器,减少样板代码并提高可维护性。
AgentSPEX 提出了一种领域专用语言,用于构建模块化、可解释的大模型智能体工作流,具备显式控制流、状态管理与可视化编辑器,性能优于现有 Python 耦合框架。