ai-accelerators

#ai-accelerators

KForge：面向AI加速器的LLM驱动跨平台内核生成

arXiv cs.LG ↗ · 4天前缓存

KForge是一个跨平台框架，利用两个协作的基于LLM的智能体，自动生成和优化适用于多种AI加速器的高性能计算内核，在NVIDIA B200和Intel Arc B580硬件上实现了显著的加速效果。

0 人收藏 0 人点赞

#ai-accelerators

arXiv cs.LG ↗ · 2026-05-12 缓存

本文介绍了 TRAM，一种联合优化近似乘法器结构和 AI 模型参数的方法，旨在降低 AI 加速器的功耗，同时保持模型精度。

0 人收藏 0 人点赞

#ai-accelerators

Hugging Face Daily Papers ↗ · 2026-04-15 缓存

AccelOpt是一种自我改进的LLM智能体系统，通过迭代生成和优化记忆自主优化AI加速器内核，在AWS Trainium上实现了49%至61%的峰值吞吐量提升，同时比Claude Sonnet 4便宜26倍。

0 人收藏 0 人点赞