ai-accelerators

标签

Cards List
#ai-accelerators

KForge:面向AI加速器的LLM驱动跨平台内核生成

arXiv cs.LG · 4天前 缓存

KForge是一个跨平台框架,利用两个协作的基于LLM的智能体,自动生成和优化适用于多种AI加速器的高性能计算内核,在NVIDIA B200和Intel Arc B580硬件上实现了显著的加速效果。

0 人收藏 0 人点赞
#ai-accelerators

TRAM:为低功耗 AI 加速器训练近似乘法器结构

arXiv cs.LG · 2026-05-12 缓存

本文介绍了 TRAM,一种联合优化近似乘法器结构和 AI 模型参数的方法,旨在降低 AI 加速器的功耗,同时保持模型精度。

0 人收藏 0 人点赞
#ai-accelerators

AccelOpt:一种用于AI加速器内核优化的自我改进LLM智能体系统

Hugging Face Daily Papers · 2026-04-15 缓存

AccelOpt是一种自我改进的LLM智能体系统,通过迭代生成和优化记忆自主优化AI加速器内核,在AWS Trainium上实现了49%至61%的峰值吞吐量提升,同时比Claude Sonnet 4便宜26倍。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈