kernel-optimization

标签

Cards List
#kernel-optimization

@xenovacom:Opus 4.7 刚写了一个定制 WebGPU 内核,用融合 LinearAttention 算子把 Qwen3.5 推理速度提升最高 13 倍!智能内核…

X AI KOLs Following · 2026-04-23 缓存

Opus 4.7 自动生成定制 WebGPU 内核,通过融合 LinearAttention 将 Qwen3.5 推理加速最高 13 倍,现已随 Transformers.js v4.2.0 发布。

0 人收藏 0 人点赞
#kernel-optimization

AccelOpt:一种用于AI加速器内核优化的自我改进LLM智能体系统

Hugging Face Daily Papers · 2026-04-15 缓存

AccelOpt是一种自我改进的LLM智能体系统,通过迭代生成和优化记忆自主优化AI加速器内核,在AWS Trainium上实现了49%至61%的峰值吞吐量提升,同时比Claude Sonnet 4便宜26倍。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈