@bariskasikci: 超级激动UW SyFI (https://syfi.cs.washington.edu) 成员在MLSys'26竞赛中赢得多项奖项,…
摘要
华盛顿大学SyFI实验室的成员在MLSys'26竞赛(NVIDIA赛道)中赢得了多个奖项,包括GDN赛道全智能体方法第一名、GDN赛道智能体辅助方法第二名、DSA赛道全智能体方法第三名。
查看缓存全文
缓存时间: 2026/05/24 00:14
极为兴奋!华盛顿大学 SyFI 实验室(https://syfi.cs.washington.edu)的成员在 MLSys’26 竞赛 NVIDIA 赛道中斩获多项大奖。热烈祝贺 @KeisukeKamahori、@sudopowr、Yile Gu、Wei Shen、Steven Gao!感谢 @nvidia、@modal 以及 Flashinfer 团队的支持。
- GDN 赛道第一名——全代理方法
- GDN 赛道第二名——代理辅助方法
- DSA 赛道第三名——全代理方法
SyFI 实验室 | SyFI 实验室
来源:https://syfi.cs.washington.edu/ 主页(https://syfi.cs.washington.edu/)| 成员(https://syfi.cs.washington.edu/people)| 出版物(https://syfi.cs.washington.edu/publications)| 演讲(https://syfi.cs.washington.edu/talks)| 新闻(https://syfi.cs.washington.edu/news)| 博客(https://syfi.cs.washington.edu/blog)
华盛顿大学 SyFI 实验室致力于构建面向未来 AI 的高效、韧性基础设施。随着应用日益复杂,我们通过跨层级创新填补下一代模型与异构硬件之间的鸿沟,交付由行业合作伙伴验证的可扩展开源系统。
我们的研究聚焦三大领域:
- 高效 AI:优化算法与系统,最大化训练与推理性能。
- 灵活 AI:设计能够无缝适应多样化任务、策略和模型结构的系统架构。
- 韧性 AI:确保大规模 AI 系统可靠性的同时,利用 AI 提升基础设施的鲁棒性。
博客文章
用 VibeServe 让 AI 代理自动构建你的推理服务栈(https://syfi.cs.washington.edu/blog/2026-05-12-introducing-vibeserve/)
2026年5月12日
我们推出 VibeServe,一个多代理系统,能够端到端地合成完整的 LLM 推理运行时,并针对用户指定的模型、硬件和工作负载进行专门优化。
SyFI 2026年1月:系统驱动 AI 研究的重大月份(https://syfi.cs.washington.edu/blog/2026-01-31-syfi-january-2026/)
2026年1月31日
2026年1月是 SyFI 实验室的里程碑月份,共有六篇论文被 MLSys 和 ICLR 接收,涵盖推理、训练、调度、检索和模型架构。
认识 LLMc:用 LLM 实现所有压缩方法的超越(https://syfi.cs.washington.edu/blog/2025-10-03-llmc-compression/)
2025年10月3日
我们推出 LLMc,一款开源工具,利用 LLM 作为世界上最丰富的参考字典来压缩自然语言。
阅读更多 »(https://syfi.cs.washington.edu/blog/)
演讲
每一层都错的合约:为 AI 数据中心重新设计操作系统和硬件
2026年5月15日
Dimitrios Skarlatos — 卡内基梅隆大学
摘要
AI 数据中心栈建立在从未为当今工作负载需求设计的软硬件合约与抽象之上。内存系统在 TB 级容量下不堪重负,异构 AI 加速器被强行部署,而 AI 对数据的渴求日益与现有基础设施提供的隐私保护现实相冲突。随着数据中心预计每年消耗超过 1000 TWh,重新谈判系统和硬件栈不再是可选项。在本次演讲中,我将分享我重新设计这些合约的研究历程以及它们引领的方向。我将从内存管理开始,介绍 Contiguitas 和 Learned Virtual Memory (LVM)——一系列针对虚拟内存的 OS 和硬件重新设计,从生产数据中心的内存碎片到近乎理想的地址转换。随后我将讨论 LithOS,首个面向 GPU 高效 ML 的操作系统,赋予操作系统此前缺乏的对异构加速器的控制权。最后,我将简要描述 Cinnamon 和 Cerium 如何将这些线索整合,使加密 AI 在规模化下变得实用。我将以开放性问题作结:AI 本身如何帮助重新谈判软硬件合约,以及我们下一步该走向何方。
演讲者简介
Dimitrios Skarlatos 是卡内基梅隆大学计算机科学系的助理教授。他的研究连接计算机体系结构与操作系统,聚焦于 AI 数据中心效率、隐私和可扩展性。其工作已部署至生产数据中心并合入 Linux 内核。他曾获得 IEEE CS TCCA 青年计算机架构师奖、NSF CAREER 奖、英特尔新星奖、Linux 基金会 Faculty 奖、ISCA 最佳论文奖、两次 ASPLOS 最佳论文奖、CACM 研究亮点、四次 IEEE MICRO Top Picks、ACM SIGARCH 与 IEEE CS TCCA 联合杰出博士论文奖,以及来自 Meta、英特尔、亚马逊、Oracle、AMD 和 VMware 的十多项企业 Faculty 奖。他近期的研究催生了 LithosAI 初创公司,并担任 CEO。
演讲者主页 »(https://www.cs.cmu.edu/~dskarlat/)
阅读更多 »(https://syfi.cs.washington.edu/talks/)
相似文章
@KeisukeKamahori: 非常激动地分享,我们在@UWSyFi的团队在#M…举办的FlashInfer AI内核生成竞赛中赢得了多个奖项。
华盛顿大学SyFI团队在MLSys2026期间举办的FlashInfer AI内核生成竞赛中赢得了多个奖项,得到了NVIDIA和Modal的支持。
@TheTuringPost: AutoScientists – 一个由智能体组成的研究实验室 @哈佛大学的研究人员将智能体连接成一个自组织的科学…
哈佛大学研究人员提出 AutoScientists,一个没有中央协调器、能够形成自组织科学团队的多智能体系统,在 BioML-Bench 和优化任务上取得了强劲成果。
@ChengleiSi:兴奋地分享我们在内部自动研究系统 @Recursive_SI 上取得的初步结果,我们在……上达到了SOTA
Recursive的自动AI研究系统通过在无需任务特定适配的情况下自动化研究循环,在NanoChat、NanoGPT Speedrun和GPU内核基准测试上达到了最先进的成果,并开源了相关工件以供进一步检验。
@marksaroufim: 很荣幸在MLSys发表主题演讲,讲述了AI系统如何演变、为何需要AI来改进它们、为何…
Mark Saroufim在MLSys会议上发表了主题演讲,涵盖了AI系统的演变、为何需要AI来改进它们以及有前景的未来方向。录制视频即将发布。
@pdhsu: 精彩的研究——MIT的Weissman实验室再次取得突破!
该文章强调了MIT Weissman实验室的研究,赞扬了他们最近的贡献。