heterogeneous-deployment

标签

Cards List
#heterogeneous-deployment

预填充即服务:下一代模型的 KVCache 可跨数据中心

Hacker News Top · 2026-04-19 缓存

研究者提出“预填充即服务”(PrfaaS),将长上下文预填充卸载到远程计算密集型集群,并通过普通以太网流式传输 KVCache,实现独立扩缩容,使 1T 参数混合模型吞吐提升 32–54%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈