标签
一条推文讨论了使用类似S3的对象存储和内容寻址构建具有无限吞吐量的事务数据库的想法,其中块被并行写入,根哈希定期更新。
ObjectCache提出使用S3兼容的对象存储来实现LLM KV缓存的重用,以降低成本并增加容量,同时通过协同设计的存储协议和传输调度将延迟开销降至最低。实验表明,对于64K上下文,相比本地DRAM仅增加5.6%的延迟。
Gergely Orosz 宣布 turbopuffer 成为《The Pragmatic Engineer Podcast》的季度赞助商,并强调了该数据库在对象存储和智能缓存方面的创新应用,帮助诸如 Cursor 等公司实现扩展,同时将成本降低 95%。
Hugging Face推出Storage Buckets,这是一个专为AI团队构建的存储解决方案,提供按TB计费、内置CDN以及针对模型权重、数据集和检查点的Xet去重功能。