标签
本文探讨了使用变分自编码器学习大规模X射线散射数据的潜在表征,从而实现高效的数据压缩和分析。
这个仓库将201GB文本压缩至6GB,且无精度损失,比向量数据库小97%。它可本地运行,并为Claude提供即插即用的MCP,完全开源且私密。
fc 是一款开源的 IEEE-754 64 位双精度浮点数流无损压缩器,对于结构化数据,其压缩率优于 zstd 和 fpzip,但编码速度较慢。
本文探讨了通过分层数据压缩(HDLF)和受 Andrej Karpathy 启发的 “LLM OS” 范式,优化大语言模型的知识管理,将静态维基转化为工作记忆。