标签
Garry Tan指出检索是语音AI的关键瓶颈,并介绍了Moss,一个实现亚10毫秒向量搜索的开源工具,同时还宣布将于6月6日至7日在YC办公室举办黑客马拉松。
作者认为大多数智能体RAG失败源于检索问题——具体包括分块错误、缺乏新鲜度信号以及依赖纯向量搜索——而非大语言模型本身,并建议采用结构化分块、基于衰减的排序以及BM25+向量的混合搜索。
这个仓库将201GB文本压缩至6GB,且无精度损失,比向量数据库小97%。它可本地运行,并为Claude提供即插即用的MCP,完全开源且私密。