我构建了一个包含300万篇arXiv论文的模型上下文协议(MCP)索引,用于LLMs。[D]
摘要
一位开发者构建了一个包含300万篇arXiv论文的模型上下文协议(MCP)索引,以帮助LLMs检索准确的研究引用并减少幻觉,现正在寻找测试者提供反馈。
大家好,我最近完成了一个模型上下文协议(MCP)索引,包含了大约300万篇arXiv论文。我的目标是让本地和云端LLMs更容易直接连接到庞大的机器学习和STEM研究语料库,从而减少幻觉引用并改进研究工作流程。该索引已上线,但在广泛开放之前,我想确保检索质量在面对高度小众、复杂的查询(尤其是晦涩的数学、超特定领域或较新的架构)时依然可靠。我正在寻找一小群人(大约20人)来试用它,尝试突破检索系统,并对检索到的论文相关性给出严厉的反馈。如果你想用你自己的LLM设置对其进行压力测试,看看它在日常研究查询中的表现,请在评论中告诉我或给我发私信,我会把连接详情发给你!谢谢!
相似文章
MCP已死?
对模型上下文协议(MCP)的技术批评,指出其消耗过多的上下文窗口令牌、运行可靠性低,且与现有CLI/API方法重叠。Quandri技术栈的测量显示上下文使用率达10.5%。
Contextberg
Contextberg 能将你的工作转化为 AI 代理内存,并通过模型上下文协议(MCP)提供服务。
@svpino: MCP 并没有消亡。对于那些总说“但 MCP 会在你的上下文里塞垃圾”的人,这个抱怨已经过时了:现……
为 MCP(模型上下文协议)辩护,反驳其会向上下文注入垃圾信息的批评。指出 Claude Code、Codex 和 Cursor 等现代工具已实现渐进式披露,并按需加载 MCP 工具,使该抱怨过时。作者认为 MCP 最适合需要身份验证和可发现性的云端托管平台。
自托管MCP用于AI引用追踪——无需后端,无需注册,自带密钥
一个自托管、开源的MCP服务器,用于AI引用追踪,完全运行在用户机器上,支持离线工具和直接API调用,无需后端或遥测。
独立研究:单个LLM会遗漏多模型面板捕获的约一半代码审查缺陷。欢迎反馈并寻求arXiv认可。
一位独立研究人员的研究发现,单个LLM会遗漏约一半的代码审查缺陷,而使用来自不同提供商的多个模型可显著提高覆盖率,其中添加第二个模型的收益最大。该论文寻求反馈和arXiv认可。