我构建了一个包含300万篇arXiv论文的模型上下文协议（MCP）索引，用于LLMs。[D]

Reddit r/MachineLearning 2026/05/19 10:38 工具

model-context-protocol arxiv llm research retrieval indexing

摘要

一位开发者构建了一个包含300万篇arXiv论文的模型上下文协议（MCP）索引，以帮助LLMs检索准确的研究引用并减少幻觉，现正在寻找测试者提供反馈。

大家好，我最近完成了一个模型上下文协议（MCP）索引，包含了大约300万篇arXiv论文。我的目标是让本地和云端LLMs更容易直接连接到庞大的机器学习和STEM研究语料库，从而减少幻觉引用并改进研究工作流程。该索引已上线，但在广泛开放之前，我想确保检索质量在面对高度小众、复杂的查询（尤其是晦涩的数学、超特定领域或较新的架构）时依然可靠。我正在寻找一小群人（大约20人）来试用它，尝试突破检索系统，并对检索到的论文相关性给出严厉的反馈。如果你想用你自己的LLM设置对其进行压力测试，看看它在日常研究查询中的表现，请在评论中告诉我或给我发私信，我会把连接详情发给你！谢谢！

查看原文

我构建了一个包含300万篇arXiv论文的模型上下文协议（MCP）索引，用于LLMs。[D]

相似文章

MCP已死？

Contextberg

@svpino: MCP 并没有消亡。对于那些总说“但 MCP 会在你的上下文里塞垃圾”的人，这个抱怨已经过时了：现……

自托管MCP用于AI引用追踪——无需后端，无需注册，自带密钥

独立研究：单个LLM会遗漏多模型面板捕获的约一半代码审查缺陷。欢迎反馈并寻求arXiv认可。

提交意见反馈