我构建了一个包含300万篇arXiv论文的模型上下文协议(MCP)索引,用于LLMs。[D]

Reddit r/MachineLearning 工具

摘要

一位开发者构建了一个包含300万篇arXiv论文的模型上下文协议(MCP)索引,以帮助LLMs检索准确的研究引用并减少幻觉,现正在寻找测试者提供反馈。

大家好,我最近完成了一个模型上下文协议(MCP)索引,包含了大约300万篇arXiv论文。我的目标是让本地和云端LLMs更容易直接连接到庞大的机器学习和STEM研究语料库,从而减少幻觉引用并改进研究工作流程。该索引已上线,但在广泛开放之前,我想确保检索质量在面对高度小众、复杂的查询(尤其是晦涩的数学、超特定领域或较新的架构)时依然可靠。我正在寻找一小群人(大约20人)来试用它,尝试突破检索系统,并对检索到的论文相关性给出严厉的反馈。如果你想用你自己的LLM设置对其进行压力测试,看看它在日常研究查询中的表现,请在评论中告诉我或给我发私信,我会把连接详情发给你!谢谢!
查看原文

相似文章

MCP已死?

Hacker News Top

对模型上下文协议(MCP)的技术批评,指出其消耗过多的上下文窗口令牌、运行可靠性低,且与现有CLI/API方法重叠。Quandri技术栈的测量显示上下文使用率达10.5%。

Contextberg

Product Hunt

Contextberg 能将你的工作转化为 AI 代理内存,并通过模型上下文协议(MCP)提供服务。