标签
Claude Science 是一款研究伙伴工具,专为严谨的科研工作设计,利用 Claude 的能力辅助研究人员。
本文介绍了CalBrief——一个包含16个证据包和96个人工验证结论的试点诊断基准,用于评估大型语言模型是否能够生成证据校准的科学简报。研究发现,结构化组织能提升推理能力,但显式的强度校准策略过于保守,且这种保守性主要源于标签空间的扩展,而非信号注入。
Open Notebook 是一个开源、注重隐私的 Google NotebookLM 替代品,可本地运行并支持多种 AI 模型,用于研究辅助。
Anthropic 的 Mythos Preview 模型在纠正错误决策方面的表现优于人类研究者,正确率高达 64%,相比 2024 年的 22% 有显著提升,展示了 Claude 在科研辅助方面不断进步的能力。
Sci-Bot是一个由AI驱动的研究助手,连接到Sci-Hub数据库,提供基于科学文献的答案。该项目是作为实验使用AI生成的代码构建的。
一份全面的入门指南,面向非技术背景的学术研究人员,介绍如何使用Claude Code,涵盖安装、项目组织以及无需编程技能即可自动化研究任务。
发布了一套6个Claude提示词,能够快速将40+篇研究论文转化为结构化文献综述、知识图谱和研究空白分析,提升研究效率。
Paper2Any 是一款开源 AI 工具,可将研究论文转换为可编辑的图表、技术路线图和幻灯片,支持通用文件格式和自定义样式。
作者介绍了 Papira,这是一款测试阶段的工具,可分析上传的研究论文,以映射机器学习与自然语言处理(NLP)子领域内的覆盖情况并识别研究空白。
本文介绍了 AI 协作者数学家(AI Co-Mathematician),这是一个利用代理式 AI 支持数学家进行构思和定理证明等开放式研究任务的工作台。早期测试表明,该系统在困难的问题解决基准测试中取得了最先进的结果,包括在 FrontierMath Tier 4 中获得了 48% 的得分。
OpenAI 开发了一个内部研究助手,它将仪表板与对话式 GPT-5 界面相结合,帮助团队在几分钟内分析数百万支持工单并生成洞察,而不是花费数周时间。该工具在整个团队中实现了数据分析民主化,允许非技术用户用自然语言提问并获得关于产品反馈、客户情感和趋势的可行性报告。
一款注重隐私的本地深度研究工具,支持多种大语言模型(LLM)和搜索引擎,在保持数据加密和本地化的同时,在问答任务上实现高精度。