academic-research

#academic-research

Muon 并没有那么特别：随机或反转谱同样有效

arXiv cs.LG ↗ · 14小时前缓存

本文对 Muon 优化器的几何依据提出了挑战，认为精确的几何结构不如步长最优性重要。文章引入了 Freon 和 Kaon 优化器，以证明随机或反转谱的性能与 Muon 相当。

0 人收藏 0 人点赞

#academic-research

高等数学教学法的问题

Lobsters Hottest ↗ · 昨天缓存

作者讨论了高等数学教科书中缺乏详细且完整证明的问题，这为学生和专业人士造成了不必要的障碍，并倡导编写更易理解的配套笔记。

0 人收藏 0 人点赞

#academic-research

NARRA-Gym：用于评估交互式叙事智能体的基准

arXiv cs.CL ↗ · 昨天缓存

本文介绍了 NARRA-Gym，这是一个基准和可执行评估环境，用于评估大型语言模型在多轮对话中维持交互式叙事、管理记忆以及适应用户的能力。

0 人收藏 0 人点赞

#academic-research

@GoSailGlobal: Claude Code 102 针对学术研究者 Mushtaq Bilal 博士的 Claude Code 102 出来了第一篇 4M+ 阅读 / 这一篇接得很硬他的核心论点：Claude Code 完全可以当成「长期研究项目」的工作…

X AI KOLs Timeline ↗ · 昨天

The article details Dr. Mushtaq Bilal's guide on using Claude Code as a workflow engine for long-term academic research, outlining five key modules including file organization, subagents, and automation hooks.

0 人收藏 0 人点赞

#academic-research

解码阶段间歇性注入随机 token 可在无需微调的情况下提升 LLM 多样性

Reddit r/ArtificialInteligence ↗ · 2天前

哈佛大学的一篇研究论文提出了 Recoding-Decoding (RD)，这是一种新型解码方案，通过注入随机引导短语和偏转 token 来挖掘 LLM 的长尾知识，在无需微调的情况下显著提升输出多样性。该方法在保持高相关性的同时缓解了回复同质化问题，且模型能力越强，多样性提升越明显。

0 人收藏 0 人点赞

#academic-research

置信度感知对齐让推理型大语言模型更加可靠

arXiv cs.AI ↗ · 2天前缓存

本文介绍了CASPO框架，该框架通过迭代直接偏好优化（DPO），将token级别的置信度与大型推理模型中的逐步逻辑正确性进行对齐。文章还提出了置信度感知思考（CaT），用于在推理过程中动态剪枝不确定的推理分支，以提高可靠性和效率。

0 人收藏 0 人点赞

#academic-research

批判性反馈在何时能提升人工智能辅助的理论物理研究？SCALAR：用于智能体推理的结构化批评者-执行者循环

arXiv cs.AI ↗ · 2天前缓存

本文引入了 SCALAR 框架，这是一个结构化的批评者-执行者循环框架，旨在评估人工智能智能体之间不同的交互模式如何提升理论物理问题的推理能力。

0 人收藏 0 人点赞

#academic-research

针对封闭 LLM 的可证明检测的数据集水印

arXiv cs.LG ↗ · 2天前缓存

本文提出了一种针对封闭大型语言模型（LLM）的新型数据集水印方法。该方法利用词对共现模式，能够以可证明的方式检测模型训练是否使用了专有数据，即使这些数据在训练数据集中仅占极小比例。

0 人收藏 0 人点赞

#academic-research

@QingQ77: 上传论文 PDF 或 LaTeX 源码，由多智能体协作自动生成可编辑的 PowerPoint 演示文稿。 https://github.com/CRui5in/paper-ppt-agent… Paper PPT Agent 用三个 ag…

X AI KOLs Timeline ↗ · 3天前缓存

Paper PPT Agent 是一个开源的多智能体协作工具，能够将学术论文 PDF 或 LaTeX 源码自动转换为可编辑的 PowerPoint 演示文稿，包含内容提炼、版式设计及视觉质量审查功能。

0 人收藏 0 人点赞

#academic-research

面向 Claude Code 的学术研究技能

Hacker News Top ↗ · 3天前缓存

一套为 Claude Code 设计的插件套件，协助学术研究者在从研究到发表的全流程中提供支持，强调人类在环（human-in-the-loop）的完整性校验和风格校准。

0 人收藏 0 人点赞

#academic-research

@DivyanshT91162: Claude Code 刚刚获得了学术研究超级能力。有人构建了一个 10 阶段的 AI 研究系统，它不仅“撰写论文”……

X AI KOLs Timeline ↗ · 3天前

一款专为 Claude Code 设计的全新开源 10 阶段 AI 研究系统插件，自动化了文献综述、引用验证和同行评审模拟。它通过事实核查和模拟批判性反馈，声称能够以极低的成本生成高质量的学术初稿。

0 人收藏 0 人点赞

#academic-research

@DataChaz: 有人刚刚为 Claude Code 发布了一套完整的10阶段学术研究流程。它不会替你写论文，但会…

X AI KOLs Timeline ↗ · 4天前

Claude Code 的一个全新开源插件提供了一套10阶段的学术研究流程，能够处理参考文献搜集、引用验证和模拟同行评审，同时保持用户的写作风格。

0 人收藏 0 人点赞

#academic-research

LaTA：一种即插即用、符合 FERPA 标准的本地 LLM 自动评分系统，适用于高阶 STEM 课程

arXiv cs.AI ↗ · 5天前缓存

本文介绍了 LaTA，这是一个开源、符合 FERPA 标准的本地 LLM 自动评分系统，专为高阶 STEM 课程设计，可在本地硬件上运行。论文报告了在俄勒冈州立大学的成功部署，显示学生成绩有所提高，且评分准确率极高。

0 人收藏 0 人点赞

#academic-research

研究：企业常利用自动化手段压制特定工人的工资

MIT News — Artificial Intelligence ↗ · 6天前缓存

麻省理工学院的一项研究表明，企业经常利用自动化来取代那些享有“工资溢价”的工人，而非为了最大化生产率。这一做法显著加剧了收入不平等，并限制了整体经济增长。

0 人收藏 0 人点赞

#academic-research

x1：跨语言与文化自适应推理学习

arXiv cs.CL ↗ · 2026-04-21 缓存

研究人员推出了 x1，这是一类推理模型家族，能够针对每个具体实例自适应地选择最优语言进行推理，证实了在多语言及文化相关任务中，语言选择会对推理质量产生影响。

0 人收藏 0 人点赞

#academic-research

也门语境下后编辑对AI生成翻译的影响：ChatGPT翻译文学散文

arXiv cs.CL ↗ · 2026-04-21 缓存

这项发表于arXiv的学术研究考察了ChatGPT-4在阿英文学散文互译中的表现，研究涵盖30名专业译者对AI生成译文的评估与后编辑工作。研究发现，尽管AI显著提升了翻译速度，但在处理文化内涵、文体特征与修辞表达方面，人工后编辑依然不可或缺。研究倡导采用“人机协作”模式，而非追求全自动化。

0 人收藏 0 人点赞

#academic-research

@mayhewsw 新论文：我知道现在流行把算力规模扩大10倍，让模型一步步思考并使用工具，但……

X AI KOLs Following ↗ · 2026-04-19

作者发布了 Universal NER v2，这是一篇将在 LREC 2026 发表的命名实体识别论文，刻意回避了当代的“规模扩张+工具调用”潮流。

0 人收藏 0 人点赞

#academic-research

模仿学习：性能如何？

ML at Berkeley ↗ · 2021-04-28 缓存

本文分析了一篇近期发表的学术论文，该论文为模仿学习算法提供了一个分类框架，通过矩匹配技术对这些算法进行分类，并分析其理论模仿差距界限。

0 人收藏 0 人点赞

academic-research

提交意见反馈