标签
AI-research-feedback 是一个为 Claude Code 设计的学术审稿技能,通过六个并行智能体检查语法、一致性、公式、图表和论证漏洞,支持指定期刊模拟审稿人,最后生成结构化审稿报告。
文章讲述了PPO算法作为ChatGPT核心对齐算法之一,曾在2017年被顶级AI会议NIPS拒稿,理由是创新性有限和提升不显著,揭示了学术界同行评审的弊端。