标签
一种面向开源 RL 训练引擎的全新优化技术在训练过程中引入了提示缓存,通过减少冗余计算,在长提示、短回复负载场景下实现了高达 7.5 倍的加速。
Anthropic 发布了 Claude Cookbook,这是一套精选的 81 篇实用开发者指南合集,内容涵盖 AI 智能体、RAG、评估、多模态应用及生产工作流。该资源提供了可直接落地的代码示例与最佳实践,助力开发者使用 Claude 构建和部署应用。
前 Anthropic 科学家姚顺宇在播客中披露了 Claude 3.7 的研发细节及 Anthropic 押注代码能力的战略转变,并对比了 Anthropic 与 OpenAI 的决策结构差异。
作者回顾了对中国AI实验室的访问,比较了中国和美国实验室在构建LLM方面的文化差异。中国实验室受益于集体工作和学生参与的文化,而美国实验室则面临个人自我和职业抱负带来的挑战。