llm-development

#llm-development

提示缓存，但用于 RL 训练——在长提示/短回复负载上实现 7.5 倍加速

Reddit r/LocalLLaMA ↗ · 2026-05-11

一种面向开源 RL 训练引擎的全新优化技术在训练过程中引入了提示缓存，通过减少冗余计算，在长提示、短回复负载场景下实现了高达 7.5 倍的加速。

0 人收藏 0 人点赞

#llm-development

X AI KOLs Timeline ↗ · 2026-05-11 缓存

Anthropic 发布了 Claude Cookbook，这是一套精选的 81 篇实用开发者指南合集，内容涵盖 AI 智能体、RAG、评估、多模态应用及生产工作流。该资源提供了可直接落地的代码示例与最佳实践，助力开发者使用 Claude 构建和部署应用。

0 人收藏 0 人点赞

#llm-development

X AI KOLs Timeline ↗ · 2026-05-11

前 Anthropic 科学家姚顺宇在播客中披露了 Claude 3.7 的研发细节及 Anthropic 押注代码能力的战略转变，并对比了 Anthropic 与 OpenAI 的决策结构差异。

0 人收藏 0 人点赞

#llm-development

TLDR AI ↗ · 2026-05-08 缓存

作者回顾了对中国AI实验室的访问，比较了中国和美国实验室在构建LLM方面的文化差异。中国实验室受益于集体工作和学生参与的文化，而美国实验室则面临个人自我和职业抱负带来的挑战。

0 人收藏 0 人点赞