llm-development

标签

Cards List
#llm-development

提示缓存,但用于 RL 训练——在长提示/短回复负载上实现 7.5 倍加速

Reddit r/LocalLLaMA · 2026-05-11

一种面向开源 RL 训练引擎的全新优化技术在训练过程中引入了提示缓存,通过减少冗余计算,在长提示、短回复负载场景下实现了高达 7.5 倍的加速。

0 人收藏 0 人点赞
#llm-development

@bibryam: Claude Cookbook 值得收藏。81 篇实用指南跨越 15 个类别,涵盖智能体、工具、RAG、评估、多…

X AI KOLs Timeline · 2026-05-11 缓存

Anthropic 发布了 Claude Cookbook,这是一套精选的 81 篇实用开发者指南合集,内容涵盖 AI 智能体、RAG、评估、多模态应用及生产工作流。该资源提供了可直接落地的代码示例与最佳实践,助力开发者使用 Claude 构建和部署应用。

0 人收藏 0 人点赞
#llm-development

@0xLogicrw: 前 Anthropic 研究科学家、现 Google DeepMind 研究科学家姚顺宇,在 @zhang_benita 播客「语言即世界」中首次披露了 Claude 3.7 的内部研发过程。他在 2024 年 10 月加入 Anthro…

X AI KOLs Timeline · 2026-05-11

前 Anthropic 科学家姚顺宇在播客中披露了 Claude 3.7 的研发细节及 Anthropic 押注代码能力的战略转变,并对比了 Anthropic 与 OpenAI 的决策结构差异。

0 人收藏 0 人点赞
#llm-development

中国AI实验室内部笔记(18分钟阅读)

TLDR AI · 2026-05-08 缓存

作者回顾了对中国AI实验室的访问,比较了中国和美国实验室在构建LLM方面的文化差异。中国实验室受益于集体工作和学生参与的文化,而美国实验室则面临个人自我和职业抱负带来的挑战。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈