llm-evals

标签

Cards List
#llm-evals

@alphabatcher:54万行Rails代码是进入智能体时代的残酷方式 Garry's List 发布时包含:> 26.2万行应用代码 > …

X AI KOLs Following · 3天前 缓存

对AI智能体时代大型Rails代码库的批评,提出转向基于技能的开发方式,使用智能体、Markdown技能和TypeScript实现确定性I/O。

0 人收藏 0 人点赞
#llm-evals

利用LLM评估进行更好的实验——是漏斗,而非分叉(阅读时间约6分钟)

TLDR AI · 2026-05-21 缓存

Spotify Engineering讨论了将LLM评估用作A/B实验前的漏斗,提高了命中率,并在评估与实验之间建立了反馈循环。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈