code-ai

标签

Cards List
#code-ai

@swyx: 终于!来自Cog的首个评估产品发布!!!!!! 作为背景说明:@METR_Evals 的上限约为16小时。Cog已推出私有企业级评估…

X AI KOLs Following · 5天前 缓存

Cognition发布了Devin的首个评估套件,提供长达100小时的企业级评估并附有财务保证。数据集包含来自126家企业用户的真实Java/TypeScript/Python/C#任务,旨在比现有基准更准确地衡量工程生产力。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈