mlops

标签

Cards List
#mlops

@adaption_ai: 介绍 AutoScientist。大多数模型训练在顶尖实验室之外都会失败。AutoScientist 自动执行完整的研究流……

X AI KOLs Timeline · 13小时前 缓存

Adaption AI 推出了 AutoScientist,这是一款能够自动化完整研究循环的工具,旨在让顶尖实验室之外的模型训练变得更加触手可及。

0 人收藏 0 人点赞
#mlops

我分析了 50 多个 AI 团队如何调试生产环境中的智能体故障,结果令人意外

Reddit r/AI_Agents · 昨天

基于对 50 多个 AI 团队的访谈,作者指出生产环境中的智能体故障往往源于细微的提示词或配置问题,而非深层模型缺陷。文章主张采用版本控制、A/B 测试和实验跟踪等软件工程实践以提高可靠性。

0 人收藏 0 人点赞
#mlops

@oran_ge: 未来每个团队都是在做 harness 工程,每个人都需要理解这套框架 虽然有一些非共识的点,但这篇是个不错的综述

X AI KOLs Timeline · 3天前

An opinion piece suggesting that AI teams will increasingly focus on 'harness engineering' and advocating for a review article on the framework.

0 人收藏 0 人点赞
#mlops

@FireworksAI_HQ: 前沿实验室押注 AGI 模型会足够强大,以至于你永远不会想对其进行定制。我们持不同观点。正在构建……

X AI KOLs Following · 4天前 缓存

Fireworks AI 宣布其训练平台进入预览阶段,允许开发者训练、微调并部署自定义 AI 模型,同时完全拥有数据和模型权重。

0 人收藏 0 人点赞
#mlops

Hugging Face Hub 推出 Storage Buckets

Hugging Face Blog · 2026-03-10 缓存

Hugging Face 推出 Storage Buckets,这是 Hub 上全新的可变性类 S3 对象存储功能,通过其 Xet 后端实现高效去重,专为生产级 ML 工作流优化。

0 人收藏 0 人点赞
#mlops

Kubernetes 扩展到 7,500 个节点

OpenAI Blog · 2021-01-25 缓存

# Kubernetes 扩展到 7,500 个节点 来源:[https://openai.com/index/scaling-kubernetes-to-7500-nodes/](https://openai.com/index/scaling-kubernetes-to-7500-nodes/) OpenAI将单个 Kubernetes 集群扩展到这个规模很少见,需要特殊的关注,但好处是提供了一个简单的基础设施,让我们的机器学习研究团队能够更快地迭代并扩展,而无需改变代码。从我们之前关于[扩展到 2,500 个节点⁠](https://openai.com/index/scaling-kube)的文章以来

0 人收藏 0 人点赞
← 返回首页

提交意见反馈