mlops

#mlops

@suraj_sharma14: 如果你想成为一名AI/ML工程师，以下是你真正需要学习的内容：- 数学与理论基础：线性…

X AI KOLs Timeline ↗ · 4天前缓存

成为AI/ML工程师所需学习主题的详细路线图，涵盖数学基础、深度学习架构、训练技巧、数据管道、评估、推理、MLOps和负责任AI。

0 人收藏 0 人点赞

#mlops

@ba_niu80557: https://x.com/ba_niu80557/status/2069042546886787419

X AI KOLs Timeline ↗ · 2026-06-22 缓存

本文深入探讨了 Forward Deployed Engineering (FDE) 在 AI 落地中的真正含义，强调 FDE 并非简单的 API 调用或搭建 Agent，而是面向生产落地的系统工程，包括业务翻译、系统设计、平台整合、生产运营和能力沉淀。

0 人收藏 0 人点赞

#mlops

@DanKornas：LLM评估是大多数AI演示开始成为真正系统的地方。LLM-Evaluation是一个公共GitHub资源，包含研讨会幻灯片…

X AI KOLs Timeline ↗ · 2026-06-17 缓存

一条推文宣布了LLM-Evaluation，这是一个公共GitHub仓库，包含用于评估LLM、生成式AI和RAG系统的研讨会幻灯片、示例笔记本、提示词和参考链接，旨在提供评估工作流的实用地图。

0 人收藏 0 人点赞

#mlops

@ConsciousRide: 2026年AI工程面试中90%的问题都围绕以下7点。1. LLM基础：分词、Transformer与...

X AI KOLs Timeline ↗ · 2026-06-17 缓存

一条Twitter帖子概述了2026年AI工程面试中占据主导地位的七个关键领域，包括LLM基础、RAG系统、智能体工作流、推理优化、评估、MLOps以及生产实践。

0 人收藏 0 人点赞

#mlops

@ba_niu80557: 趁上午有点时间给大家聊点硬的干货。一个 AI 落地项目,从签完合同到真正跑进生产,这中间到底发生了什么,我把这套打法摊开讲一遍。做这行的可以照着抄,不做这行的也能看明白,为什么 95% 的企业 AI 试点最后都死了。先说一个反直觉到你…

X AI KOLs Timeline ↗ · 2026-06-17 缓存

这篇文章讨论了企业AI项目从概念验证到生产部署过程中常见的失败原因，强调了MLOps、提前检查真实数据、明确人机边界等关键实践，认为项目失败往往不是因为模型不行，而是因为工程落地环节的忽视。

0 人收藏 0 人点赞

#mlops

@cevenif: 市面上90%的机器学习教程其实都在误导你——光会训练模型又能怎样？上不了生产线，前面全白搭。说真的，这个坑我见过太多人往里跳了：跟着教程把模型训得飞起，一扔进真实环境就当场歇菜——不知道怎么部署、不会做监控、扩展性一塌糊涂。哈佛大学直…

X AI KOLs Timeline ↗ · 2026-06-16 缓存

哈佛大学开源《Machine Learning Systems》教材，系统讲解ML系统设计、数据工程、模型部署、MLOps和边缘AI等实践内容，旨在帮助将AI从研究落地到生产环境，免费获取于GitHub。

0 人收藏 0 人点赞

#mlops

@angeldot_: 这个仓库相当于一个免费的AI工程硕士学位——20个阶段。从线性代数到自主智能体集群。而且它……

X AI KOLs Timeline ↗ · 2026-06-10 缓存

一个免费开源的AI工程课程，涵盖从线性代数到自主智能体集群的20个阶段，包含Python、TypeScript、Rust和Julia的动手构建。所有材料均可重复使用，并可连接到Claude Code或Cursor。

0 人收藏 0 人点赞

#mlops

@DanKornas: AI基础设施过于宽泛，不适合随机教程。AI基础设施工程师学习路径是一个实践性课程……

X AI KOLs Timeline ↗ · 2026-06-05 缓存

DanKornas 介绍了一个开源的 AI 基础设施工程师学习路径，这是一个结构化的 10 模块课程，涵盖从基础到 LLM 基础设施的内容，包含实践实验和项目。

0 人收藏 0 人点赞

#mlops

@tom_doerr: 500小时AI基础设施工程课程 https://github.com/ai-infra-curriculum/ai-infra-engineer-learning…

X AI KOLs Timeline ↗ · 2026-05-26 缓存

一个全面的500小时学习路径，涵盖AI基础设施工程，包括Docker、Kubernetes、MLOps、LLM基础设施等，通过动手项目和实验进行学习。

0 人收藏 0 人点赞

#mlops

用于支持主动运营决策的急诊科滞留时间集成预测原型

arXiv cs.LG ↗ · 2026-05-20

本文介绍了一种多时间尺度时间序列预测框架，使用DLinear和NLinear模型预测急诊科滞留时间，并开发了一个MLOps网页应用原型，以支持主动运营决策。

0 人收藏 0 人点赞

#mlops

@tom_doerr: 用传统机器学习替代90%的LLM分类调用 https://github.com/adrida/tracer

X AI KOLs Timeline ↗ · 2026-05-14 缓存

TRACER是一种工具，通过从LLM痕迹中学习，用轻量级传统机器学习替代多达90%的LLM分类调用，降低成本同时保持准确性。

0 人收藏 0 人点赞

#mlops

@adaption_ai: 介绍 AutoScientist。大多数模型训练在顶尖实验室之外都会失败。AutoScientist 自动执行完整的研究流……

X AI KOLs Timeline ↗ · 2026-05-13 缓存

Adaption AI 推出了 AutoScientist，这是一款能够自动化完整研究循环的工具，旨在让顶尖实验室之外的模型训练变得更加触手可及。

0 人收藏 0 人点赞

#mlops

我分析了 50 多个 AI 团队如何调试生产环境中的智能体故障，结果令人意外

Reddit r/AI_Agents ↗ · 2026-05-12

基于对 50 多个 AI 团队的访谈，作者指出生产环境中的智能体故障往往源于细微的提示词或配置问题，而非深层模型缺陷。文章主张采用版本控制、A/B 测试和实验跟踪等软件工程实践以提高可靠性。

0 人收藏 0 人点赞

#mlops

@oran_ge: 未来每个团队都是在做 harness 工程，每个人都需要理解这套框架虽然有一些非共识的点，但这篇是个不错的综述

X AI KOLs Timeline ↗ · 2026-05-10

An opinion piece suggesting that AI teams will increasingly focus on 'harness engineering' and advocating for a review article on the framework.

0 人收藏 0 人点赞

#mlops

@FireworksAI_HQ: 前沿实验室押注 AGI 模型会足够强大，以至于你永远不会想对其进行定制。我们持不同观点。正在构建……

X AI KOLs Following ↗ · 2026-05-09 缓存

Fireworks AI 宣布其训练平台进入预览阶段，允许开发者训练、微调并部署自定义 AI 模型，同时完全拥有数据和模型权重。

0 人收藏 0 人点赞

#mlops

Hugging Face Hub 推出 Storage Buckets

Hugging Face Blog ↗ · 2026-03-10 缓存

Hugging Face 推出 Storage Buckets，这是 Hub 上全新的可变性类 S3 对象存储功能，通过其 Xet 后端实现高效去重，专为生产级 ML 工作流优化。

0 人收藏 0 人点赞

#mlops

# Kubernetes 扩展到 7,500 个节点来源：[https://openai.com/index/scaling-kubernetes-to-7500-nodes/](https://openai.com/index/scaling-kubernetes-to-7500-nodes/) OpenAI将单个 Kubernetes 集群扩展到这个规模很少见，需要特殊的关注，但好处是提供了一个简单的基础设施，让我们的机器学习研究团队能够更快地迭代并扩展，而无需改变代码。从我们之前关于[扩展到 2,500 个节点⁠](https://openai.com/index/scaling-kube)的文章以来

0 人收藏 0 人点赞

mlops

提交意见反馈