标签
MinT 是一种托管基础设施系统,通过保持基础模型常驻并移动轻量级 LoRA 适配器,实现数百万个 LLM 的高效训练和服务,可跨模型架构、存储和策略管理进行扩展。
一位开发者训练了一个350M参数的模型,其处理电子表格的能力优于Anthropic的Opus 4.6。
作者询问2026年中AMD的ROCm生态系统在AI训练领域的当前可行性,将其与NVIDIA的CUDA进行比较,并询问它是否已达到PyTorch的“开箱即用”阶段。
Google发布第八代TPU:TPU 8t用于训练,TPU 8i用于推理,专为大规模、高能效AI智能体工作负载打造,将于今年晚些时候推出。
一位用户希望获得关于改进其YOLO11n目标检测模型的建议,计划将其部署在Raspberry Pi 5上,但困扰于理论mAP50指标与实际检测性能之间的差距。
Ulysses 序列并行是一种用于训练具有百万Token上下文的大语言模型的技术,通过将序列块分布在多个GPU上来降低内存需求,实现高效的长上下文训练。它与HuggingFace Accelerate、Transformers Trainer和TRL集成,支持Flash Attention和DeepSpeed ZeRO。
# 为新闻机构推出 OpenAI 学院 来源:[https://openai.com/index/openai-academy-for-news-organizations/](https://openai.com/index/openai-academy-for-news-organizations/) OpenAI 与美国新闻项目(American Journalism Project)和伦费斯特研究所(The Lenfest Institute)合作,为使用 AI 的记者和出版商推出一个新的学习中心。在 OpenAI,我们认为新闻业对于健康的民主至关重要。人们依靠可靠的地方和国家报道来了解他们的社区和
本直播教程展示了如何使用监督微调(SFT)在代理跟踪记录数据集上训练一个小型代码代理(Gemma 4 2B),并利用HF Jobs和Track IO自动化参数扫描与评估,体现“用代理训练代理”的理念。
一位探险者借助ChatGPT作为虚拟助理,计划独自无补给骑行到南极点,并通过减重、故障排查和配重训练来完善准备。
一个GitHub仓库,提供使用PyTorch从头训练大型语言模型的代码,基于Attention Is All You You论文,支持在单个GPU上训练十亿参数模型。
Anthropic分享了改进Claude对齐训练的经验,通过教授底层原则而非仅仅展示示例,在代理错位评估中获得了满分。