标签
第19讲高效AI分布式训练总结,涵盖数据、流水线、张量和序列并行方法,并附有关内存和通信瓶颈的说明。
这项研究揭示了Bright Data的SDK如何将智能电视和手机转变为用于AI网络爬取的住宅代理节点,强调了隐私风险以及住宅代理网络的合法供应端。
MIT RAISE与佐治亚州立大学宣布启动PATH(人工智能培训与招聘路径)项目,这是一项多年期计划,旨在通过以研究型大学和社区学院为核心的州级枢纽,推广可负担、与行业对口的AI培训。该项目侧重实践性工作学习体验,已有超过1000名佐治亚州立大学学生注册了涵盖AI基础、数据科学、深度学习及自主AI系统的课程。
Meta在内部反弹后缩减了其追踪员工键盘和鼠标活动以用于AI训练的计划;员工现在可以暂停数据收集最多30分钟,或申请豁免。
据报道,Anthropic正在使用1000名自由软件工程师,每项任务支付280美元,以训练Claude Code。工程师们需要编写提示词、比较代码并测试后续操作,从而教会AI真正的开发者是如何工作的。
分享了一个来自Anthropic的内部教学提示,旨在让AI以循序渐进的方式教导人类理解复杂内容,涵盖高层级和低层级维度。
Linktree更新了服务条款,允许收集用户内容(文本提示、图片、视频、URL)以训练OpenAI的DALL-E 3 AI,自2026年6月5日起生效。
为Meta人工智能产品提供内容审核和数据标注服务的Covalen公司的合同工在Meta都柏林办公室外抗议裁员,要求改善遣散费方案并结束六个月的冷静期。
AI初创公司Shift在纽约提供免费家庭清洁服务(即将扩展),作为交换,它们会记录清洁人员的工作过程,以收集训练未来机器人的数据。录像会进行匿名化处理以保护隐私。
SpaceX 正在完成一个用 C 编写的自定义 AI 训练栈,利用流水线并行和 220k 个 GB300 GPU 实现了超过一个数量级的性能提升,并计划开发用于强化学习的推理栈。
一位《连线》杂志的作者花了一周时间录制自己做家务,为训练人形机器人生成以自我为中心的视频数据,探索人工智能数据收集领域日益增长的零工经济趋势。
Meta全员会议录音泄露,扎克伯格承认公司使用员工数据训练AI,并解释为何员工数据比外包更有价值,随后裁员8000人。
作者认为,由于廉价的GPU租赁和AI驱动的工具,AI训练如今已经广泛可及,但许多人盲目使用未经验证的低质量数据,导致结果不佳和资源浪费。
一位即将离职的Meta工程师的反AI恶搞视频在内部疯传,捕捉到了员工对裁员以及公司转向AI培训的不满情绪。
文章认为,AI训练正变得前所未有地易于获取,使得小团队和个人无需大型基础设施即可训练专业化模型,标志着AI从企业主导转向面向特定领域的开发。
Training Data - AI Microgames 是一款产品,用户通过玩微游戏来帮助收集AI的训练数据。