标签
FrontierSmith 自动从封闭式任务中生成多样化的开放式编程问题,通过增强的智能体交互和训练数据合成,提升 LLM 在基准测试中的编码性能。
Adaption 推出 AutoScientist,一款自动化微调的 AI 工具,帮助模型快速学习能力,旨在降低前沿 AI 训练的门槛。
本文分析了SpaceX如何成为AI公司的主要算力提供商,其交易包括向Anthropic和Cursor提供GPU,以及谷歌通过SpaceX探索轨道数据中心。
文章指出,严肃的AI公司正从封装通用模型转向使用专有交互数据训练自己的专业化模型,因为在分布内智能体任务中,专业化现在经常能匹配甚至超越前沿模型,从而推动更好的单位经济效益。
Adaption AI 推出了 AutoScientist,这是一款能够自动化完整研究循环的工具,旨在让顶尖实验室之外的模型训练变得更加触手可及。
Thinking Machines Lab 正在纽约和旧金山招聘超级计算工程师,以构建用于实时交互模型和大规模训练的基础设施。
一位好莱坞编剧详细讲述了在2023年罢工潮引发行业动荡的背景下,从电视编剧转向AI训练零工的经历。文章揭示了AI劳动力市场的残酷现实,包括红队测试任务以及零工平台的运作机制。
Linus Ekenstam 解释了他在为 AI 构建上下文时偏好使用 HTML 而非 Markdown 的原因,他指出 HTML 的训练数据可用性更广泛。
该文章探讨了模型蒸馏的难度和成本,以DeepSeek R1蒸馏到Llama 3 8b和Qwen 2.5 7b为例,询问为何蒸馏模型不常见。
本文讨论了强化学习数据质量控制的重要性,概述了当前数据供应商的不足之处以及前沿AI实验室用于评估RL数据的标准。
AMD推出采用CDNA 4架构的Instinct MI350P加速器,采用PCIe形态,但尚未公布定价和上市信息。
OpenAI 发布了 MRC(Multipath Reliable Connection),这是一种与行业合作伙伴共同开发的全新网络协议,旨在提升大规模 AI 训练集群的性能和可靠性。该规范通过 Open Compute Project 发布,以标准化基础设施,实现高效的超级计算机运行。
Meta要求美国员工在工作笔记本上安装记录键盘与鼠标操作的AI训练软件,尽管公司声称有保护措施,仍因隐私问题激起内部强烈反弹。
Meta正在员工电脑上安装记录键盘、鼠标和截图的监控软件,以收集真实使用数据来构建AI智能体,引发内部不安。
Meta正在美国员工的PC上部署内部追踪软件,记录鼠标/键盘操作并偶尔截取屏幕快照,以改进可自动化办公任务的AI代理。
Atlassian 已默认启用数据收集功能,将客户数据用于训练 AI 模型,引发企业用户对隐私问题的担忧。
Teknium 观察到,Hermes 智能体最初表现低效,但一旦成功解决某个任务,效率就会大幅提升,他将其比作“线性化 RL”。
澳大利亚联邦银行正在向近50,000名员工推出ChatGPT Enterprise,以在整个组织内培养AI素养,并通过改进的工作流程和智能体驱动的用例来改善客户成果。