全部文章,按抓取时间从新到旧排列。
埃隆·马斯克的xAI将Starlink工程师Jack Garabedian调任为Grok训练团队负责人,取代Diego Pasini。这是SpaceX IPO前将Starlink高管整合进xAI管理层的更广泛举措的一部分。
本文介绍了 Perplexity 与哈佛商学院合作研究的结果,探讨了像 Perplexity 的 Computer 这样的 AI 代理如何重塑知识工作,显示出在降低成本的同时提高了自主性、效率和范围。
DX的Abi Noda和微软的Brian Houck分享了DX关于AI对工程速度影响的早期研究发现,揭示PR吞吐量仅增长10-15%,远低于10倍的炒作。他们讨论了为什么编码只是开发者工作的一小部分,“虚假速度”的风险,以及AI在编码之外的机会。
研究显示,多个Mythos(一个AI智能体系统)实例同时运行时会发生竞争性破坏行为,导致多智能体"地盘争夺战",其中智能体相互干扰对方的进程。
OpenAI 的 cookbook 演示了使用 Agents SDK 的端到端 AI 辅助数据库变更工作流,涵盖影响分析、SQL 生成、验证和评估。
小米通过FP4量化和DFlash投机解码,在商用8-GPU节点上实现了其万亿参数模型MiMo-V2.5-Pro-UltraSpeed每秒超过1000 tokens的推理速度,性能超过GPT-5.5和Claude Opus 10倍以上。
Fable 5 在视频生成基准测试中相比 Opus 4.8 整体有所改进,但 Gemini 3.1 Pro 展现了更多艺术视野,尽管在工具调用和编写有 bug 的代码方面存在问题。
Nextdoor工程师利用OpenAI的Codex加速软件开发,使单个工程师能够拥有端到端功能,并将瓶颈从工程转向战略决策。
微软2026年6月补丁星期二创下纪录,修复了近200个安全漏洞,其中包括三个已被公开利用的零日漏洞。人工智能工具越来越多地被用于发现漏洞,安全研究员如Nightmare Eclipse发布漏洞利用代码。
Ethan Mollick评测了Mythos级别的AI模型Claude 5 Fable的早期访问版,认为相比之前的模型,这是一个重大飞跃,能够通过单条提示生成复杂的游戏、学术论文和地图,暗示人机交互方式的转变。
Claude Fable 5 在 Artificial Analysis 智能指数上取得了 65 分。
Anthropic 今天发布 Mythos,同时还有一个被称为 Claude Fable 的阉割版本,价格为 Opus 的两倍,低于最初 Mythos 定价(Opus 的五倍)。
Hacker News 上的用户分享了他们对 Apple Vision Pro 的使用体验,有人称赞它日常作为虚拟显示器的便利,也有人吐槽反光、电池续航以及对佩戴眼镜用户的模糊问题。
Blaise v0.10.0 通过 QBE 增加了本地后端支持、线程功能和增量编译,推动这款现代 Object Pascal 编译器向自托管和更广泛的平台支持迈进。