全部文章,按抓取时间从新到旧排列。
Santiago (@svpino) 强调 MiniMax-M2.7,一个 230B 参数的开源权重模型,能与 Opus 4.6 和 GPT-5.4 等顶级专有模型相抗衡,在 SambaNova 上以低成本实现 440+ tokens/s 的推理速度。
Openclaude v0.11.0 已发布,提供免费的前沿级 LLM,可通过 OpenGateway 访问,无需 API 密钥或注册。
一篇关于 Agent hooks 的教程,它通过自定义控制扩展框架和 CLI,实现确定性行为,而无需依赖提示指令。
Eric Jang发布了AutoGo,一个从零实现AlphaGo的教程,包含代码和一个可对弈的机器人,展示了前沿能力现在可以低成本复现。
Steven Brunton 宣布他的新书 'Optimization: A Bootcamp for Machine Learning, Inverse Problems, and Control',现已开放预订,并配套提供免费PDF、YouTube视频和Python代码。
OpenAgents 是一个开放平台,用于在日常生活中使用和托管语言智能体,提供数据分析、插件和网页浏览等智能体功能,并开放代码和演示。
一个基于Claude Code构建的新工具,可以通过导航每个屏幕、测试流程、读取调试日志,并从单个提示生成结构化漏洞报告,来实现iOS应用的自主测试。
用户分享在Mac上通过不同量化方法(Unsloth Q5、MLX 6bit + DFlash、MTPLX 4bit)优化Qwen3.6-27B推理速度的经验,最终达到43 tok/s。
担任亚马逊CEO五年之际,安迪·贾西大力投资AI基础设施,投入数十亿美元与OpenAI和Anthropic建立合作,同时削减成本并取悦华尔街,引领公司度过他所说的最大挑战。
Slash Financial 推出 Twin,这是一个 AI 智能体,可以自主从企业账户发起支付,随着自主商业的发展,引发了责任和数据控制方面的担忧。
一种新型AI工具通过生成代码来创建3D物体,从而得到具有独立功能部件的物体,而非单一实心块。该工具免费开源,托管于GitHub。
四家学生创立的AI初创公司在康奈尔科技创业奖中各获得10万美元投资,涉及AI考试作弊检测、金融AI安全、医疗设备监管及自动合同推理等领域。
OpenAI 进行重组,任命联合创始人 Greg Brockman 为产品策略常任负责人,并将 ChatGPT、Codex 及其 API 合并为一个统一的产品团队。这是潜在 IPO 前更广泛领导层调整的一部分。
一位开发者成功在Apple MacBook Air M5上使用MLX、turboquant和自定义内核运行了Gemma4 26b MoE,实现了比llama.cpp更快的提示处理和生成速度,且内存占用更低。实现方式包括本地部署说明。
一种使用Qwen-35B-A3B动态分配计算预算给困难问题的方法,在HLE基准测试上达到了接近GPT-5.4-xHigh的性能。
介绍Orthrus,一种在冻结的自回归Transformer中注入可训练的扩散注意力模块的方法,在MATH-500上实现高达7.8倍每前向传播token数和约6倍实际时间加速,且输出分布与基础Qwen3-8B模型可证明一致。该方法仅需极少的额外参数和训练,并避免了外部草稿模型带来的TTFT惩罚。
Zulip 通过捐赠 Kandra Labs 转型为非营利基金会,确保长期可持续性和独立性。创始人 Tim Abbott 退居二线,与三名高级团队成员一同加入 Anthropic。
Arthur Pastel 优化了 Rust image-rs crate 中的 fast_blur 函数,通过使用盒式模糊近似实现更快速的高斯模糊效果,在处理 u8 图像时速度提升最高达 5.9 倍。