SubQ的创建者宣布,SSA突破获得了压倒性的反响,并计划下周发布包含更多数据和第三方验证的模型卡。
DeepMind 强调了 AlphaEvolve(一款由 Gemini 驱动的编码代理)影响力的扩展,展示了其在基因组学、电网优化、地球科学、量子物理学和数学等领域优化算法的能力。
BACH作为视频生成领域的一项重大突破被引入,实现了前所未有的角色一致性,跨场景时不会出现面部变形或漂移。
OpenAI 宣布推出 GPT-5.5-Cyber,并扩展可信网络访问(TAC),为经过验证的防御者提供专业的网络安全能力,同时严格防范滥用风险。
OpenAI 在 API 中发布了三款全新语音模型:具备高级推理能力的 GPT-Realtime-2、支持实时多语言翻译的 GPT-Realtime-Translate,以及用于流式转录的 GPT-Realtime-Whisper,旨在实现更自然、更具行动力的语音应用。
Dianne Penn概述了未来Claude模型的三个关键关注领域:增强的判断力和代码质量、实际上无限的带有记忆的上下文窗口,以及多智能体协调能力。
Jackrong 发布 Qwopus3.6-35B-A3B-v1,基于阿里巴巴 Qwen3.6 MoE 模型的推理增强微调版本,针对逻辑推理和智能体编程优化,拥有 350 亿总参数和 30 亿激活参数。
MolmoAct 2 是由 Allen Institute for Artificial Intelligence 开发的开源机器人模型,能够在执行动作前进行三维空间推理。
OpenAI 发布 GPT-5.5 Instant 系统卡,这是首个在网络安全以及生物/化学安全领域被视为高能力的 Instant 模型,并配备了相应的安全保障措施。
IBM 在 Apache 2.0 许可下发布了 Granite 4.1 系列 LLM,Simon Willison 尝试使用该 3B 模型的 21 种不同量化变体生成骑自行车的鹈鹕 SVG 图像。
Zyphra 发布了 ZAYA1-8B,这是一款拥有 84 亿参数的混合专家模型(Mixture-of-Experts),其中活跃参数为 7.6 亿。该模型在数学和代码推理任务中展现出极高的效率与卓越的性能。
Allen AI 发布了 MolmoAct2,这是一款专为真实场景机器人部署设计的开放权重视觉-语言-动作模型,具备新数据集、开放动作分词器以及自适应推理以降低延迟等特性。
GPT-5.5 在基准测试中达到新水平但存在幻觉问题;Kimi K2.6 领先开源大语言模型;同时探讨 AI 对气候承诺的影响以及大语言模型的战略思维。
Simon Willison 评估了 OpenAI 的 GPT-5.5 在网络任务中的表现,考察了其在网络安全领域的能力。
Google DeepMind 宣布启动 AI 联合临床医生研究计划,旨在通过"三方协同诊疗"改善医疗服务——即 AI 智能体在医生监督下协助患者。该系统在一项初级医疗咨询研究中展现出高准确率且零严重错误,表现优于现有循证综合工具。
Z-lab 发布了 DFlash,这是一种用于 Gemma-4-31B-it 的投机解码草稿模型,采用轻量级块扩散并行生成多个 token,相较于自回归基线实现了最高 5.8 倍的加速。
本文介绍了 TenStrip/LTX2.3-10Eros,这是一款托管在 Hugging Face 上的微调 AI 视频模型,旨在提升图像到视频生成的效果及对提示词的遵循度。文章提供了有关文件格式、与 ComfyUI 节点的兼容性以及实现最佳效果的特定提示词策略等技术细节。