@Hesamation: 还记得这个吗?20天前,SubQ声称已开发出一个拥有12M上下文窗口、比Opus便宜95%、且智能水平相当的模型……

X AI KOLs Timeline 新闻

摘要

SubQ声称开发了一款突破性模型,拥有12M上下文窗口,成本比Opus降低95%,但在承诺发布论文和模型卡后却未兑现,引发了对是否骗局或不当行为的强烈怀疑。

还记得这个吗?20天前,SubQ声称已开发出一款拥有12M上下文窗口、比Opus便宜95%、且智能水平相同的模型。 他们承诺“下周”发布论文和模型卡。那是10天前的事。结果什么也没有。 发布后唯一的更新是Appen的第三方评估,其中提到通过Subquadratic API进行评估,并未获得模型权重,这很正常,但算不上什么证据。 如果这不是骗局(到目前为止它已经触发了所有明显的骗局警示信号),那也极其可疑。你不能一边做出革命性的研究声称,一边又像在YC启动帖中推销产品一样行事。 主要问题很简单:他们在向社区提供任何可评估的具体内容之前,利用突破性的声称来获取关注、信誉以及可能的投资者目光。与一个“AI实验室”应有的研究发布方式相比,非常不专业。
查看原文
查看缓存全文

缓存时间: 2026/05/27 07:20

还记得这个吗?20天前SubQ宣称开发了一个拥有1200万上下文窗口的模型,比Opus便宜95%,且智能水平相同。

他们承诺“下周”发布论文和模型卡。那是10天前的事了。结果?什么都没发。

这个发布之后唯一的更新是Appen进行的第三方评估,其中提到他们通过Subquadratic API进行了评估,并未收到模型权重——这还算正常,但算不上什么证据。

如果这不是骗局(目前已经集齐了所有明显的骗局警示标志),那也非常可疑。你不可能一边做出革命性的研究宣称,一边还表现得像在YC发布贴里做推销。

核心问题很简单:他们利用突破性宣称来获取关注、信誉,很可能还有投资者的目光,却未向社区提供任何实质性的评估材料。与一个“AI实验室”发布研究成果应有的专业态度相比,这非常不专业。

Alexander Whedon (@alex_whedon): 介绍SubQ——LLM智能领域的重大突破。

这是首个基于完全次二次稀疏注意力架构(SSA)构建的模型,

也是首个拥有1200万token上下文窗口的前沿模型,其性能表现为:

  • 在100万token规模下,比FlashAttention快52倍,

相似文章

为什么每个“上下文层”工具都在谎报token节省量?

Reddit r/AI_Agents

作者批评了新兴的上下文层和MCP优化器工具缺乏透明的基准测试,这些工具承诺大幅节省token,但实际测试却无法复现其声称的效率。他们敦促开发者要求公开、可复现的基准测试,并寻求真正能提供可衡量结果的工具推荐。

@no_stp_on_snek: https://x.com/no_stp_on_snek/status/2052833502475833384

X AI KOLs Following

使用 Qwen2.5-32B-Instruct 搭配 longctx 和 vllm-turboquant 的单个 AMD MI300X 开源技术栈,在 MRCR v2 百万级上下文基准测试中取得了与 SubQ 闭源模型(0.659)相竞争的结果(0.601-0.688),表明开源权重方法已接近达到同等水平。