@Hesamation: 还记得这个吗?20天前,SubQ声称已开发出一个拥有12M上下文窗口、比Opus便宜95%、且智能水平相当的模型……
摘要
SubQ声称开发了一款突破性模型,拥有12M上下文窗口,成本比Opus降低95%,但在承诺发布论文和模型卡后却未兑现,引发了对是否骗局或不当行为的强烈怀疑。
查看缓存全文
缓存时间: 2026/05/27 07:20
还记得这个吗?20天前SubQ宣称开发了一个拥有1200万上下文窗口的模型,比Opus便宜95%,且智能水平相同。
他们承诺“下周”发布论文和模型卡。那是10天前的事了。结果?什么都没发。
这个发布之后唯一的更新是Appen进行的第三方评估,其中提到他们通过Subquadratic API进行了评估,并未收到模型权重——这还算正常,但算不上什么证据。
如果这不是骗局(目前已经集齐了所有明显的骗局警示标志),那也非常可疑。你不可能一边做出革命性的研究宣称,一边还表现得像在YC发布贴里做推销。
核心问题很简单:他们利用突破性宣称来获取关注、信誉,很可能还有投资者的目光,却未向社区提供任何实质性的评估材料。与一个“AI实验室”发布研究成果应有的专业态度相比,这非常不专业。
Alexander Whedon (@alex_whedon): 介绍SubQ——LLM智能领域的重大突破。
这是首个基于完全次二次稀疏注意力架构(SSA)构建的模型,
也是首个拥有1200万token上下文窗口的前沿模型,其性能表现为:
- 在100万token规模下,比FlashAttention快52倍,
相似文章
@no_stp_on_snek: https://subq.mildlyconcerning.com
本文批判性地分析了subQ长上下文AI技术的声明和时间线,指出了原始公告中的不一致之处和撤回内容。
为什么每个“上下文层”工具都在谎报token节省量?
作者批评了新兴的上下文层和MCP优化器工具缺乏透明的基准测试,这些工具承诺大幅节省token,但实际测试却无法复现其声称的效率。他们敦促开发者要求公开、可复现的基准测试,并寻求真正能提供可衡量结果的工具推荐。
我不信这个 27B 模型能碾压 Opus 4.5!谁来用真实 Agent 工作流验证一下?
一个 27B 参数的模型据称在基准测试中击败 Opus 4.5,引发社区质疑,大家呼吁用真实 Agent 工作流验证。
@no_stp_on_snek: https://x.com/no_stp_on_snek/status/2052833502475833384
使用 Qwen2.5-32B-Instruct 搭配 longctx 和 vllm-turboquant 的单个 AMD MI300X 开源技术栈,在 MRCR v2 百万级上下文基准测试中取得了与 SubQ 闭源模型(0.659)相竞争的结果(0.601-0.688),表明开源权重方法已接近达到同等水平。
@outsource_: 重大消息:QWOPUS 3.6 27B 已全面上线!SOTA QWEN 3.6 27b + Opus 来了!智能编码王者:75.25%(152/202)在……
Qwopus 3.6 27B 现已全面上线,这是一个融合模型(Qwen + Opus),在 SWE MMLU Pro 上实现了最先进的智能编码性能,达到 75.25%,支持 Q8 KV 缓存下的 303k token 上下文,在 Q5_K_M 量化下仅需 24GB VRAM 即可运行。