Do you guys think subquadratic actually has a 12 million context model
摘要
Sub Quadratic 声称拥有 1200 万 token 上下文的模型,但仅限合作伙伴访问;在“大海捞针”测试中表现出色,但缺乏一般推理能力的证据,引发质疑。
暂无内容
查看缓存全文
缓存时间: 2026/06/18 03:31
### TL;DR
一家名为 Sub Quadratic 的 AI 公司宣称发布了一个拥有 1200 万 token 上下文窗口的模型,但实际产品仅限合作伙伴访问,“大海捞针”检索任务表现出色,但这与模型在实际推理任务中的能力相去甚远,目前声称的可投入生产版本尚未公开。
## 1200 万 token 意味着什么?
如果这一宣称属实,这将是长上下文 AI 领域最大的飞跃。一本书平均约有 10 万个 token,GPT-5.4 在百万 token 级别可容纳约 10 本书。而 1200 万 token 能装下约 **120 本书**,几乎是一个小型图书馆的数据量,或者整个公司的代码库。在这样的规模下,压缩上下文已经变得无关紧要。
## 疑点:又是同样宣称,且无人能用
这并非 Sub Quadratic 第一次抛出 1200 万上下文。几个月前他们就曾做出类似宣称,但访问受限、证据不足,引发广泛质疑。现在,Sub Q 1.1 再次以同样的 1200 万上下文窗口回归,但公开可用的只有 SubQ 1 Million Preview 模型。更大版本(从 200 万到 1200 万上下文)仅面向少数早期合作伙伴,未来才会推出。这与“已准备好投入生产的 1200 万 token 巨兽”相去甚远。
## 核心技术:智能稀疏注意力(SSA)
传统语言模型的主要瓶颈在于注意力机制的计算量随上下文长度呈**二次方增长**。DeepSeek 的稀疏注意力虽能降低计算量,但本质上仍为二次方。线性注意力曾被提出但质量太差。Sub Quadratic 声称其 SSA 方法实现了**线性计算成本**,且注意力质量与常规注意力相当。其论文宣称在 1200 万上下文下,效率比 DeepSeek 稀疏注意力高出 **191 倍**。
## 第三方评估:Appen 报告
Sub Quadratic 并非空口无凭。他们发布了技术论文和方法,并由第三方评估机构 **Appen** 进行了长上下文检索测试。Appen 报告称,在 **“大海捞针”**(needle-in-a-haystack)测试中,该模型在 1200 万上下文中展现出**近乎完美的检索能力**。这支持了他们“能从 1200 万 token 中检索植入事实”这一较窄的宣称。
## 关键问题:检索 ≠ 推理
最大的警告在于:“大海捞针”是最简单、最轻松的长上下文任务之一。模型从中提取一个孤立事实与在 1200 万 token 上进行推理是两码事。即使当前闭源模型(如 GPT-5.5 和 Claude-4.8)在接近百万 token 时,质量也会明显下降,更不用说 1200 万 token。Sub Quadratic 没有提供任何证据表明他们的模型能在 1200 万上下文上处理一般推理、编码或实际大型任务。
## 混淆的两个宣称
Sub Quadratic 在公开材料中混合了两个不同的宣称:
- **宣称一**:模型能在 1200 万上下文中检索植入事实。这个宣称似乎合理,并有第三方证据支撑。
- **宣称二**:他们拥有一个可投入生产的 1200 万上下文模型,能进行一般推理、编码并处理巨大的实际问题。这个宣称**几乎没有证据支持**。
## 最终判断
Sub Quadratic 值得关注,但宣称过于夸大。他们拥有一个能通过 1200 万 token “大海捞针”测试的模型可能性较高,但同一个模型能在 1200 万 token 上准确推理的可能性则非常低。真正的验证还需等到独立用户能够大规模测试或其它公司能复现其结果。
---
Source: [FusionCow - Do you guys think subquadratic actually has a 12 million context model](https://www.youtube.com/watch?v=qaPdHmkGDgo)
相似文章
subquadratic 声称的 1200 万上下文模型的说法可信吗?
该视频探讨了 subquadratic 研究所声称的 1200 万上下文模型是否可信,分析了其技术基础及潜在局限性。
Subquadratic AI 推出 SubQ-1.1-Small,一款采用 Smart Sparse Attention 的新模型
Subquadratic AI 推出 SubQ-1.1-Small,该模型利用 Smart Sparse Attention 在长达 1200 万 token 的上下文中实现近乎完美的长上下文检索,注意力计算量减少高达 1000 倍。它兼顾了长上下文优化与强大的通用推理能力,在 NIAH 和 RULER 等基准测试中优于基线模型。
@Hesamation: 还记得这个吗?20天前,SubQ声称已开发出一个拥有12M上下文窗口、比Opus便宜95%、且智能水平相当的模型……
SubQ声称开发了一款突破性模型,拥有12M上下文窗口,成本比Opus降低95%,但在承诺发布论文和模型卡后却未兑现,引发了对是否骗局或不当行为的强烈怀疑。
@sanbuphy: K2.6 成功在 Mac 本地下载并部署了 Qwen3.5-0.8B 模型,通过使用小众 Zig 语言实现并优化模型推理,证明了新模型的泛化能力。经过 4,000 多次工具调用,超过 12 小时的不间断运行,K2.6 模型共迭代了 14 …
K2.6在Mac本地成功部署Qwen3.5-0.8B模型,使用Zig语言实现推理优化,经过14轮迭代将吞吐量从约15 tokens/s提升至约193 tokens/s,比LM Studio快20%。
Deepseek V4的百万上下文窗口:临界点
对Deepseek V4在多个生产代码库上的百万token上下文窗口的详细评估显示,在150-250k token时性能最佳,超过300k后性能下降,推理模式下延迟显著。该模型在未知任务上表现出较高的幻觉率,生产环境中需要验证层。