@rohanpaul_ai: 冻结的LLM在其隐藏状态深处仍携带可读的行为信号。Proprioceptive AI已创建了Cy…
摘要
Proprioceptive AI发布了Cygnus,这是一款为冻结的LLM配备自感知适配器的工具,通过gl(4,R)李代数读取内部隐藏状态以隔离暗模式,将Qwen-32B在ARC-Challenge上的分数从82.2%提升到94.97%,仅使用一张RTX 3090且无需重新训练。
冻结的LLM在其隐藏状态深处仍携带可读的行为信号。Proprioceptive AI创建了Cygnus,让LLM能够感知自身的内部思维模式,从而显著提高准确性。这使得Qwen-32B在ARC-Challenge上的分数从82.2%跃升至94.97%,仅需一张RTX 3090。因此,Cygnus为冻结的LLM配备了自感知适配器,能够读取其内部认知几何结构。这些适配器将隐藏状态投射到由gl(4,R)李代数定义的数学空间中,以隔离暗模式。那些暗模式包含了被标准归一化抹去的大部分与准确率相关的信号。这种设计带来了显著的基准性能提升,且无需任何模型再训练。令人惊叹的是,对激活几何结构的数学洞察能够在不进行完整再训练的情况下提高可靠性。他们目前在其droplet上支持多达50,000名并发用户。
相似文章
@leopardracer: https://x.com/leopardracer/status/2055341758523883631
一位用户分享了他们搭建双GPU本地AI实验室的经验,使用了RTX 4080 Super和5060 Ti,通过llama.cpp和llama-swap运行Qwen 3.6模型,以降低API成本并实现无限制的实验。
PYTHALAB-MERA:面向冻结LLM代码代理的验证驱动记忆、检索与接受控制
本文介绍了 PYTHALAB-MERA,这是一种用于冻结本地大语言模型(LLM)的外部控制器,通过基于验证的记忆和检索机制来提升代码代理的性能。与自我修正基线方法相比,该方法利用执行反馈和时间差分学习,在严格验证任务中展现出更高的成功率。
@BlinkDL_AI: RWKV-7 G1g 已发布:世界上最好的纯 RNN 大型语言模型,并且在整体上具有竞争力。尝试 https://huggingface.co/spaces/…
BlinkDL 宣布了 RWKV-7 G1g,一种纯 RNN 大型语言模型,声称是其同类中最好的,且与通用 LLM 竞争,在单个 RTX 5090 上具有高速推理性能。
@edandersen: 中国又发布了一个开源编程AI大模型“Ornith”。35B版本可在大型GPU上本地运行,在我使用场景中击败了Qwen3.6……
中国发布了一个名为Ornith的开源编程AI大模型,35B版本击败了Qwen3.6,397B版本基准测试接近Claude Opus 3.7。
@DeRonin_: 我目前的本机AI配置:- 2x DGX Spark 链接 (256gb) > GLM 5.2 @ 2bit, 推理 + 代理循环 - Mac Studio M3 Ultr…
一位用户描述了他们完全本地的AI堆栈,使用多个硬件设备运行GLM、Qwen和Kimi等中国模型,声称相比GPT-5.5和Opus 4.8等前沿模型节省了87%的成本,同时提到了自托管视频生成的计划。