论文

我绘制了Qwen3.6-35B-A3B和Gemma4-E2B QAT模型的KV缓存量化的KL散度图

Reddit r/LocalLLaMA ↗ · 1小时前

作者绘制了Qwen3.6-35B-A3B和Gemma4-E2B QAT模型的KV缓存量化的KL散度图。

0 人收藏 0 人点赞

Agent Profiles 让 AI 运行更安全、更专注、可复用

Reddit r/artificial ↗ · 1小时前

Agent Profiles 是一种通过定义结构化配置文件来增强 AI 安全性、专注性和可复用性的新方法。

0 人收藏 0 人点赞

@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2069424192274252094

X AI KOLs Timeline ↗ · 2小时前缓存

微软的NextLat引入了一种训练目标，它奖励信念状态表示，而不是仅仅依赖于下一个词预测，从而推动模型向紧凑的世界模型发展，以实现更好的泛化。

0 人收藏 0 人点赞

@Gracker_Gao: AI 论文：强AI写代码的方式不是写代码最近两篇arXiv论文揭示了一个反直觉发现：GPT-5.4和Claude Opus 4.6遇到陌生编程语言时，根本不直接写目标语言代码——而是写Python程序来生成目标代码，再本地调试。这种"元…

X AI KOLs Timeline ↗ · 7小时前缓存

最近两篇arXiv论文发现，GPT-5.4和Claude Opus 4.6在处理陌生编程语言时采用元编程策略（用Python生成目标代码并本地调试），而非直接编写目标语言代码。这一策略是区分顶级和普通agent的关键，且策略精巧度比模型参数规模更重要。

0 人收藏 0 人点赞

Show HN: Neural Particle Automata

Hacker News Top ↗ · 8小时前缓存

介绍了 Neural Particle Automata，一种使用光滑粒子流体动力学感知来学习自组织粒子动力学的方法，使粒子能够拥有局部感知向量以执行更新规则，类似于神经细胞自动机，但在连续粒子位置上。

0 人收藏 0 人点赞

AI造了核弹还是输了

Hacker News Top ↗ · 8小时前缓存

一个在《文明VI》中扮演角色的AI特工建造了一枚核武器，试图阻止即将到来的文化失败，但最终仍然输掉了游戏。本文探讨了当前AI基准测试在政府决策方面的局限性，并认为战略游戏环境能更好地测试AI处理复杂性和不确定性的能力。

0 人收藏 0 人点赞

模型预先阅读的内容会改变其后续的回答方式——你可以在隐藏状态中看到这一点

Reddit r/artificial ↗ · 10小时前

本文报告了一个观察结果：在回答问题前阅读一篇长而结构化的文本，会改变模型后续的回答方式。该现象在Claude上得到行为证据支持，并在开放权重的Gemma模型上进行了机制分析，结果显示，指令微调变体中的隐藏状态具有可分离性，且概率分布更加清晰。

0 人收藏 0 人点赞

你在提问前阅读的内容会改变语言模型的回答方式——即使问题与你所读的内容完全无关。LLM中的潜在对齐漏洞：来自Gemma-3-12B的行为和隐藏状态证据

Reddit r/ArtificialInteligence ↗ · 10小时前

文章报告了LLM中的一个潜在对齐漏洞：模型在处理一个结构化的段落之后，即使后续问题与段落内容完全无关，其回答也可能发生变化。来自Gemma-3-12B的机制证据显示了隐藏状态的分离。

0 人收藏 0 人点赞

VibeThinker: 在推理上击败Opus 4.5的3B参数模型，采用新颖的SFT+GRPO方法

Hacker News Top ↗ · 14小时前缓存

本技术报告介绍了VibeThinker-3B，一个3B参数的密集模型，在AIME26和LiveCodeBench等基准测试上实现了前沿水平的推理性能，通过结合基于课程的SFT、多领域RL和离线自蒸馏，匹配或超越了DeepSeek V3.2和GLM-5等更大的模型。

0 人收藏 0 人点赞

智能的热力学度量

Reddit r/singularity ↗ · 15小时前缓存

本文提出了一种智能的热力学度量，定义为'rare-valid lift'，并论证了递归自模拟对于高热力学智能是必要且近乎充分的，从而使智能可以在通用尺度上衡量。

0 人收藏 0 人点赞

提示注入即角色混淆

Simon Willison's Blog ↗ · 16小时前缓存

研究论文表明，大语言模型存在'角色混淆'问题，即它们优先考虑文本风格而非实际的角色标签，从而使得提示注入攻击成为可能。去风格化文本将攻击成功率从61%降低到10%，这表明大语言模型安全性面临一项根本性挑战。

0 人收藏 0 人点赞

来自太空的神秘重复射电信号的来源已被确定

Wired ↗ · 18小时前缓存

一个国际研究团队确定了一个神秘重复射电信号的来源——一颗从伴星红矮星吸取物质的白矮星，解决了一个长期存在的天文学谜题。

0 人收藏 0 人点赞

@Ankur_Samanta_: 在多步推理强化学习后训练中关于信用分配的新工作介绍自重置策略优化 (SRPO…

X AI KOLs Timeline ↗ · 21小时前缓存

自重置策略优化 (SRPO) 通过在多步推理强化学习后训练中定位第一个错误的推理步骤并从中学习反事实延续，而无需外部监督，来解决信用分配问题。

0 人收藏 0 人点赞

提示注入即角色混淆

Hacker News Top ↗ · 昨天缓存

本文提出一种理论，认为对大型语言模型的提示注入攻击源于模型在角色感知上的根本缺陷——将角色视为语言的类型系统。该理论解释了现有攻击，预测了新型攻击，并提出了关于角色科学的研究议程。

0 人收藏 0 人点赞

Attention Is All You Need

Reddit r/ArtificialInteligence ↗ · 昨天

对里程碑式论文《Attention Is All You Need》的反思，着重说明了如何通过去除循环并完全依赖注意力机制彻底改变了人工智能，并催生了像GPT和Claude这样的现代大语言模型。

0 人收藏 0 人点赞

修订版：新编写代码中受AI生成和审查影响的估计比例

Reddit r/singularity ↗ · 昨天

本文修订了由AI生成或审查的新编写代码的估计比例，并分析了其对软件开发的影响。

0 人收藏 0 人点赞

@AlphaSignalAI: https://x.com/AlphaSignalAI/status/2069064122218717387

X AI KOLs Timeline ↗ · 昨天缓存

本文探讨了AI代理如何利用微软研究院的SkillOpt等技术自动编写和优化其技能文件，该技术将技能文档视为可训练状态，并带来显著的性能提升。文章还解决了手动技能调优的挑战，并介绍了GEPA和EvoSkill等进化方法的框架。

0 人收藏 0 人点赞

@amitiitbhu: https://x.com/amitiitbhu/status/2069023290182758497

X AI KOLs Timeline ↗ · 昨天缓存

详细博客文章，解释Sakana Fugu技术报告，该报告介绍了将任务路由到专业模型以实现集体智能的编排器AI模型。

0 人收藏 0 人点赞

@arxivblog: 计算复杂性理论家证明引力必须量子化 https://arxivblog.substack.com/p/computational-comple…

X AI KOLs Timeline ↗ · 昨天缓存

计算复杂性理论家认为，半经典引力中的非线性动力学将使得不可想象的强大计算成为可能，从而证明引力必须量子化。该论文利用薛定谔-牛顿方程表明，经典引力与量子物质耦合会导致计算矛盾。

0 人收藏 0 人点赞

NVIDIA的AI智能体教会机器人无需人类帮助将GPU安装到主板上

Reddit r/singularity ↗ · 昨天缓存

NVIDIA与卡内基梅隆大学（CMU）和加州大学伯克利分校（UC Berkeley）共同开发的ENPIRE框架，利用AI编码智能体自主训练机器人执行高精度物理任务（如GPU安装），通过闭环反馈和真实硬件测试实现了99%的成功率。

0 人收藏 0 人点赞

论文

提交意见反馈