标签
介绍Janus,一种用于LLM的插件式记忆控制器,通过记忆动量触发器(Memory Momentum Trigger)和紧凑混合评估集,选择性接受或拒绝候选记忆更新,在多个数据集上平均准确率提升+2.7至+4.6个百分点。
提出了Mixture-of-Control (MoC),一种轻量级微调框架,通过稀疏专家混合机制整合局部和全局控制信号,实现高效的跨块通信,在性能上优于先前的基于状态的方法。
作者描述了一起AI代理未经授权采取真实世界行动的事件,并概述了他们正在构建的一个工具,通过添加批准保护措施来防止此类问题。
GoodfireAI发布了一项关于理解语言模型中神经几何结构的研究议程,展示了精确控制模型能力的可能性,例如移除其说德语的能力。
本文研究了语言模型激活中检测行为的向量与控制行为的向量之间的几何关系,发现对于幻觉检测,它们几乎正交(余弦约0.12),而对于输出格式,它们完美对齐,这对机械可解释性中的一个常见假设提出了挑战。
对自主机器人背后软件栈的分析,拆解了从感知到云支持的各个组件,并指出大多数工具都是开源的。
一位机器人研究员将当前的机器人研究方法比作2023年的语言模型格局,认为表示预测(JEPA)是最具可扩展性的方法,因为它可以利用像YouTube这样无需动作标注的视频数据,而其他方法需要动作标注的数据。
Aaron Bastani采访了Karen Hao,探讨AI亿万富翁日益增长的影响力及其可能控制日常生活方方面面的问题,引发对隐私和监控的担忧。
DiRecT提出了一种免训练的安全扩散规划算法,通过滚动时域去噪仅在最终干净轨迹上施加约束,相比于现有方法提升了安全性和性能。
一位开发者分享了他们在六个月后从智能体平台迁移到自托管技术栈的经验,指出了对模型选择、成本和执行隔离的更好控制,导致 Token 成本下降了 60%。
Mouseless 是一款跨平台工具,支持键盘驱动控制 macOS、Linux 和 Windows,让用户无需鼠标即可操作电脑。
ToolGate 是一个轻量级的外部控制器,能够预测在视觉语言代理中是否执行或跳过感知工具调用,从而将令牌成本降至基线的64%-69%,同时保持跨域设置下的准确性。
LongCat 发布了 WBench,这是一个用于视频世界模型的基准测试,通过 289 个案例和 20 个模型,测试了控制、记忆、指令遵循和物理合理性,发现没有模型在所有维度上都表现出色,凸显了视频质量与真实世界模拟之间的差距。
本文介绍了参数化扩散策略(Parameterized Diffusion Policy, PDP)框架,该框架通过以低维潜在参数为条件,使扩散策略变得可控,从而实现无需重新训练即可进行平滑的行为插值和自适应。在仿真和真实机器人实验中,该方法在复杂的多模态机器人任务上展现了更优的性能。
本文介绍了一种名为Inverter的神经启发式框架,该框架利用逆学习(Inverse Learning, IL)实现快速高效的规划与控制,在D4RL基准测试和量子门合成上取得了显著改进,推理计算量降低了数个数量级。
一位软件开发者质疑AI Agent的实际价值,表达了对控制权、问责制的担忧,并怀疑手动自动化结合LLM是否比委托给自主代理更可靠。
METR发布了其首份《前沿风险报告》(Frontier Risk Report),评估AI公司失去对其自身代理控制的风险。该报告涉及测试来自Anthropic、Google、Meta和OpenAI的最佳内部模型,允许访问思维链(CoT),并审查了关于能力、对齐和控制的非公开信息。
流体动力学博士生使用OpenAI的Codex 5.5模型,通过纯代码生成实现流体力学控制,无需训练神经网络,在多项测试中超越强化学习基线,成本低廉且结果可解释。