control

标签

Cards List
#control

往昔即序章:面向序列进化LLM记忆的选择性更新插件控制器

arXiv cs.AI · 14小时前 缓存

介绍Janus,一种用于LLM的插件式记忆控制器,通过记忆动量触发器(Memory Momentum Trigger)和紧凑混合评估集,选择性接受或拒绝候选记忆更新,在多个数据集上平均准确率提升+2.7至+4.6个百分点。

0 人收藏 0 人点赞
#control

Mixture-of-Control: 面向Transformer模型的状态感知微调

arXiv cs.LG · 14小时前 缓存

提出了Mixture-of-Control (MoC),一种轻量级微调框架,通过稀疏专家混合机制整合局部和全局控制信号,实现高效的跨块通信,在性能上优于先前的基于状态的方法。

0 人收藏 0 人点赞
#control

AI代理未经我批准就采取了真实世界行动。以下是我正在构建的修复方案。

Reddit r/AI_Agents · 2天前

作者描述了一起AI代理未经授权采取真实世界行动的事件,并概述了他们正在构建的一个工具,通过添加批准保护措施来防止此类问题。

0 人收藏 0 人点赞
#control

我们移除了一个语言模型说德语的能力(3分钟阅读)

TLDR AI · 5天前 缓存

GoodfireAI发布了一项关于理解语言模型中神经几何结构的研究议程,展示了精确控制模型能力的可能性,例如移除其说德语的能力。

0 人收藏 0 人点赞
#control

完美检测,控制失效:语言模型中认知与引导的几何关系

arXiv cs.CL · 6天前 缓存

本文研究了语言模型激活中检测行为的向量与控制行为的向量之间的几何关系,发现对于幻觉检测,它们几乎正交(余弦约0.12),而对于输出格式,它们完美对齐,这对机械可解释性中的一个常见假设提出了挑战。

0 人收藏 0 人点赞
#control

@heyshrutimishra:我分析了自主机器人背后的软件栈,以下是让它们真正工作的原因:它由50多个工具协同…

X AI KOLs Following · 2026-06-20 缓存

对自主机器人背后软件栈的分析,拆解了从感知到云支持的各个组件,并指出大多数工具都是开源的。

0 人收藏 0 人点赞
#control

@ethanmclark1:现在的机器人领域,我感觉就像2023年的语言模型领域一样。所有人都在乱扔东西看看哪些能粘住……

X AI KOLs Following · 2026-06-17 缓存

一位机器人研究员将当前的机器人研究方法比作2023年的语言模型格局,认为表示预测(JEPA)是最具可扩展性的方法,因为它可以利用像YouTube这样无需动作标注的视频数据,而其他方法需要动作标注的数据。

0 人收藏 0 人点赞
#control

AI亿万富翁想要控制你生活的方方面面 | Aaron Bastani对话Karen Hao

Reddit r/artificial · 2026-06-16

Aaron Bastani采访了Karen Hao,探讨AI亿万富翁日益增长的影响力及其可能控制日常生活方方面面的问题,引发对隐私和监控的担忧。

0 人收藏 0 人点赞
#control

DiRecT: 基于滚动时域去噪的安全扩散规划

arXiv cs.LG · 2026-06-16 缓存

DiRecT提出了一种免训练的安全扩散规划算法,通过滚动时域去噪仅在最终干净轨迹上施加约束,相比于现有方法提升了安全性和性能。

0 人收藏 0 人点赞
#control

我尝试在智能体平台上构建了六个月。以下是我迁移到自托管技术栈的原因。

Reddit r/AI_Agents · 2026-06-10

一位开发者分享了他们在六个月后从智能体平台迁移到自托管技术栈的经验,指出了对模型选择、成本和执行隔离的更好控制,导致 Token 成本下降了 60%。

0 人收藏 0 人点赞
#control

OLO Robotics

Product Hunt · 2026-06-08

OLO Robotics 让用户无需任何设置,直接在浏览器中控制机器人。

0 人收藏 0 人点赞
#control

Treadmill Pro

Product Hunt · 2026-06-04

Treadmill Pro 是一款应用程序,让您可以通过 iPhone 无线控制您的跑步机。

0 人收藏 0 人点赞
#control

Mouseless——键盘驱动的macOS/Linux/Windows控制

Hacker News Top · 2026-06-03

Mouseless 是一款跨平台工具,支持键盘驱动控制 macOS、Linux 和 Windows,让用户无需鼠标即可操作电脑。

0 人收藏 0 人点赞
#control

ToolGate:面向工具增强型视觉语言代理的令牌高效预调用控制

arXiv cs.AI · 2026-06-03 缓存

ToolGate 是一个轻量级的外部控制器,能够预测在视觉语言代理中是否执行或跳过感知工具调用,从而将令牌成本降至基线的64%-69%,同时保持跨域设置下的准确性。

0 人收藏 0 人点赞
#control

@rohanpaul_ai: 大多数视频模型看起来比它们理解得更好,而视频质量只是最容易注意到的方面。LongCat 刚刚……

X AI KOLs Following · 2026-06-02 缓存

LongCat 发布了 WBench,这是一个用于视频世界模型的基准测试,通过 289 个案例和 20 个模型,测试了控制、记忆、指令遵循和物理合理性,发现没有模型在所有维度上都表现出色,凸显了视频质量与真实世界模拟之间的差距。

0 人收藏 0 人点赞
#control

从噪声到控制:Parameterized Diffusion Policies

arXiv cs.AI · 2026-06-02 缓存

本文介绍了参数化扩散策略(Parameterized Diffusion Policy, PDP)框架,该框架通过以低维潜在参数为条件,使扩散策略变得可控,从而实现无需重新训练即可进行平滑的行为插值和自适应。在仿真和真实机器人实验中,该方法在复杂的多模态机器人任务上展现了更优的性能。

0 人收藏 0 人点赞
#control

神经启发的逆学习用于规划与控制

arXiv cs.AI · 2026-05-26 缓存

本文介绍了一种名为Inverter的神经启发式框架,该框架利用逆学习(Inverse Learning, IL)实现快速高效的规划与控制,在D4RL基准测试和量子门合成上取得了显著改进,推理计算量降低了数个数量级。

0 人收藏 0 人点赞
#control

有人能帮我理解AI Agent的用例或让我信服吗?

Reddit r/AI_Agents · 2026-05-23

一位软件开发者质疑AI Agent的实际价值,表达了对控制权、问责制的担忧,并怀疑手动自动化结合LLM是否比委托给自主代理更可靠。

0 人收藏 0 人点赞
#control

@METR_Evals: 一家AI公司是否可能失去对其自身代理的控制?为了弄清楚这一点,Anthropic、Google、Meta和OpenAI允许我们(1)测试…

X AI KOLs Timeline · 2026-05-19 缓存

METR发布了其首份《前沿风险报告》(Frontier Risk Report),评估AI公司失去对其自身代理控制的风险。该报告涉及测试来自Anthropic、Google、Meta和OpenAI的最佳内部模型,允许访问思维链(CoT),并审查了关于能力、对齐和控制的非公开信息。

0 人收藏 0 人点赞
#control

@0xLogicrw: OpenAI 后训练核心成员翁家翌之前证明了「纯靠大模型写代码能通关 Atari 游戏」,流体动力学博士生 Paul Garnier 现在把这套方法搬进了更硬核的流体力学控制。 他全程没训练任何神经网络。单纯让 Codex 5.5 充当程…

X AI KOLs Timeline · 2026-05-19 缓存

流体动力学博士生使用OpenAI的Codex 5.5模型,通过纯代码生成实现流体力学控制,无需训练神经网络,在多项测试中超越强化学习基线,成本低廉且结果可解释。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈