control-theory

标签

Cards List
#control-theory

基于约束流形控制的安全且可泛化的分层多智能体强化学习

arXiv cs.AI · 2026-06-24 缓存

本文提出了一种分层多智能体强化学习框架,该框架通过低层的约束流形强制执行硬安全约束,同时通过高层策略学习实现有效协调,提供了理论上的安全保障,并实现了近乎完美的安全率和良好的泛化能力。

0 人收藏 0 人点赞
#control-theory

@Phoenixyin13: 不是暴论,这套自我进化的 Compounding Loop 才是长期杀手级。 现在,根据这篇文章,每个人要习惯让自己的整个流程,包括拆解方式、验证规则、输出格式、你的偏好打包成一个可复用的Skill。这将是来自未来的能力。 下次遇到类似任…

X AI KOLs Timeline · 2026-06-19 缓存

该推文讨论了将个人工作流程(包括拆解方式、验证规则、输出格式等)打包成可复用Skill的理念,认为这种自我进化的Compounding Loop符合控制论原则,是长期关键能力。

0 人收藏 0 人点赞
#control-theory

@BenjDicken: 对Kubernetes的精彩介绍。没有它,需要处理100种复杂性和边缘情况。有了它,你就有…

X AI KOLs Timeline · 2026-06-16 缓存

一条推文强调了对Kubernetes的精彩介绍,并引用了Fatih Arslan关于控制理论和反馈循环的文章,这些理论用于构建能够自我修复、弹性伸缩、可扩展数千个数据库的系统。

0 人收藏 0 人点赞
#control-theory

只需两个神经元即可骑自行车

Hacker News Top · 2026-05-26 缓存

一篇论文的注释版,展示仅含两个神经元的简单神经网络即可控制自行车,强调了稳定运动所需的最小条件。

0 人收藏 0 人点赞
#control-theory

维持AI安全:控制理论的外部不可能性、内在必要性及结构性要求

arXiv cs.AI · 2026-05-14 缓存

本文运用控制理论证明,一旦系统的影响超出有限外部控制所能抵消的范围,外部强制的AI安全策略将在结构上失败,而任何剩余的可行策略必须是内在的,并满足特定的结构性要求。

0 人收藏 0 人点赞
#control-theory

用于具有不可观测记忆状态的欧拉-拉格朗日系统自适应控制的时序注意力

arXiv cs.LG · 2026-05-11 缓存

本文提出了一种利用时序自注意力进行元控制的架构,旨在对具有不可观测记忆状态的欧拉-拉格朗日系统进行自适应控制。在2自由度机械臂上的实验表明,该方法在追踪性能上优于基线方法,同时揭示了在长记忆机制下的失效模式。

0 人收藏 0 人点赞
#control-theory

当下降过于稳定时:用于优化的事件触发哈密顿学习

arXiv cs.LG · 2026-05-11 缓存

本文介绍了 SHAPE,这是一种针对固定预算非凸优化的结构化自适应端口哈密顿优化器,它利用事件触发机制来平衡下降、探索和预算分配。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈