control-theory

#control-theory

基于约束流形控制的安全且可泛化的分层多智能体强化学习

arXiv cs.AI ↗ · 2026-06-24 缓存

本文提出了一种分层多智能体强化学习框架，该框架通过低层的约束流形强制执行硬安全约束，同时通过高层策略学习实现有效协调，提供了理论上的安全保障，并实现了近乎完美的安全率和良好的泛化能力。

0 人收藏 0 人点赞

#control-theory

X AI KOLs Timeline ↗ · 2026-06-19 缓存

该推文讨论了将个人工作流程（包括拆解方式、验证规则、输出格式等）打包成可复用Skill的理念，认为这种自我进化的Compounding Loop符合控制论原则，是长期关键能力。

0 人收藏 0 人点赞

#control-theory

X AI KOLs Timeline ↗ · 2026-06-16 缓存

一条推文强调了对Kubernetes的精彩介绍，并引用了Fatih Arslan关于控制理论和反馈循环的文章，这些理论用于构建能够自我修复、弹性伸缩、可扩展数千个数据库的系统。

0 人收藏 0 人点赞

#control-theory

Hacker News Top ↗ · 2026-05-26 缓存

一篇论文的注释版，展示仅含两个神经元的简单神经网络即可控制自行车，强调了稳定运动所需的最小条件。

0 人收藏 0 人点赞

#control-theory

arXiv cs.AI ↗ · 2026-05-14 缓存

本文运用控制理论证明，一旦系统的影响超出有限外部控制所能抵消的范围，外部强制的AI安全策略将在结构上失败，而任何剩余的可行策略必须是内在的，并满足特定的结构性要求。

0 人收藏 0 人点赞

#control-theory

arXiv cs.LG ↗ · 2026-05-11 缓存

本文提出了一种利用时序自注意力进行元控制的架构，旨在对具有不可观测记忆状态的欧拉-拉格朗日系统进行自适应控制。在2自由度机械臂上的实验表明，该方法在追踪性能上优于基线方法，同时揭示了在长记忆机制下的失效模式。

0 人收藏 0 人点赞

#control-theory

arXiv cs.LG ↗ · 2026-05-11 缓存

本文介绍了 SHAPE，这是一种针对固定预算非凸优化的结构化自适应端口哈密顿优化器，它利用事件触发机制来平衡下降、探索和预算分配。

0 人收藏 0 人点赞