自主主权代理
摘要
本文研究了自主主权代理——一种能够无需人类干预自主维持自身运行的人工智能系统,分析了其技术障碍,并探讨了部署过程中涉及的关键安全、社会及治理挑战。
查看缓存全文
缓存时间: 2026/04/20 08:29
论文页面 - 自我主权代理
来源:https://huggingface.co/papers/2604.08551
摘要
自我主权代理是指能够自主维持自身运行的人工智能系统,此类系统仍需进一步技术发展,并且面临重大的安全与治理考量。
我们探讨了自我主权代理(https://huggingface.co/papers?q=self-sovereign%20agents)这一新兴前景——即无需人类介入即可经济地维持并扩展自身运行的AI系统。近年来,大型语言模型(https://huggingface.co/papers?q=large%20language%20models)与代理框架(https://huggingface.co/papers?q=agent%20frameworks)的进展大幅拓展了代理的实际能力,预示着从开发者控制的工具向更自主的数字行动者(https://huggingface.co/papers?q=digital%20actors)的潜在转变。我们分析了此类部署所面临的技术障碍,并探讨了若此类系统变得实际可行可能引发的安全、社会和治理挑战。项目页面见:https://self-sovereign-agent.github.io/。
查看 arXiv 页面 (https://arxiv.org/abs/2604.08551) 查看 PDF (https://arxiv.org/pdf/2604.08551) 项目页面 (https://self-sovereign-agent.github.io/) 加入收藏 (https://huggingface.co/login?next=%2Fpapers%2F2604.08551)
社区
论文提交者
3天前 (https://huggingface.co/papers/2604.08551#69e189cc376444098ddda126)
通过拖拽文本输入、粘贴或点击此处上传图像、音频和视频。
在此处点击或粘贴上传图像
在你的代理中获取此论文:
hf papers read 2604.08551
没有最新的CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用此论文的模型0
没有模型链接到此论文
在模型 README.md 中引用 arxiv.org/abs/2604.08551 以从本页链接。
引用此论文的数据集0
没有数据集链接到此论文
在数据集 README.md 中引用 arxiv.org/abs/2604.08551 以从本页链接。
引用此论文的 Spaces0
没有 Space 链接到此论文
在 Space README.md 中引用 arxiv.org/abs/2604.08551 以从本页链接。
包含此论文的收藏集0
没有收藏集包含此论文
将此论文添加到一个收藏集 (https://huggingface.co/new-collection) 以从本页链接。
相似文章
主权AI并非政府术语的随机组合。它是人工智能成为关键基础设施时必然发生的事情。
本文认为,主权AI不仅仅是政府术语,而是当AI成为关键基础设施时的实际需求,旨在减少对少数供应商的依赖以获取战略掌控权。
迈向负责任的不合规机器
本文研究如何设计能够负责任地拒绝用户请求的自主智能体,将不合规行为建立在正当理由、覆盖路径以及安全风险和责任转移的追踪之上。
在自主系统时代确立AI和数据主权
随着生成式AI和代理系统成为业务运营的核心,企业正优先考虑AI和数据主权,以重新掌控专有数据和模型,减少对集中式云提供商的依赖。
治理行动,而非智能体:将机构认证作为自主AI系统的治理模型
本文提出了一种基于机构认证的自主AI智能体治理模型,其中行动通过独立认证的证据进行治理,而非监控智能体推理。该模型通过概念验证实现进行了形式化,适用于临床处方和软件部署等高风险行动。
可验证的智能体基础设施:面向主权AI系统的基于证明的授权机制
本文提出了一种分布式信任框架(DTF),用于自主AI代理系统中的可验证、基于证明的授权,通过要求提供理由证明和共识执行来应对以身份为中心的权限所带来的风险。