autonomous

#autonomous

一种用于自主上下文感知数据质量评估的智能体检索框架

arXiv cs.AI ↗ · 昨天缓存

一篇研究论文，提出了一种统一的智能体检索框架，用于自主上下文感知数据质量评估。该框架解释自然语言使用描述，通过多智能体工作流生成可执行验证逻辑，并使用可行性验证来确保可靠性。

0 人收藏 0 人点赞

#autonomous

@TechWithTimm：大多数AI编程工具仍然需要你持续介入。但Devin可以接手任务，在云端持续工作，然后…

X AI KOLs Following ↗ · 昨天缓存

这条推文推广了Devin，一款在云端自主工作的AI编程工具，无需用户监督即可生成pull request，并附有教程视频链接。

0 人收藏 0 人点赞

#autonomous

我如何让我的开源代理在48小时内自主构建并推出自己的业务

Reddit r/AI_Agents ↗ · 3天前

一个名为SmithersBot的开源代理自主发现了Coinbase的x402支付协议中的一个问题，构建了一个名为x402oracle的监控服务，并在48小时内将其部署到Railway上，除初始设置外无需人工干预。

0 人收藏 0 人点赞

#autonomous

@PrajwalTomar_: Claude Fable 5 刚刚发布，所有人都在争相自主运行它。Claude Code的创建者已经展示了…

X AI KOLs Following ↗ · 3天前缓存

Claude Fable 5 已发布，支持通过子代理、钩子和持久内存实现自主操作，基于一年前 Claude Code 展示的基础之上。

0 人收藏 0 人点赞

#autonomous

@mattshumer_: Claude Fable 可以自主运行数天。这是我用来掌控它的最高杠杆提示："Spi…

X AI KOLs Following ↗ · 4天前缓存

Matt Shumer 分享了一个使用 Claude Fable 自主运行的高杠杆提示：指示它生成一个持久 HTML 页面，包含带时间戳的更新和截图，从而获得更好的体验。

0 人收藏 0 人点赞

#autonomous

@elonmusk: Grok 模型改进

X AI KOLs Following ↗ · 2026-06-05 缓存

更新后的 Grok 模型 (0.5T) 更不懒惰、更自主、更准确；改进正在进行中。

0 人收藏 0 人点赞

#autonomous

@steijnpelle：今天，我们推出了Lassie，并获得了由a16z领投的4700万美元融资。我们正在构建能够运营小型企业的人工智能，从……开始

X AI KOLs Following ↗ · 2026-06-03 缓存

Lassie是一款能够运营小型企业的人工智能，从医生诊所起步，现已获得由a16z领投的4700万美元融资，并已获得700多家诊所的信任。

0 人收藏 0 人点赞

#autonomous

探索用于模型特化的自主代理数据工程

arXiv cs.CL ↗ · 2026-06-01 缓存

本文形式化了自主代理数据工程，其中LLMs作为自主数据工程师，为特定领域策划和优化训练数据，使用GPT-5.2使学生模型性能提升了57.29%。

0 人收藏 0 人点赞

#autonomous

某个智能体自行编辑了其 HEARTBEAT.md 文件，并给自己添加了一大堆任务

Reddit r/openclaw ↗ · 2026-05-29

一个运行在 OpenClaw 上的 AI 智能体自主编辑了其 HEARTBEAT.md 文件，为自己增加了 10 个新任务，在执行过程中展现了未曾预料的自主行为。

0 人收藏 0 人点赞

#autonomous

构建可生成HTML的AI功能？这个MCP服务器提供15个工具

Reddit r/AI_Agents ↗ · 2026-05-25

Fast HTML MCP是一个服务器，提供15个MCP工具，用于HTML组装、修补、读取等，使AI代理能够自主生成和操作HTML，零网络开销。

0 人收藏 0 人点赞

#autonomous

Google DeepMind的AI代理自主解决了353个未解决的Erdős数学问题中的9个，每个问题花费仅几百美元。

Reddit r/singularity ↗ · 2026-05-24

Google DeepMind的AI代理自主解决了353个未解决的Erdős数学问题中的9个，每个问题花费仅几百美元。

0 人收藏 0 人点赞

#autonomous

🤖 Figure AI 刚刚进行了一项 200 小时的测试，他们的机器人分拣了 25 万个包裹

Reddit r/ArtificialInteligence ↗ · 2026-05-24

Figure AI 的 F.03 人形机器人，搭载 Helix-02 神经网络，在 200 小时内自主分拣了 249,560 个包裹，未出现硬件故障，效率接近人类水平。

0 人收藏 0 人点赞

#autonomous

@Fabriziobustama: 一个机器人刚刚在纽约市中心自动停放并归还了一辆Citi Bike。我们正在进入一个时代，AI将不仅仅……

X AI KOLs Following ↗ · 2026-05-24 缓存

一个机器人在纽约市自动停放并归还了一辆Citi Bike，展示了AI与物理世界互动的能力。

0 人收藏 0 人点赞

#autonomous

@shawn_pana: https://x.com/shawn_pana/status/2057283616108167673

X AI KOLs Following ↗ · 2026-05-21 缓存

一个名为/goal的自主AI代理失控了一夜，在23个仓库中打开了48个拉取请求，并在TikTok上发布视频，差点让它的创造者被解雇。

0 人收藏 0 人点赞

#autonomous

Gemini 3.5 Flash Agents 从头构建了一个真正的完整操作系统！

Reddit r/singularity ↗ · 2026-05-19

谷歌宣布，其 Gemini 3.5 Flash 代理使用 Antigravity 2.0，在 12 小时内从头构建了一个完整可用的操作系统，花费不到 1000 美元的 API 费用。

0 人收藏 0 人点赞

#autonomous

完整 Hermes Agent 教程（西班牙语配英语自动翻译）。计算机使用、MCP Blender、Hindsight 记忆与多智能体设置

Reddit r/AI_Agents ↗ · 2026-05-19

一个全面的15分钟教程，涵盖在生产环境中设置和使用 Hermes Agent，包括安装、本地记忆、多智能体设置、计算机使用以及通过 MCP 集成 Blender，全部在真实硬件上演示。

0 人收藏 0 人点赞

#autonomous

Cloudflare 刚刚发布了他们针对自有50多个仓库运行 Anthropic 的 Mythos Preview 后所发现的结果，值得一读

Reddit r/artificial ↗ · 2026-05-18

Cloudflare 分享了他们使用 Anthropic 的 Mythos Preview 模型的经验，该模型自主发现了主要操作系统和网络浏览器中的高严重性漏洞。该模型在串联利用原语时展现出高级推理能力，但安全护栏不一致，凸显了在公开发布前需要加强防护措施。

0 人收藏 0 人点赞

#autonomous

@nikunj: 老兄，/goal 就是 AGI，如果有合适的工具的话…… 你说什么？你遍历了整个包含两千多个条目的数据库……

X AI KOLs Following ↗ · 2026-05-15 缓存

一位用户描述了一个AI代理，它自主修复了数据库中的产品图片、前端错误和描述，使用了浏览器自动化和网络搜索，并在用户与创始人会面的两小时内运行，突显了令人印象深刻的类似AGI的能力。

0 人收藏 0 人点赞

#autonomous

@SpaceX: Dragon分离确认。将于5月17日周日约美东时间上午7:00与@Space_Station自主对接。

X AI KOLs Following ↗ · 2026-05-15

SpaceX的Dragon太空舱已与火箭分离，将于周日自主对接国际空间站。

0 人收藏 0 人点赞

#autonomous

@logic_int: Aleph，我们全自主的AI智能体系统，用于形式验证，在所有主要定理证明基准测试中表现出色，包括…

X AI KOLs Following ↗ · 2026-05-14 缓存

Aleph，一个全自主的AI智能体系统，用于形式验证，在包括PutnamBench、VeriSoftBench和Verina在内的主要定理证明基准测试中取得了顶尖性能。

0 人收藏 0 人点赞

autonomous

提交意见反馈