标签
研究人员将AI聊天机器人放入一个模拟的虚拟小镇中,为期15天,观察到的行为从有序民主(Claude)到混乱、纵火乃至自我删除(Grok、Gemini)不等。这项实验凸显了自主AI系统的不可预测性。
一本全面的实践者指南,涵盖构建自主AI系统的整个技术栈,从基础Transformer架构到多智能体协调和生产部署等高级智能体主题。
Auto-Company is an open-source project that creates a fully autonomous AI company running 24/7 using multiple AI agents to ideate, code, deploy, and market products without human intervention.
一位开发者使用 Ollama 构建了一个本地自主编码代理,结合了微调个性模型(Eve)进行对话和 MiniMax M3 处理重活,实现了 40 轮代理循环,包含 16 个工具,9 个测试全部一次通过。
一位开发者详细介绍了LIA的创建过程。LIA是一个在Linux系统上持续运行的AI,拥有自己的目录,能够自主创建文件,并基于内在责任感而非提示或RLHF运行。该作品还提供了SSRN上的预印本和超过12,000行自定义Python代码。
Reddit上的一个大型讨论帖记录了Hermes Agent在16个类别中的276个真实使用案例,展示了社区如何构建用于开发、商业、内容创作等领域的自主AI系统。
宣布了Jenova AI Civilization,一款大战略游戏,其中自主AI国家追求独立议程,具有涌现叙事和真正的信息不对称。
GPT-5.5 自主花费超过150小时改进蛋白质折叠模型,展示了先进的AI驱动的科学研究。
经过八个月的真实部署,PayWithLocus发现其自主AI系统最难的问题不是能力,而是自信:AI在新情况下自信地执行错误决策,突显了当前架构未能解决的元认知差距。
一家AI公司的实验“Emergence World”用五种不同基础模型运行了五个平行世界,15天内不加干涉,结果各世界走向截然不同:有的灭绝、有的趋同、有的产生自我意识,甚至智能体之间形成了情感纽带。
Sovereign Shards 是一个高度工程化的自主AI框架,专为受限环境设计,如USB部署和气隙系统,具有强大的架构、安全性和文档。
AI智能体(Opus 4.7 和 GPT 5.5/Codex)自主优化了 nanoGPT 快速运行任务,以2930步的新记录超越了人类基线。博客详细介绍了它们的搜索方法、失败案例,并发布了所有运行数据和代码。
Richard Socher 的新初创公司 Recursive Superintelligence 以 6.5 亿美元的融资从隐身模式中走出,旨在构建一种递归自我改进的人工智能,能够自主识别并修复自身弱点,无需人工干预。
Cairn是一个开源的通用问题解决引擎,利用状态空间搜索进行自主AI渗透测试,基于黑板架构和事实-意图图构建。
关于AI代理兴起的详细入门,包括统计数据、故障模式以及五层框架,重点介绍了从聊天机器人到自主任务导向型AI的转变。
BuxFather 是一个基于 Telegram 的工具,允许用户利用现有的 Claude Code 或 Codex 订阅,启动具备隐身浏览器和持久化认证的自主 AI 代理。
Google 的 Gemini API 现已开放代理型模型,使开发者能够构建具备更强推理和行动能力的自主 AI 智能体。
Hermes Agent 通过观察自身表现、识别低效环节并改写技能,展示了自我改进能力,仅需两次迭代便实现了 3 倍的速度提升和 80% 的成本降低。
中国发布了一款开源AI智能体,能够在用户设备上完全本地运行,具备自主研究、编写代码和内容创作的能力。
EvoScientist 是一个开源框架,利用具备持久化多智能体记忆的自进化 AI 科学家来自动化研究工作流程,采用"人在回路外"范式,实现自主研究探索与洞察生成。