标签
一位全职软件工程师构建了一个通过iMessage/SMS运行的AI助手,为每个用户激活私有AWS服务器,以执行构建应用、制作网站、规划假期等任务。目前免费供测试使用。
美团旗下GN06团队正式上线AI浏览器Tabbit 1.0,内置多款头部大模型,支持跨软件跨网页的复杂任务自动执行,并新增记忆功能。
腾讯推出WorkBuddy,这是一个AI代理,能够自主完成复杂任务,而不仅仅是回答问题,演示展示了并行代理执行。
描述一种AI工具,它能自动化多个工具的工作流程并执行任务,等待用户批准,而不是仅仅提供指令。
作者将一个AI员工集成到Slack中,该AI自主执行并完成了一项每周任务,展示了其强大的能力。
介绍了Teach VLM,一种从移动屏幕演示中提取逐步操作知识的模型,以及Teach-and-Repeat范式,该范式利用这些知识指导GUI代理,在新基准上实现了最先进的性能。
大多数公司错误地自动化了任务而非决策,从而错失了巨大的投资回报率。通过自动化需要人类判断的决策,例如线索评分和支持工单分类,公司每天可以节省数小时高管的时间。
Kimi 推出了新的 AI 办公产品 Kimi Work,它继承了 Kimi Code 和 Kimi Agent 的能力,可同时调度多达 300 个 Agent 协同完成任务,旨在为打工人提供无需命令行的自动化办公体验。
PhoneWorld是一个管道,将真实的GUI轨迹转化为可控的移动环境,从而实现手机使用基准的可扩展创建。它涵盖16个领域的34个应用,并展示了使用其监督数据可以提升多个评估基准的性能。
Manus 宣布推出 Scheduled Tasks 2.0,这是一项重大升级,允许周期性工作在同一任务内根据上下文运行,支持在 Manus 构建的 Web 应用中执行后台操作,并提供更清晰的可视化。现已可用。
讨论AI代理是否终于从基于聊天的交互转向自主执行现实任务,例如客户支持和取消订阅,质疑实际实施是否已经到来或仍处于早期阶段。
本文介绍了 MCP-Cosmos,这是一个将生成式世界模型集成到 Model Context Protocol (MCP) 生态系统中的框架,旨在通过潜在空间中的预测性模拟来增强智能体的规划与执行能力。
Codex 引入了 /goal 命令,让 AI 能够自主地朝着定义好的最终状态工作,从而简化重构、迁移和重试循环等长时间运行的任务。