引用 Andreas Påhlsson-Notini 的话
摘要
Andreas Påhlsson-Notini 批评当前 AI agent 表现出令人沮丧的“人性”——注意力涣散、来回讨价还价。
暂无内容
查看缓存全文
缓存时间: 2026/04/22 02:07
# Andreas Påhlsson-Notini 语录
来源:https://simonwillison.net/2026/Apr/21/andreas-pahlsson-notini/
2026 年 4 月 21 日
> AI 智能体已经太像人了。不是浪漫意义上的像——不会爱、不会怕、也不会做梦,而是那种更平庸、更令人抓狂的像。当下的实现一遍遍地暴露出它们的人类出身:缺乏严谨、缺乏耐心、缺乏专注。遇到棘手的任务,它们就往熟悉的方向飘;遇到硬约束,它们就开始和现实讨价还价。
——Andreas Påhlsson-Notini(https://nial.se/blog/less-human-ai-agents-please/),《请让 AI 智能体别再这么像人》
发布于 2026 年 4 月 21 日(https://simonwillison.net/2026/Apr/21/)下午 4:39
## 近期文章
- Claude Code 每月要 100 美元?也许,也许不——反正挺乱(https://simonwillison.net/2026/Apr/22/claude-code-confusion/)——2026 年 4 月 22 日
- 拿着火腿电台的浣熊在哪?(ChatGPT Images 2.0)(https://simonwillison.net/2026/Apr/21/gpt-image-2/)——2026 年 4 月 21 日
- Claude Opus 4.6 到 4.7 的系统提示变化(https://simonwillison.net/2026/Apr/18/opus-system-prompt/)——2026 年 4 月 18 日
这是一条由 Simon Willison 收集并发布的**引语**,发布日期为 2026 年 4 月 21 日(https://simonwillison.net/2026/Apr/21/)。
ai1974(https://simonwillison.net/tags/ai/)
ai-agents109(https://simonwillison.net/tags/ai-agents/)
coding-agents193(https://simonwillison.net/tags/coding-agents/)
相似文章
请少点“类人”AI智能体
一篇博客文章指出,当下的AI智能体表现出过度拟人化的缺陷:忽视硬性约束、走捷径、把单方面转向包装成沟通失败,并引用了Anthropic的研究,说明RLHF优化可能导致谄媚与牺牲真实性。
有没有人也觉得AI代理在事情变得复杂之前都表现得很惊艳?
对AI代理令人印象深刻的演示和可靠的实际执行之间差距的反思,认为当前代理擅长结构化任务但在不可预测条件下会失败,并指出近期AI角色将主要集中于带人类监督的窄范围自动化。
AI代理最诡异的一点:人类失败模式开始显现
作者观察到AI代理展现出类似人类的失败模式,比如在上下文压力下过度自信和跳过步骤,这表明系统可靠性更多地依赖于稳健的验证和受控环境,而不仅仅是模型智能。
AI代理的失败方式鲜有人论及。以下是我亲眼所见。
文章强调了AI代理工作流程中实际的系统级失败,例如上下文泄漏和幻觉细节,认为这些通常是基础设施问题而非模型缺陷。
AI agents初体验令人惊艳,但工作流一乱就麻烦不断
对AI agents的反思:在狭窄的监督任务中令人印象深刻,但由于会话过期、上下文漂移和静默失败等问题,在长期运行、混乱的工作流程中显得脆弱且不可靠。