@0xLogicrw: 智谱 AI 创始人兼首席科学家唐杰预测，今年大模型的最大突破将是长周期任务（Long-Horizon Tasks），AI 能在真实环境中持续运转并解决复杂问题。长周期任务一旦突破，现在的「一人公司」会迅速变成完全由智能体运转的「无员工公…

X AI KOLs Timeline 2026/05/13 07:59 新闻

long-horizon-tasks ai-prediction autonomous-agents self-evolution llm-os anthropic zhipu-ai

摘要

智谱AI创始人唐杰预测今年大模型最大突破是长周期任务，AI可在真实环境持续解决复杂问题，并提及三大技术支柱及Anthropic的自主训练进展。

智谱 AI 创始人兼首席科学家唐杰预测，今年大模型的最大突破将是长周期任务（Long-Horizon Tasks），AI 能在真实环境中持续运转并解决复杂问题。长周期任务一旦突破，现在的「一人公司」会迅速变成完全由智能体运转的「无员工公司（NPC）」。但通向这条路必须先解决三大技术支柱：超长上下文和 RAG 搞定记忆，极速的版本迭代变相补足持续学习，以及自我修正和评判能力。唐杰认为在最后一项上，Opus 4.7 已经初具雏形。大模型的终局将是全面的自我进化。唐杰推测 Claude 极大概率已经跑通了自己写代码、清洗数据并训练自身的闭环。传闻中 Claude 明年的 200 万芯片集群很可能就是专门留给「自主训练」的。（背景补充：去年到现在，Anthropic 已经相继锁定了最高 100 万块谷歌 TPU 以及超过 100 万块亚马逊 Trainium 芯片。对比一下，目前最大的芯片集群是马斯克的 Colossus 2，GPU总数约 55.5 万张，并计划向 100 万推进。）未来的设备将被大模型操作系统（LLM OS）全面接管，应用全靠按需生成，直接颠覆传统的计算架构。

查看原文

相似文章

@jietang：近期思考：向长程任务的转变。今年最有可能的突破将出现在长程任务领域。…

X AI KOLs Timeline

文章探讨了长程人工智能任务和自主代理系统（Autonomous Agents）即将取得的突破，指出企业模式正从“一人公司”向“无人公司”转变。文章强调，记忆、持续学习和自我评判等技术支柱是实现完全自我进化的人工智能系统的关键，这可能重新定义通用人工智能（AGI）和操作系统。

@jakevin7: 做一个预言：AI 时代的下一阶段，会变成 “Infra is all you need”。现在 AI 生成代码的能力已经很强，但是在可用性和稳定性目前还远远不够。最近 OpenAI 订阅系统出现了超大bug，会员系统完全炸了。系统一…

X AI KOLs Following

作者预言AI时代下一阶段将从模型能力转向基础设施能力，强调可复现、可观测、可恢复、安全隔离等infra能力，认为稳定承载AI行为将是竞争关键。

@VincentLogic: 如果 Ilya 判断是对的，那过去几年 AI 行业最坚固的三个共识，可能都错了： Scaling 不再是万能答案。 Benchmark 高分不等于真正智能。 RL 甚至可能在把模型越训越“笨”。这场被称为“Ilya 消失前最后一次采访”…

X AI KOLs Timeline

Ilya Sutskever 在一次深度采访中提出，AI 行业过去几年的三个核心共识可能都是错误的：Scaling 不再是万能、Benchmark 高分不等于真正智能、RL 反而让模型变笨。他认为预训练和 RL 的红利即将耗尽，AI 已重回研究时代，真正的超智能应像天才少年一样具备强大学习能力，而非静态的知识库。

@ba_niu80557: https://x.com/ba_niu80557/status/2071277244287426980

X AI KOLs Timeline

文章深入分析了Anthropic因AI代码生成变得极其高效而面临的内部变化：瓶颈从“写作”转移到“验证”，传统管理、长期规划和努力衡量失效，注意力成为新的稀缺资源，工程师甚至感到孤独。这些现象预示了其他公司未来可能面临的挑战。

@seclink: https://x.com/seclink/status/2056715852914032662

X AI KOLs Following

Anthropic创始人Dario Amodei在Lex Fridman播客中预测强AI将在2026-2027年达到顶级人类水平，强调AI安全的核心在于防范权力集中与滥用，而非模型自主性，并讨论了缩放定律、Claude设计逻辑及AI安全分级（ASL）框架。

相似文章

@jietang：近期思考：向长程任务的转变。今年最有可能的突破将出现在长程任务领域。…

@jakevin7: 做一个预言：AI 时代的下一阶段，会变成 “Infra is all you need”。 现在 AI 生成代码的能力已经很强，但是在可用性和稳定性目前还远远不够。 最近 OpenAI 订阅系统出现了超大bug，会员系统完全炸了。 系统一…

@VincentLogic: 如果 Ilya 判断是对的，那过去几年 AI 行业最坚固的三个共识，可能都错了： Scaling 不再是万能答案。 Benchmark 高分不等于真正智能。 RL 甚至可能在把模型越训越“笨”。 这场被称为“Ilya 消失前最后一次采访”…

@ba_niu80557: https://x.com/ba_niu80557/status/2071277244287426980

@seclink: https://x.com/seclink/status/2056715852914032662

提交意见反馈

@jakevin7: 做一个预言：AI 时代的下一阶段，会变成 “Infra is all you need”。现在 AI 生成代码的能力已经很强，但是在可用性和稳定性目前还远远不够。最近 OpenAI 订阅系统出现了超大bug，会员系统完全炸了。系统一…

@VincentLogic: 如果 Ilya 判断是对的，那过去几年 AI 行业最坚固的三个共识，可能都错了： Scaling 不再是万能答案。 Benchmark 高分不等于真正智能。 RL 甚至可能在把模型越训越“笨”。这场被称为“Ilya 消失前最后一次采访”…