也许下一个模型的胜利在于降低智能体工作流的消耗

Reddit r/AI_Agents 模型

摘要

文章讨论了下一个重要的模型进步可能在于降低智能体工作流的成本,重点介绍了蚂蚁集团的 Ling-2.6-1T,这是一个万亿参数模型,旨在以低计算开销实现高效推理和任务执行。

关于模型的讨论仍然围绕着同一个问题:在顶尖水平上谁最聪明?但对于智能体系统来说,实际的问题可能更简单:哪个模型能让长工作流在经济上保持合理?Ling-2.6-1T 之所以有趣,是因为其公开定位直接点明了这一点。蚂蚁的文档将其描述为一个万亿参数的旗舰模型,旨在从逻辑推理到任务执行都保持最低的计算开销,并且模型卡片不断强调快速思考和更低的 Token 开销。这正好对应了真实智能体栈中容易出问题的地方。长链变得昂贵,重试堆积,每一步冗长的输出都让系统更难被证明合理。我宁愿少一些排行榜热度,来换取一个能让长智能体工作流运行更便宜、扩展更容易的模型。我愿意做这个交易。你呢?
查看原文

相似文章

AI agents 正在改变人们对计算成本的看法

Reddit r/AI_Agents

本文讨论了AI代理工作流如何将优化重心从单纯的推理成本转向更广泛的挑战,如延迟、编排开销和可靠性。文章强调了向混合架构和动态模型路由发展的趋势,以应对这些多步骤工作流的复杂性。

科技公司能否学会青睐更便宜的AI模型?

TechCrunch AI

TechCrunch报道称,随着成本不断攀升,企业开始考虑转向更便宜、更小的AI模型,而非始终使用最强大的模型,这可能引发行业转变。布赖恩·阿姆斯特朗等人的预测表明,12-18个月内,80%的工作负载可能运行在价格便宜99%的模型上,这将严重冲击OpenAI和Anthropic等主要AI实验室。