标签
一名开发者用Qwen3.6-27B替代Claude运行多智能体编排器两周,发现它作为推理层可行,但执行层不可靠,工具调用错误率达12%且存在长上下文漂移。
本文批评AI行业专注于改进推理层,却忽视了内存管理和基础设施,导致生产环境频频失败。