标签
一位开发者将其AI智能体的LLM调用拆分为廉价的路由模型(GPT-OSS 120B)用于工具选择,以及高级模型(gpt-5.4)用于合成,成本降低了约78%,同时保持了输出质量。
本文测试了改变推理时的推理努力是否会影响大推理模型思维链长度与人类反应时间之间的对齐。结果表明,对齐对于努力扰动具有不变性,表明这是一种训练时实现的成就。
一条推文比较了Qwen3.6 27B和35B-A3B模型与GPT-OSS,指出虽然Qwen模型很快,但GPT-OSS更高效,尤其是在预填充性能方面。