open-source-llm

#open-source-llm

@MaximeRivest: 开源LLM中的工具调用在不同模型间差异巨大。我刚刚搭建了：http://chattemplatepl…

X AI KOLs Following ↗ · 2026-06-03 缓存

一个新的在线工具Chat Template Playground，让用户可视化查看不同开源LLM渲染其聊天模板的方式，突出显示了提示和分词上的差异。

0 人收藏 0 人点赞

#open-source-llm

Reddit r/AI_Agents ↗ · 2026-05-19

一位开发者将其AI智能体的LLM调用拆分为廉价的路由模型（GPT-OSS 120B）用于工具选择，以及高级模型（gpt-5.4）用于合成，成本降低了约78%，同时保持了输出质量。

0 人收藏 0 人点赞

#open-source-llm

Reddit r/LocalLLaMA ↗ · 2026-05-12

本文分享了一个 llama.cpp 的性能优化技巧，展示了增大微批大小（`-ub`）并结合部分 CPU 卸载（`--n-cpu-moe`）可以显著提升 gpt-oss-120b 等大型模型在消费级 GPU 上的提示词处理速度。

0 人收藏 0 人点赞