scaffolding

#scaffolding

面向专业人类与大语言模型协作的能力条件化支架

arXiv cs.CL ↗ · 19小时前缓存

介绍了能力条件化支架，一种用于大语言模型协作的框架，根据用户专业领域调整干预措施以防止专业领域漂移，并在MMLU子集上进行了试点评估。

0 人收藏 0 人点赞

#scaffolding

@yoheinakajima：非常棒的文章，主要聚焦于 coding agents，但个人认为也适用于其他领域。与我之前的许多想法不谋而合：- agent…

X AI KOLs Following ↗ · 2026-05-11

该推文总结了构建 agent systems 的关键原则，着重强调了 scaffolding、memory 与可复用工具，内容基于 Yohei Nakajima 的一篇文章。

0 人收藏 0 人点赞

#scaffolding

Qwen3.6 35B + 合适脚手架，本地跑真实 Go 任务 9/10 通过

Reddit r/LocalLLaMA ↗ · 2026-04-23

开发者用 Qwen3.6 35B 为核心，配合 little-coder 脚手架搭建路由本地环境，在 10 个真实 Go 任务中拿到 9/10 通过率，证明本地模型搭配合适工具链也能逼近前沿代码模型。

0 人收藏 0 人点赞

#scaffolding

相同的9B Qwen权重：在Aider中19.1%，而在适配小型本地模型的脚手架中为45.6%

Reddit r/LocalLLaMA ↗ · 2026-04-19

过去一周，我测试了一个简单的问题：小型本地模型在编码智能体中通常表现不佳。但其中多少是模型本身的弱点，多少是脚手架不匹配所致？因此，我固定模型参数，仅更改脚手架。两种条件下使用相同的Qwen3.5-9B Q4权重。相同的Aider Polyglot基准测试。完整的225个练习。结果：\- 原始Aider：19.11% \- little-coder：两次完整运行的mean pass@2为45.56% little-coder并非新模型。它是一个我适配到t

0 人收藏 0 人点赞

scaffolding

面向专业人类与大语言模型协作的能力条件化支架

@yoheinakajima：非常棒的文章，主要聚焦于 coding agents，但个人认为也适用于其他领域。与我之前的许多想法不谋而合：- agent…

Qwen3.6 35B + 合适脚手架，本地跑真实 Go 任务 9/10 通过

相同的9B Qwen权重：在Aider中19.1%，而在适配小型本地模型的脚手架中为45.6%

提交意见反馈