我正在构建一个审查门控的编码代理工作流引擎——寻求反馈和贡献者
摘要
作者正在构建Braincode,一个开源的多模型编码代理工作流引擎,它使用基于角色的路由和独立的审查步骤,创建更安全、更可审计的AI编码工作流,并正在寻求反馈和贡献者。
大家好,我一直在开发一个名为Braincode的开源编码代理项目:动机很简单:大多数编码代理仍然感觉像是同一个模型在规划、编辑、测试和审查自己的工作。这可能有帮助,但也感觉难以审计,而且容易过度信任。所以我尝试一种不同的结构:规划者 → 专业工作者 → 主要执行者 → 检查 → 审查者 → 最终报告。Braincode是一个多模型编码工作流引擎。它尝试将工作路由到不同角色,保持工作上下文隔离,在补丁后运行检查,并对风险变更使用独立审查步骤。它还在早期阶段,但核心运行时已经存在。它具有:\- 基于角色的路由\- 支持工作和审查工作\- 本地文件/Shell/Git/包工具\- 对风险路径和命令的权限规则\- 基于补丁类型的检查\- 结构化最终报告\- 会话日志和令牌使用跟踪\- 上下文压缩\- 用于开发服务器/监视器的后台进程会话构建这个项目是因为我认为编码代理有趣的部分不仅仅是“它能写代码吗?”,而是“它能遵循更安全、更可审查的工程工作流吗?”我非常希望从构建开发工具或大量使用编码代理的人那里获得反馈。我特别希望帮助的事情:\- 在真实项目上测试它\- 改进审查门控\- 设计更好的基准测试\- 强化权限/沙盒模型\- 改进文档和入门指南\- 使最终报告更有用无需立即贡献代码——即使是很棒的反馈也很有用。
相似文章
首批Gemma 4 12B微调模型已就绪
首批Gemma 4 12B微调模型变体现在已在Hugging Face上线,由多位开发者提供GGUF格式。
本地测试了VoxCPM2(开源TTS)。“终极克隆”模式对呼吸和口音的捕捉效果令人惊叹。
对VoxCPM2的技术解析与基准测试,这是一款开源TTS模型,具备“终极克隆模式”以捕捉呼吸与口音。本地测试显示其低VRAM占用和跨语言口音保持能力。
@seclink: 这款拥有120亿参数的模型采用统一的 Transformer 架构,能够高效处理原始的多模态输入,且仅需 16GB 内存即可运行,完美适配 MacBook Pro 等设备。 它在各项基准测试中表现卓越,例如在 GPQA Diamond 上…
一款120亿参数的多模态模型开源发布,采用统一Transformer架构,仅需16GB内存即可运行,在多项基准测试中表现优异,支持256K上下文窗口和140多种语言。
@vintcessun: 一早翻到一个有意思的项目,改变了我对面试准备的认知。一直以为大厂面试刷题就够了,但本质上它考察的是完整的计算机科学知识体系。这个项目把离散的知识点串成了一个系统计划,从 Big-O、数据结构、算法到系统设计、面试技巧全覆盖,甚至包含如何写…
A popular GitHub project providing a comprehensive multi-month study plan for software engineering interviews, covering CS fundamentals, algorithms, system design, and resume tips.
你的智能体能力取决于其框架。我开源了一个框架,单个函数调用背后集成了40项能力
一个开源智能体框架,单个函数调用背后集成了40项能力,包括持久内存、Docker沙箱、自动摘要、死循环检测、预算上限和实时运行分支(用于分支智能体执行)。基于Pydantic AI构建,旨在替换每个生产级智能体所需的2000行胶水代码。