我用Go构建了一个AI代理运行时，在交付前编译并测试生成的代码，35个文件，156个测试，零依赖

Reddit r/AI_Agents 2026/05/20 18:18 工具

go ai-agent runtime open-source code-generation verification testing

摘要

ARK是一个开源的Go运行时，它管理AI代理的决策，在交付前编译和测试生成的代码，具有6阶段验证管道和成本高效的模型路由。

过去10个月我一直在构建ARK（AI Runtime Kernel）。它是一个开源运行时，位于你的AI代理和LLM之间，管理模型做出的每个决策。核心理念：模型不应该控制系统，运行时才应该。**它的功能：**当你要求ARK写Go代码时，它不会简单地将提示传给GPT然后把结果扔给你。运行时会对任务进行分类，优化提示，生成代码，然后在你看之前运行一个6阶段的验证管道：├─ 第1步: ✓ 推理已验证（置信度: 70%）│ 🧪 验证: 已测试（得分: 100%）│ ✅ 编译成功 ← go build │ ✅ 执行成功 ← go run │ ✅ 测试通过 ← 自动生成的测试 │ ✅ Lint干净 ← go vet 如果代码编译失败，ARK会将编译错误反馈给模型，强制使用更强的模型并重试。如果尝试两次后仍失败，它会拒绝交付有问题的代码。它永远不会宣称无法编译的代码成功。**可能引起本社区兴趣的Go相关内容：**整个运行时是纯Go，零外部依赖（仅标准库）。35个文件，约16,000行代码，156个测试，竞态检测器干净。一些我引以为豪的功能：* 加权工具排名，使用6个信号（相关性、成功率、贝叶斯置信度、成本、延迟、记忆奖励）——均在微秒内计算完成 * 上下文引擎，通过仅加载相关工具将工具模式令牌从60K减少到约93（减少99.9%）* 逐步骤模型路由：廉价模型（gpt-4o-mini）处理工具调用，强模型（gpt-4o）处理推理。降低成本80-90% * 认知管理者（Cognitive Governor），每次输出都用校准的置信度分数验证 * 自动修复生成的Go代码中的常见模型错误（孤立的括号、缺少错误处理）——检测制表符和空格缩进 * 事件发射器，写入JSONL以供单独的Python记忆层摄取 **成本：**一个典型任务花费$0.002-$0.005，而不是$0.05。**输出示例：** go run ./cmd/ark run agent.yaml --task "用Go编写一个读取CSV的函数" ✅ 任务成功完成步骤: 1 | 令牌: 637 | 时间: 5.6秒 | 成本: $0.002 生成的代码在你看之前会编译、运行并通过自动生成的测试。我是芝加哥德保罗大学的一名计算机科学本科生，独自构建这个项目。已用此项目申请了YC S26。欢迎询问关于架构、验证管道或我为什么选择Go的问题。

查看原文

我用Go构建了一个AI代理运行时，在交付前编译并测试生成的代码，35个文件，156个测试，零依赖

相似文章

我们开源了一个代理运行时，专为人们常忽略的部分构建：在真实硬件上离线运行代理

在遇到 LangGraph 天花板后，我构建了自己的智能体运行时——将 UI 作为图节点，Postgres 持久化，零编排成本

Agentspan

如果你的AI代理能发邮件、浏览网站或调用工具，我有东西想请你测试一下

我们构建了一个代理运行时，其中任务是从配置编译的显式状态机

提交意见反馈