code-execution

#code-execution

llama.cpp的Web UI现在支持通过Web Workers在浏览器中执行模型生成的JavaScript（可选加入）

Reddit r/LocalLLaMA ↗ · 7小时前

llama.cpp的Web UI现在支持通过Web Workers在沙箱iframe中执行模型生成的JavaScript，作为可选功能实现轻量级的代理代码执行。

0 人收藏 0 人点赞

#code-execution

@FinanceYF5: 2/他叫Lenny Bogdonoff 在OpenAI只有250人时加入，GPT-4还在训练，ChatGPT还没上线。他第一个任务：重建Jupyter代码执行环境，是后来"AI电脑"概念的雏形。他没意识到这件事有多重要，大多数人也没有。

X AI KOLs Following ↗ · 昨天缓存

OpenAI早期员工Lenny Bogdonoff在GPT-4训练和ChatGPT上线前重建了Jupyter代码执行环境，这一工作成为后来'AI电脑'概念的雏形，但当时未受重视。

0 人收藏 0 人点赞

#code-execution

VELA

Product Hunt ↗ · 6天前

VELA是一款用于安全执行AI生成的及不可信代码的工具，提供一个沙箱环境以防止恶意行为。

0 人收藏 0 人点赞

#code-execution

TREX：一款运行你的代码的AI代码审查工具

Hacker News Top ↗ · 2026-06-17 缓存

Greptile 推出 TREX，这是一款能够执行代码并检测运行时错误的 AI 代码审查工具。它超越了静态分析，通过启动并行代理来调查问题并生成截图等产物。

0 人收藏 0 人点赞

#code-execution

CODA-BENCH: 代码智能体能处理数据密集型任务吗？

Hugging Face Daily Papers ↗ · 2026-06-13 缓存

CODA-BENCH 是一个新的基准测试，用于评估代码智能体在数据密集型任务上的表现，弥合了以代码为中心和以数据为中心的评估之间的差距。它包含来自31个社区的超过1000个任务，具有真实的数据规模和噪声，结果显示即使是最顶尖的智能体也仅能达到61.1%的成功率。

0 人收藏 0 人点赞

#code-execution

objdump -g 中的任意代码执行

Lobsters Hottest ↗ · 2026-06-08 缓存

objdump -g 中存在一个安全漏洞，由于 FR30 重定位处理程序缺少边界检查，通过精心构造的 FR30 目标文件可实现任意代码执行，单个漏洞利用即可绕过 ASLR 及其他缓解措施。

0 人收藏 0 人点赞

#code-execution

执行代码的配置文件：供应链安全盲点

Hacker News Top ↗ · 2026-06-08 缓存

IDE、AI编码智能体和包管理器的配置文件可以自动执行代码，从而形成供应链安全盲点。本文详细介绍了利用此类配置文件释放恶意软件的Miasma蠕虫攻击，并提供了注入向量的示例。

0 人收藏 0 人点赞

#code-execution

为你的AI代理配备专属计算机（7分钟阅读）

TLDR AI ↗ · 2026-06-08 缓存

LangChain推出LangSmith Sandboxes，为每个AI代理提供独立的隔离计算环境以安全执行代码，解决了在容器或本地运行不可信代码的安全风险。

0 人收藏 0 人点赞

#code-execution

@HowToAI_: 中国刚刚向AI智能体社区免费提供了一个生产级沙箱。OpenSandbox是一个开源的沙箱运行时…

X AI KOLs Timeline ↗ · 2026-06-02 缓存

中国发布了OpenSandbox，这是一个面向AI智能体的开源沙箱运行时，支持多种SDK以及通过Docker/Kubernetes隔离的安全执行环境。

0 人收藏 0 人点赞

#code-execution

@LangChain: https://x.com/LangChain/status/2060111005917577668

X AI KOLs Following ↗ · 2026-05-28 缓存

LangChain 的新闻通讯宣布了 Interrupt 2026 的重大产品发布：用于自动诊断和修复 Agent 故障的 LangSmith Engine，以及用于安全代码执行的 Sandboxes 正式版，同时还启动了新的 LangChain Labs 研究计划，并预告了即将举行的活动。

0 人收藏 0 人点赞

#code-execution

推理、代码，还是两者兼有？大型语言模型如何处理数学问题的变化

arXiv cs.AI ↗ · 2026-05-27 缓存

本文使用 Claude Haiku 4.5 在 1000 个 GSM-Symbolic 问题上评估了三种方法（纯思维链推理、单次代码执行和迭代代码执行），发现思维链对扰动最为鲁棒，而代码执行并未提升小学数学问题的推理鲁棒性。

0 人收藏 0 人点赞

#code-execution

@wsl8297: 做 Agent 最怕的场景，是它把危险命令当正常步骤执行，HOL Guard 就是冲着这个问题来的。 GitHub：https://github.com/hashgraph-online/hol-guard… 官网：https://hol…

X AI KOLs Timeline ↗ · 2026-05-23 缓存

HOL Guard 是一个开源安全工具，为 Codex、Claude Code 等开发 Agent 提供危险命令识别、拦截和审计功能，支持多档保护级别和本地审批中心，防止误删改等风险。

0 人收藏 0 人点赞

#code-execution

@larsencc: 如果你运行执行任意代码的智能体：你是隔离工具还是隔离智能体？我们两种都试过了。隔离智…

X AI KOLs Following ↗ · 2026-05-22 缓存

讨论在运行执行任意代码的智能体时，是隔离工具还是隔离智能体，结论是隔离智能体更优，因为零秘密和控制平面代理。

0 人收藏 0 人点赞

#code-execution

赋予LLMs exec()能力是一场安全噩梦。我构建了一个基于AST的开源防护机制来阻止恶意代理执行。

Reddit r/AI_Agents ↗ · 2026-05-21

介绍ast-guard，一个开源的基于AST的安全工具，它通过将LLM生成的Python字符串解析为抽象语法树，并应用节点级白名单和上下文感知安全检查，防止恶意代码执行。

0 人收藏 0 人点赞

#code-execution

@_philschmid：使用单个curl请求Gemini API构建了一个@github问题分类助手。→ 将仓库克隆到沙箱中 → 获取开放问题…

X AI KOLs Following ↗ · 2026-05-21 缓存

使用单个curl请求Gemini API构建了一个GitHub问题分类助手，该助手可以克隆仓库、获取问题、分类问题并执行复现代码以确认错误，且无需任何编排框架。

0 人收藏 0 人点赞

#code-execution

@hwchase17：代码解释器是一个轻量级的代码执行环境，让你可以：- RLMs - 程序化工具调用 - 更多！w…

X AI KOLs Timeline ↗ · 2026-05-20 缓存

Harrison Chase 发布了一个名为 code interpreter 的轻量级代码执行环境，它支持 RLMs 和程序化工具调用，无需启动完整的沙箱，更多用例将陆续公布。

0 人收藏 0 人点赞

#code-execution

@huntlovell: https://x.com/huntlovell/status/2057166131924988002

X AI KOLs Timeline ↗ · 2026-05-20 缓存

Deep Agents 引入了解释器：小型嵌入式运行时，允许智能体在智能体循环内编写和执行代码，实现多步逻辑和中间状态管理，无需完整的沙箱开销。

0 人收藏 0 人点赞

#code-execution

@_philschmid: 我很兴奋地介绍 Gemini API 中的托管代理。一次 API 调用即可获得一个完整的代理，具备代码执行、网页浏览…

X AI KOLs Following ↗ · 2026-05-19 缓存

Phil Schmid 宣布 Gemini API 中的托管代理，支持一次性调用获取包含代码执行、网页浏览和文件管理功能的代理，运行在隔离沙箱中，由 Gemini 3.5 Flash 驱动。

0 人收藏 0 人点赞

#code-execution

让语言模型学会用代码思考

arXiv cs.CL ↗ · 2026-05-11 缓存

本文介绍了 ThinC（Thinking in Code，用代码思考）框架。在该框架中，语言模型在简短的自然语言规划步骤后，仅使用代码块进行推理，在数学基准测试中优于现有的工具集成推理基线。

0 人收藏 0 人点赞

#code-execution

@akshay_pachaar: MCP 与 CLI 之争。在 2025 年的大部分时间里，AI 工程师们对此争论不休。怀疑论者摆出了真实数据：- Playwright MCP …

X AI KOLs Following ↗ · 2026-05-10

Anthropic 的“代码模式”（Code Mode）重新定义了 MCP 与 CLI 之争。它让 AI 代理编写代码，通过运行时调用工具，而不是将完整的模式加载到上下文中，从而大幅减少了 token 消耗。这种方法结合了 MCP 的强类型契约与懒加载机制，证明了该协议正在演进，而非走向消亡。

0 人收藏 0 人点赞

code-execution

提交意见反馈