标签
一条推文,宣布推出用于构建组织级 Agent Harness 的开源 UI/UX,允许用户自带模型和运行时,并与自己的工具集成。
TileRT 是一款基于 tile 的运行时,能够实现超低延迟的 LLM 推理,近期里程碑包括在万亿参数模型上达到每秒 1000+ tokens。它支持 DeepSeek-V3.2 和 GLM-5 等模型,并在 GitHub 上开源提供。
Kuma是一个编译器/运行时,它将导出的PyTorch模型编译成自包含的WebGPU可执行文件,从而实现无需Python或服务器依赖的直接浏览器推理。
Deno 2.9 引入了 `deno desktop`,用于使用 Web 技术构建原生桌面应用程序,同时改进了 Node.js 兼容性、CSS 模块导入和更快的启动速度。
讨论使用NVFP4 4位浮点权重以获得最大性能,通过使用NVIDIA ModelOpt从FP8进行内部量化实现,突出了该数据格式的双缩放因子以保持高动态范围。
作者描述了他构建的一个明斯基大脑:一个由40多个LLM代理组成的运行时,它们按照连接组(connectome)连接,并按系统发育阶段排列,以模拟大脑。他寻求关于如何在Reddit上发布这个项目的建议。
这篇文章宣布了WASI 0.3的发布,该版本通过组件模型将异步原语原生集成到WebAssembly组件中,简化了API并实现了更好的组件组合。
本文提出了一种面向生产环境 AI 代理运行时治理的五平面参考架构,应对委托操作带来的安全风险。它定义了原语、不变性和评估框架,以确保安全性和实用性。
介绍Spice,这是一个开源决策层,充当Claude Code和Codex等执行智能体之上的“大脑”,实现上下文感知的任务委派和结构化决策。
作者认为,生产环境中的AI智能体应定义为具有独立运行时的声明式清单,而不是分散在应用代码中,以便实现适当的版本控制、可观测性和回滚。他们将自己的解决方案作为开源工具提供。
一篇反思性文章,批评 Deno 转向与 Node.js 兼容的做法,认为这削弱了其原本简洁、零配置的理念,而正是这些特点让开发者对其青睐有加。
作者构建了 Tidebase,一个用于智能体工作流的开源运行时,它使用 Postgres 提供检查点、重试和实时运行状态跟踪,使失败的运行可以从中断处恢复。
一篇关于构建AgentForge的详细技术文章,AgentForge是一个基于Python的开源agent框架,涵盖了会话运行时、工具合约、审批层和持久化等组件,强调agent由其运行时定义,而不仅仅是模型。
讨论agentic workflow中常见的runtime问题(循环预算、工具权限、压缩状态丢失),推荐DenisSergeevitch的agents-best-practices资源,提供provider-neutral的参考,强调将权限、预算、观测作为显式机制。
Agent libOS 引入了一种受库操作系统启发的、用于大语言模型智能体的运行时基座,将智能体视为具有显式能力、生命周期管理、审计记录和人工审批队列的可调度进程。该设计将信任边界从工具调度移至运行时原语,使得长期运行的智能体能够安全地被调度、授权、恢复和审计。
MARGIN 是一种用于多智能体基础模型系统的运行时置信度校准方法,它在线学习每个智能体的校准因子,将硬基准上的成对分辨率从低于随机水平提升至70-89%,且无需保留数据或重新训练。