convex twin

Reddit r/AI_Agents 工具

摘要

作者构建了一个用于Convex后端的确定性重放引擎,支持使用生产快照进行本地调试以及控制异常测试,正在寻求用户反馈。

嘿,大家好!我一直在构建一个Convex Twin,它是Convex后端的确定性重放引擎。目标是让生产调试更轻松,你可以: 在本地重放精确的执行序列 针对生产快照进行调试 使用受控异常测试突变 我非常希望听到Convex用户的反馈,看看这是否解决了一个真正的痛点。特别想知道: -> 你是否遇到过难以在本地复现的生产错误? -> 确定性重放是否会真正用于你的工作流程?
查看原文

相似文章

@no_stp_on_snek: 如果你想试试,可以在这里找到:

X AI KOLs Following

这是一个 llama.cpp 的分支,集成了 TurboQuant+,用于先进的 KV 缓存和权重量化,支持跨后端内核(Apple Silicon、NVIDIA CUDA、AMD ROCm、Vulkan),并被 LocalAI、Chronara 和 AtomicChat 用于生产环境。

动态KV缓存量化与按需加载mmproj/MTP:我的llama.cpp愿望清单

Reddit r/LocalLLaMA

一位开发者已为llama.cpp实现了一个概念验证的PR,通过HTTP端点添加了动态KV缓存量化功能,允许用户按需重新量化其KV缓存,而无需完全重新加载模型。该帖子还概述了一个愿望清单,包括按需加载mmproj/MTP交换以及用于上下文优化的自动--fit标志。