@seclink: 陈天桥再不努力一把, 大模型记忆就要被字节偷家了... 赶了个大早, 很努力,但是执行的人不行 ... OpenViking 开源的 cli 工具做了好多迭代优化... 早晚你们会想起,用AI 编程改造复杂项目时, 一定会用上大模型记忆的…
摘要
OpenViking是一个开源的CLI工具,旨在通过大模型记忆功能优化复杂项目的AI编程体验并节省token。文章评论了其在执行层面的表现以及与字节跳动等竞争者在LLM记忆领域的动态。
查看缓存全文
缓存时间: 2026/05/10 14:25
陈天桥再不努力一把, 大模型记忆就要被字节偷家了…
赶了个大早, 很努力,但是执行的人不行 …
OpenViking 开源的 cli 工具做了好多迭代优化…
早晚你们会想起,用AI 编程改造复杂项目时,
一定会用上大模型记忆的(至少为了省token)。
相似文章
@WY_mask: 给各类 AI 编程助手打造持久化记忆引擎 http://github.com/rohitg00/agentmemory… 在后台静默记录代码修改和上下文 自动提取并压缩成结构化记忆 节省长上下文带来的 Token 消耗 关联过去的信息,随…
agentmemory 是一个为 AI 编程助手提供持久化记忆的开源工具,能静默记录代码修改和上下文,自动提取并压缩成结构化记忆,降低 Token 消耗,并支持 Claude Code、Codex 等多种主流平台。
@NFTCPS: 4GB显存跑70B大模型?这事儿真成了! AirLLM玩了个骚操作——分层推理,不一次性把模型怼进显存,而是一层层加载、算完就扔,硬生生把巨无霸塞进小破卡。 最骚的是:100%开源,白嫖警告 https://github.com/0xSo…
AirLLM 是一个完全开源的工具,通过分层推理技术(逐层加载并立即释放显存),使得 70B 大语言模型可在仅 4GB 显存的 GPU 上运行,无需量化、蒸馏或剪枝,并已支持 Llama3.1 405B 在 8GB 显存上运行。
@AYi_AInotes: https://x.com/AYi_AInotes/status/2069399806502453264
一篇保姆级教程,介绍如何用30分钟为AI Agent搭好持久记忆,使用开源的EverOS工具,将记忆存储为可编辑的Markdown文件,无需Docker或向量库集群。
@discountifu: 原来真有一个叫记忆宫殿的开源项目,号称是目前跑分最强的 AI 记忆系统
介绍了一个名为 MemPalace 的开源 AI 记忆系统,声称在 LongMemEval 上达到 96.6% R@5,采用本地优先、可插拔后端的设计,支持 CLI 和 MCP 服务器部署。
@yibie: 本地模型做主力编码工具:2026 年中的实战报告 Hacker News 上有一个帖子,标题很直接:"有人用本地模型做主力编码工具吗?" 197 条评论,信息密度极高。十几个真实用户在讨论他们每天用的配置、踩过的坑、以及为什么明明知道本地…
本文总结了Hacker News讨论中关于使用本地模型(主要是Qwen 3.6 35B-A3B)作为主力编码工具的实战经验,包括配置、效果(约为前沿模型的50-75%)、关键技巧(如preserve_thinking)和不同用户的立场。