@seclink: 陈天桥再不努力一把, 大模型记忆就要被字节偷家了... 赶了个大早, 很努力,但是执行的人不行 ... OpenViking 开源的 cli 工具做了好多迭代优化... 早晚你们会想起,用AI 编程改造复杂项目时, 一定会用上大模型记忆的…

X AI KOLs Following 工具

摘要

OpenViking是一个开源的CLI工具,旨在通过大模型记忆功能优化复杂项目的AI编程体验并节省token。文章评论了其在执行层面的表现以及与字节跳动等竞争者在LLM记忆领域的动态。

陈天桥再不努力一把, 大模型记忆就要被字节偷家了... 赶了个大早, 很努力,但是执行的人不行 ... OpenViking 开源的 cli 工具做了好多迭代优化... 早晚你们会想起,用AI 编程改造复杂项目时, 一定会用上大模型记忆的(至少为了省token)。
查看原文
查看缓存全文

缓存时间: 2026/05/10 14:25

陈天桥再不努力一把, 大模型记忆就要被字节偷家了…

赶了个大早, 很努力,但是执行的人不行 …

OpenViking 开源的 cli 工具做了好多迭代优化…

早晚你们会想起,用AI 编程改造复杂项目时,

一定会用上大模型记忆的(至少为了省token)。

相似文章

@WY_mask: 给各类 AI 编程助手打造持久化记忆引擎 http://github.com/rohitg00/agentmemory… 在后台静默记录代码修改和上下文 自动提取并压缩成结构化记忆 节省长上下文带来的 Token 消耗 关联过去的信息,随…

X AI KOLs Timeline

agentmemory 是一个为 AI 编程助手提供持久化记忆的开源工具,能静默记录代码修改和上下文,自动提取并压缩成结构化记忆,降低 Token 消耗,并支持 Claude Code、Codex 等多种主流平台。

@NFTCPS: 4GB显存跑70B大模型?这事儿真成了! AirLLM玩了个骚操作——分层推理,不一次性把模型怼进显存,而是一层层加载、算完就扔,硬生生把巨无霸塞进小破卡。 最骚的是:100%开源,白嫖警告 https://github.com/0xSo…

X AI KOLs Timeline

AirLLM 是一个完全开源的工具,通过分层推理技术(逐层加载并立即释放显存),使得 70B 大语言模型可在仅 4GB 显存的 GPU 上运行,无需量化、蒸馏或剪枝,并已支持 Llama3.1 405B 在 8GB 显存上运行。

@yibie: 本地模型做主力编码工具:2026 年中的实战报告 Hacker News 上有一个帖子,标题很直接:"有人用本地模型做主力编码工具吗?" 197 条评论,信息密度极高。十几个真实用户在讨论他们每天用的配置、踩过的坑、以及为什么明明知道本地…

X AI KOLs Timeline

本文总结了Hacker News讨论中关于使用本地模型(主要是Qwen 3.6 35B-A3B)作为主力编码工具的实战经验,包括配置、效果(约为前沿模型的50-75%)、关键技巧(如preserve_thinking)和不同用户的立场。