标签
OxCaml 是 Jane Street 的 OCaml 超集,引入了一个 `[@zero_alloc]` 注解,强制编译器在调用树中任何函数在堆上分配内存时拒绝构建,将内存分配检测从运行时分析转变为编译时强制执行。
作者认为,AI代理的内存膨胀会降低性能,并建议将memory和CLAUDE.md文件控制在200行以内,使用按需检索而非将所有内容加载到上下文中。
本文深入介绍了 Linux 内核中 C 语言与普通用户空间 C 的区别,涵盖资源管理、错误处理、并发、日志记录、静态分析等核心技巧,使用了大量 GNU C 扩展和内核特有模式。
一篇全面、详尽的博客文章(堪比书籍),涵盖 Linux 中的虚拟内存概念,包括页表、TLB、按需分页、写时复制、内存映射 I/O 以及性能影响,通过进程与内核之间的对话呈现。
解释了为什么在vLLM上部署推理模型时,驱逐90%的KV缓存token无法释放GPU内存,原因是分页注意力碎片化。同时介绍了NVIDIA的TriAttention解决方案,可实现2.5倍加速和10.7倍内存缩减。
Gossamer是一种受Rust启发的新编程语言,具有真实goroutines、基于引用计数和区域的无暂停确定性内存管理,以及配备LLVM编译的字节码虚拟机。它旨在提供富有表现力的语法,无需借用检查器或垃圾回收暂停。
本文介绍了ContextForge,一种层次化内存架构,将LLM上下文窗口视为可回收工作空间,在长时程任务上实现了显著的令牌和速度改进,同时在拥有2.76亿行的企业基准上保持了准确性。
《垃圾回收手册》第二版更新了关于自动内存管理的权威参考,涵盖了新的硬件、软件和算法发展。
本文全面梳理了截至2026年中,AI Agent记忆(Memory)的完整架构分层,包括规则文件、常驻画像、历史召回和证据链,阐述了不同层次记忆的存储方式、加载时机和治理原则,强调记忆在帮助Agent实现跨会话复利工作中的关键作用。
社区关于 Hermes 代理应如何处理跨会话持久化内存的讨论,探索外部内存层(8mem),并比较了感知内存与通用输出。
在使用Hermes Agent三个月后,作者分享了关于内存管理和配置文件优化的见解,发现更少的内存和更少的配置文件会带来更好的结果。
一则讨论如何在llama.cpp中释放GPU内存实用技巧的帖子,例如将mmproj卸载到CPU、调整KV缓存类型,同时讨论了--cache-type-k/v和--spec-draft-n-max等参数。
Nexus Memory 是一个原生 MCP 的内存服务器,允许 AI 代理通过统一协议共享上下文,实现跨不同代理的持久化、协调一致的内存,无需自定义集成。
GeneralVLA-2 引入了 GeoFuse-MV3D 以改进 3D 重建,以及一个受控的 KnowledgeBank 以在机器人操作任务中实现更好的记忆管理,在多个基准测试上取得了性能提升。
OPD-Evolver 提出了一种自我进化智能体框架,采用慢-快协同进化与在线策略自蒸馏,以增强记忆管理和策略学习,在多个领域基准测试中优于 ReasoningBank 和 Skill0 等现有方法。
一份详细的7天指南,教你搭建Hermes AI代理,涵盖身份、记忆、工具和Telegram集成。
Python 3.14 引入了一个增量垃圾回收器,但由于内存压力报告,该回收器在 3.14.5 中被回滚。本文解释了这些变化、它们的影响以及围绕回滚的争议。
G-Long 提出了一种用于长期对话代理的图增强内存管理框架,利用微调的小型语言模型进行结构化三元组提取和关联检索,在响应生成和内存检索方面取得了最先进的性能,同时降低了计算开销。
用户寻求关于如何防止 llama.cpp 在 RAM 完全耗尽前将 KV 缓存卸载到交换空间的建议,并分享了他们在配备 96GB RAM 的 M2 Max 和大型 Qwen 模型上的配置。