memory-management

#memory-management

OxCaml 中其他语言应该借鉴的功能 - The Consensus

Lobsters Hottest ↗ · 昨天缓存

OxCaml 是 Jane Street 的 OCaml 超集，引入了一个 `[@zero_alloc]` 注解，强制编译器在调用树中任何函数在堆上分配内存时拒绝构建，将内存分配检测从运行时分析转变为编译时强制执行。

0 人收藏 0 人点赞

#memory-management

@mvanhorn: https://x.com/mvanhorn/status/2070966613994795489

X AI KOLs Timeline ↗ · 昨天缓存

作者认为，AI代理的内存膨胀会降低性能，并建议将memory和CLAUDE.md文件控制在200行以内，使用按需检索而非将所有内容加载到上下文中。

0 人收藏 0 人点赞

#memory-management

C in the Linux Kernel

Lobsters Hottest ↗ · 昨天缓存

本文深入介绍了 Linux 内核中 C 语言与普通用户空间 C 的区别，涵盖资源管理、错误处理、并发、日志记录、静态分析等核心技巧，使用了大量 GNU C 扩展和内核特有模式。

0 人收藏 0 人点赞

#memory-management

@bellicosiX：这篇读起来真是令人愉悦。写得充满爱意。我很感激。@abhi9u

X AI KOLs Timeline ↗ · 昨天缓存

一篇全面、详尽的博客文章（堪比书籍），涵盖 Linux 中的虚拟内存概念，包括页表、TLB、按需分页、写时复制、内存映射 I/O 以及性能影响，通过进程与内核之间的对话呈现。

0 人收藏 0 人点赞

#memory-management

@_avichawla: 一个棘手的LLM面试题：你在vLLM上部署推理模型，长序列时GPU内存总是不够用。于是你加入KV缓存压缩，驱逐了90%的缓存token。显存占用依旧，GPU仍然内存不足。为什么？

X AI KOLs Timeline ↗ · 昨天缓存

解释了为什么在vLLM上部署推理模型时，驱逐90%的KV缓存token无法释放GPU内存，原因是分页注意力碎片化。同时介绍了NVIDIA的TriAttention解决方案，可实现2.5倍加速和10.7倍内存缩减。

0 人收藏 0 人点赞

#memory-management

Gossamer：一种具有真实goroutines和无暂停内存的Rust风格语言

Hacker News Top ↗ · 2天前缓存

Gossamer是一种受Rust启发的新编程语言，具有真实goroutines、基于引用计数和区域的无暂停确定性内存管理，以及配备LLVM编译的字节码虚拟机。它旨在提供富有表现力的语法，无需借用检查器或垃圾回收暂停。

0 人收藏 0 人点赞

#memory-management

面向长时程LLM推理的上下文回收

arXiv cs.CL ↗ · 3天前缓存

本文介绍了ContextForge，一种层次化内存架构，将LLM上下文窗口视为可回收工作空间，在长时程任务上实现了显著的令牌和速度改进，同时在拥有2.76亿行的企业基准上保持了准确性。

0 人收藏 0 人点赞

#memory-management

The Garbage Collection Handbook: The Art of Automatic Memory Management (2nd Ed)

Hacker News Top ↗ · 3天前缓存

《垃圾回收手册》第二版更新了关于自动内存管理的权威参考，涵盖了新的硬件、软件和算法发展。

0 人收藏 0 人点赞

#memory-management

@wquguru: https://x.com/wquguru/status/2069641926752780384

X AI KOLs Timeline ↗ · 5天前缓存

本文全面梳理了截至2026年中，AI Agent记忆（Memory）的完整架构分层，包括规则文件、常驻画像、历史召回和证据链，阐述了不同层次记忆的存储方式、加载时机和治理原则，强调记忆在帮助Agent实现跨会话复利工作中的关键作用。

0 人收藏 0 人点赞

#memory-management

一款你扮演操作系统，管理进程、内存和I/O事件的游戏

Hacker News Top ↗ · 5天前缓存

你扮演操作系统，管理进程、内存和I/O事件，让用户满意。

0 人收藏 0 人点赞

#memory-management

问题：Hermes 代理应如何处理跨会话的持久化内存？

Reddit r/AI_Agents ↗ · 2026-06-18

社区关于 Hermes 代理应如何处理跨会话持久化内存的讨论，探索外部内存层（8mem），并比较了感知内存与通用输出。

0 人收藏 0 人点赞

#memory-management

@DODOREACH: https://x.com/DODOREACH/status/2067571689634894251

X AI KOLs Timeline ↗ · 2026-06-18 缓存

在使用Hermes Agent三个月后，作者分享了关于内存管理和配置文件优化的见解，发现更少的内存和更少的配置文件会带来更好的结果。

0 人收藏 0 人点赞

#memory-management

llama.cpp - 如何在GPU上释放更多空间

Reddit r/LocalLLaMA ↗ · 2026-06-17

一则讨论如何在llama.cpp中释放GPU内存实用技巧的帖子，例如将mmproj卸载到CPU、调整KV缓存类型，同时讨论了--cache-type-k/v和--spec-draft-n-max等参数。

0 人收藏 0 人点赞

#memory-management

我通过MCP给我的AI代理带来了共享内存——方法如下

Reddit r/AI_Agents ↗ · 2026-06-16

Nexus Memory 是一个原生 MCP 的内存服务器，允许 AI 代理通过统一协议共享上下文，实现跨不同代理的持久化、协调一致的内存，无需自定义集成。

0 人收藏 0 人点赞

#memory-management

GeneralVLA-2：几何感知重建与受控记忆用于机器人规划

Hugging Face Daily Papers ↗ · 2026-06-16 缓存

GeneralVLA-2 引入了 GeoFuse-MV3D 以改进 3D 重建，以及一个受控的 KnowledgeBank 以在机器人操作任务中实现更好的记忆管理，在多个基准测试上取得了性能提升。

0 人收藏 0 人点赞

#memory-management

OPD-Evolver：通过在线策略蒸馏培育整体智能体进化器

Hugging Face Daily Papers ↗ · 2026-06-16 缓存

OPD-Evolver 提出了一种自我进化智能体框架，采用慢-快协同进化与在线策略自蒸馏，以增强记忆管理和策略学习，在多个领域基准测试中优于 ReasoningBank 和 Skill0 等现有方法。

0 人收藏 0 人点赞

#memory-management

@zaimiri: https://x.com/zaimiri/status/2066117404392890835

X AI KOLs Timeline ↗ · 2026-06-14 缓存

一份详细的7天指南，教你搭建Hermes AI代理，涵盖身份、记忆、工具和Telegram集成。

0 人收藏 0 人点赞

#memory-management

Python 3.14 垃圾回收的波折

Hacker News Top ↗ · 2026-06-12 缓存

Python 3.14 引入了一个增量垃圾回收器，但由于内存压力报告，该回收器在 3.14.5 中被回滚。本文解释了这些变化、它们的影响以及围绕回滚的争议。

0 人收藏 0 人点赞

#memory-management

G-Long: 图增强内存管理用于高效长期对话代理

arXiv cs.CL ↗ · 2026-06-12 缓存

G-Long 提出了一种用于长期对话代理的图增强内存管理框架，利用微调的小型语言模型进行结构化三元组提取和关联检索，在响应生成和内存检索方面取得了最先进的性能，同时降低了计算开销。

0 人收藏 0 人点赞

#memory-management

如何防止 llama.cpp 将数据卸载到交换空间？

Reddit r/LocalLLaMA ↗ · 2026-06-11

用户寻求关于如何防止 llama.cpp 在 RAM 完全耗尽前将 KV 缓存卸载到交换空间的建议，并分享了他们在配备 96GB RAM 的 M2 Max 和大型 Qwen 模型上的配置。

0 人收藏 0 人点赞

memory-management

提交意见反馈