memory-management

标签

Cards List
#memory-management

OxCaml 中其他语言应该借鉴的功能 - The Consensus

Lobsters Hottest · 昨天 缓存

OxCaml 是 Jane Street 的 OCaml 超集,引入了一个 `[@zero_alloc]` 注解,强制编译器在调用树中任何函数在堆上分配内存时拒绝构建,将内存分配检测从运行时分析转变为编译时强制执行。

0 人收藏 0 人点赞
#memory-management

@mvanhorn: https://x.com/mvanhorn/status/2070966613994795489

X AI KOLs Timeline · 昨天 缓存

作者认为,AI代理的内存膨胀会降低性能,并建议将memory和CLAUDE.md文件控制在200行以内,使用按需检索而非将所有内容加载到上下文中。

0 人收藏 0 人点赞
#memory-management

C in the Linux Kernel

Lobsters Hottest · 昨天 缓存

本文深入介绍了 Linux 内核中 C 语言与普通用户空间 C 的区别,涵盖资源管理、错误处理、并发、日志记录、静态分析等核心技巧,使用了大量 GNU C 扩展和内核特有模式。

0 人收藏 0 人点赞
#memory-management

@bellicosiX:这篇读起来真是令人愉悦。写得充满爱意。我很感激。@abhi9u

X AI KOLs Timeline · 昨天 缓存

一篇全面、详尽的博客文章(堪比书籍),涵盖 Linux 中的虚拟内存概念,包括页表、TLB、按需分页、写时复制、内存映射 I/O 以及性能影响,通过进程与内核之间的对话呈现。

0 人收藏 0 人点赞
#memory-management

@_avichawla: 一个棘手的LLM面试题:你在vLLM上部署推理模型,长序列时GPU内存总是不够用。于是你加入KV缓存压缩,驱逐了90%的缓存token。显存占用依旧,GPU仍然内存不足。为什么?

X AI KOLs Timeline · 昨天 缓存

解释了为什么在vLLM上部署推理模型时,驱逐90%的KV缓存token无法释放GPU内存,原因是分页注意力碎片化。同时介绍了NVIDIA的TriAttention解决方案,可实现2.5倍加速和10.7倍内存缩减。

0 人收藏 0 人点赞
#memory-management

Gossamer:一种具有真实goroutines和无暂停内存的Rust风格语言

Hacker News Top · 2天前 缓存

Gossamer是一种受Rust启发的新编程语言,具有真实goroutines、基于引用计数和区域的无暂停确定性内存管理,以及配备LLVM编译的字节码虚拟机。它旨在提供富有表现力的语法,无需借用检查器或垃圾回收暂停。

0 人收藏 0 人点赞
#memory-management

面向长时程LLM推理的上下文回收

arXiv cs.CL · 3天前 缓存

本文介绍了ContextForge,一种层次化内存架构,将LLM上下文窗口视为可回收工作空间,在长时程任务上实现了显著的令牌和速度改进,同时在拥有2.76亿行的企业基准上保持了准确性。

0 人收藏 0 人点赞
#memory-management

The Garbage Collection Handbook: The Art of Automatic Memory Management (2nd Ed)

Hacker News Top · 3天前 缓存

《垃圾回收手册》第二版更新了关于自动内存管理的权威参考,涵盖了新的硬件、软件和算法发展。

0 人收藏 0 人点赞
#memory-management

@wquguru: https://x.com/wquguru/status/2069641926752780384

X AI KOLs Timeline · 5天前 缓存

本文全面梳理了截至2026年中,AI Agent记忆(Memory)的完整架构分层,包括规则文件、常驻画像、历史召回和证据链,阐述了不同层次记忆的存储方式、加载时机和治理原则,强调记忆在帮助Agent实现跨会话复利工作中的关键作用。

0 人收藏 0 人点赞
#memory-management

一款你扮演操作系统,管理进程、内存和I/O事件的游戏

Hacker News Top · 5天前 缓存

你扮演操作系统,管理进程、内存和I/O事件,让用户满意。

0 人收藏 0 人点赞
#memory-management

问题:Hermes 代理应如何处理跨会话的持久化内存?

Reddit r/AI_Agents · 2026-06-18

社区关于 Hermes 代理应如何处理跨会话持久化内存的讨论,探索外部内存层(8mem),并比较了感知内存与通用输出。

0 人收藏 0 人点赞
#memory-management

@DODOREACH: https://x.com/DODOREACH/status/2067571689634894251

X AI KOLs Timeline · 2026-06-18 缓存

在使用Hermes Agent三个月后,作者分享了关于内存管理和配置文件优化的见解,发现更少的内存和更少的配置文件会带来更好的结果。

0 人收藏 0 人点赞
#memory-management

llama.cpp - 如何在GPU上释放更多空间

Reddit r/LocalLLaMA · 2026-06-17

一则讨论如何在llama.cpp中释放GPU内存实用技巧的帖子,例如将mmproj卸载到CPU、调整KV缓存类型,同时讨论了--cache-type-k/v和--spec-draft-n-max等参数。

0 人收藏 0 人点赞
#memory-management

我通过MCP给我的AI代理带来了共享内存——方法如下

Reddit r/AI_Agents · 2026-06-16

Nexus Memory 是一个原生 MCP 的内存服务器,允许 AI 代理通过统一协议共享上下文,实现跨不同代理的持久化、协调一致的内存,无需自定义集成。

0 人收藏 0 人点赞
#memory-management

GeneralVLA-2:几何感知重建与受控记忆用于机器人规划

Hugging Face Daily Papers · 2026-06-16 缓存

GeneralVLA-2 引入了 GeoFuse-MV3D 以改进 3D 重建,以及一个受控的 KnowledgeBank 以在机器人操作任务中实现更好的记忆管理,在多个基准测试上取得了性能提升。

0 人收藏 0 人点赞
#memory-management

OPD-Evolver:通过在线策略蒸馏培育整体智能体进化器

Hugging Face Daily Papers · 2026-06-16 缓存

OPD-Evolver 提出了一种自我进化智能体框架,采用慢-快协同进化与在线策略自蒸馏,以增强记忆管理和策略学习,在多个领域基准测试中优于 ReasoningBank 和 Skill0 等现有方法。

0 人收藏 0 人点赞
#memory-management

@zaimiri: https://x.com/zaimiri/status/2066117404392890835

X AI KOLs Timeline · 2026-06-14 缓存

一份详细的7天指南,教你搭建Hermes AI代理,涵盖身份、记忆、工具和Telegram集成。

0 人收藏 0 人点赞
#memory-management

Python 3.14 垃圾回收的波折

Hacker News Top · 2026-06-12 缓存

Python 3.14 引入了一个增量垃圾回收器,但由于内存压力报告,该回收器在 3.14.5 中被回滚。本文解释了这些变化、它们的影响以及围绕回滚的争议。

0 人收藏 0 人点赞
#memory-management

G-Long: 图增强内存管理用于高效长期对话代理

arXiv cs.CL · 2026-06-12 缓存

G-Long 提出了一种用于长期对话代理的图增强内存管理框架,利用微调的小型语言模型进行结构化三元组提取和关联检索,在响应生成和内存检索方面取得了最先进的性能,同时降低了计算开销。

0 人收藏 0 人点赞
#memory-management

如何防止 llama.cpp 将数据卸载到交换空间?

Reddit r/LocalLLaMA · 2026-06-11

用户寻求关于如何防止 llama.cpp 在 RAM 完全耗尽前将 KV 缓存卸载到交换空间的建议,并分享了他们在配备 96GB RAM 的 M2 Max 和大型 Qwen 模型上的配置。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈