unified-memory

标签

Cards List
#unified-memory

我们迫切需要一款80-160B的模型。统一内存设备市场需要更多模型。

Reddit r/LocalLLaMA · 2026-06-17

作者认为,当前迫切需要80-160B参数范围的AI模型,以支持使用统一内存设备的用户(例如高内存的Apple/AMD系统),因为最近的模型对于他们的硬件来说要么太小,要么太大。

0 人收藏 0 人点赞
#unified-memory

AMD 力推统一内存架构

Reddit r/LocalLLaMA · 2026-06-11

AMD 将统一内存架构视为下一代产品(如 Ryzen AI MAX 400 系列(Gorgon Halo))的关键推动力,从而影响其 AI 和计算工作负载的产品路线图。

0 人收藏 0 人点赞
#unified-memory

Nvidia RTX Spark 登陆 Windows PC,搭载 Arm CPU、RTX GPU 和统一内存

Ars Technica · 2026-06-01 缓存

英伟达发布了 RTX Spark,这是一款专为 Windows PC 设计的 Arm 芯片,集成了 20 核 Grace CPU、最高 6,144 个 Blackwell GPU 核心和最高 128GB 统一内存,旨在为轻薄笔记本和紧凑台式机带来高性能和 AI 能力。

0 人收藏 0 人点赞
#unified-memory

@AYi_AInotes: Damn,英伟达和老黄真的是憋了个大的啊,真特么牛逼 今天全网都在转黄仁勋这台拔了电源还能满帧跑 3A 的笔记本,但大多数人看错了重点,游戏其实只是这台机器的糖衣。 真正的核弹是那 128GB 统一内存,它意味着你桌上一台轻薄本,能在本地…

X AI KOLs Timeline · 2026-06-01 缓存

文章评价NVIDIA新款笔记本,其128GB统一内存使本地运行200B大模型成为可能,拔电不掉帧,瞄准AI本地部署用户,认为这是将数据中心能力下放至便携设备的重要一步。

0 人收藏 0 人点赞
#unified-memory

@tunguz: 如果他们能推出一款售价低于1000美元的"迷你版"DGX Spark,那简直就是在印钞。

X AI KOLs Timeline · 2026-05-30 缓存

一条推文猜测,售价低于1000美元的NVIDIA DGX Spark迷你版可能带来巨额利润;同时,另一条引用推文讨论了即将推出的NVIDIA N1和N1X ARM架构笔记本电脑芯片,目标直指苹果的轻薄笔记本电脑市场。

0 人收藏 0 人点赞
#unified-memory

Apple M3 Ultra上实时扩散模型推理的系统优化

arXiv cs.LG · 2026-05-19 缓存

本文对Apple M3 Ultra上的实时扩散模型推理进行了系统优化研究,通过CoreML转换和蒸馏模型在512x512分辨率下达到了22.7 FPS,揭示了针对CUDA优化的技术无法直接迁移到Apple统一内存架构。

0 人收藏 0 人点赞
#unified-memory

AMD的小型AI PC预示着模型推理向本地化未来的转变

Reddit r/ArtificialInteligence · 2026-05-18 缓存

AMD的Ryzen AI Max平台配备128GB统一内存,可本地推理高达2000亿参数的大模型,旨在将AI工作负载从云端转移到紧凑的个人硬件上。

0 人收藏 0 人点赞
#unified-memory

@mr_r0b0t: 如果你的设备拥有24-128GB统一内存,并且使用@NousResearch Hermes agents,那么这正适合你!你现在可以运行完全本地的智能体团队…

X AI KOLs Timeline · 2026-05-13 缓存

宣布在拥有24-128GB统一内存的系统上,可以使用NousResearch Hermes agents运行完全本地的智能体团队。每个智能体都有独立的Hermes会话,并通过本地协调器在长时间运行的任务上协同工作。

0 人收藏 0 人点赞
#unified-memory

MTP+GGML_CUDA_ENABLE_UNIFIED_MEMORY=1 - llama.cpp

Reddit r/LocalLLaMA · 2026-05-12

一位用户在 llama.cpp 上使用 GGML_CUDA_ENABLE_UNIFIED_MEMORY=1 标志对令牌生成速度进行基准测试,比较启用和未启用 MTP(多令牌预测)时的性能。结果显示,在 RTX5090 上使用 Qwen3.6-27B 模型时,启用 MTP 后速度从 49 tok/s 显著提升至 64 tok/s。

0 人收藏 0 人点赞
#unified-memory

@MemoryReboot_: 为什么 Mac Studio 是本地 AI 的陷阱——大统一内存看似美好,但适合聊天机器人,不适合 24/7 的工具调用工作流——没有 CUDA 意味着没有 vLLM、SGLang 和张量并行——花 1 万多美元买一台无法升级的“死胡同”设备,就像拥有一辆最高时速只有 100 公里的保时捷

X AI KOLs Timeline · 2026-05-09

文章认为,尽管 Mac Studio 拥有大容量统一内存,但由于缺乏 CUDA 支持且硬件不可升级,它并不适合 24/7 的本地 AI 工作流。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈