数据中心移动到你的设备上(4分钟阅读)
摘要
Perplexity在2026年台北国际电脑展上发布了一款混合本地-云端推理系统,该系统能智能地在设备端模型和云端模型之间路由查询,基于其早前的Personal Computer agent构建。
Perplexity在2026年台北国际电脑展上发布了一款混合本地-云端推理系统,该系统能智能地根据任务轻重量级在设备端模型和云端模型之间路由查询——轻量任务用设备端模型,复杂推理用云端模型,该系统基于该公司早前的Personal Computer agent构建。
相似文章
本地模型优化(3 分钟阅读)
本文分析了在 MacBook Pro 上本地运行 AI 推理的可行性,对比了本地 Qwen 35B 模型与云端 Claude Opus 4.5。结论是,对于常规任务,本地模型速度快 2 倍,尽管在能力上略有差距,但仍是日常工作量中一半任务的实用选择。
AMD的小型AI PC预示着模型推理向本地化未来的转变
AMD的Ryzen AI Max平台配备128GB统一内存,可本地推理高达2000亿参数的大模型,旨在将AI工作负载从云端转移到紧凑的个人硬件上。
AI推理遵循着截然不同的规则(9分钟阅读)
文章指出AI推理对云数据基础设施提出了独特挑战,其需求更接近高并发OLTP系统,而非传统面向人类速度的应用。文章强调需要优化存储和数据访问层,以应对自主智能体驱动的"AI数据海啸"。
@agupta: 我怀疑我们一直处于AI计算的大型机时代,而现在即将进入它的个人电脑时代。数据中心正在……
Alex Gupta 认为AI计算时代正从类似大型机的数据中心转向个人硬件,例如NVIDIA的RTX Spark Superchip,用于个人AI代理和游戏。
"电脑已走向个人化"(阅读时间约 4 分钟)
Perplexity 推出了“Personal Computer”AI 平台,该平台摒弃了传统的操作系统模式,转而采用概率式目标达成机制。通过深度网页研究作为核心支撑,它能自主完成多步骤工作流程,彻底解决软件碎片化问题。