标签
OpenAI 推出了与 Broadcom 合作打造的定制推理芯片 Jalapeño,标志着科技巨头在减少对英伟达依赖方面迈出了重要一步。
孙宇晨近期表示虚拟AI红利将尽,未来三年主线是物理AI,并已投资10亿美元。过去他的预测(英伟达、存储赛道)均获得巨大涨幅。
个人感悟:获取更多算力只会暴露对算力的进一步需求,反映了人工智能和科技领域中永不满足的需求。
在人工智能驱动的存储芯片短缺背景下,美光科技(Micron)表现强劲,报告创纪录的季度营收以及与Anthropic的战略合作,而消费者则面临价格上涨压力。
高通正通过多起收购积极扩张AI业务,包括收购Modular(Mojo编程语言和MAX推理框架的创建者)以及可能收购Tenstorrent,这表明其正大力挑战Nvidia的CUDA生态系统。
OpenAI 宣布了其首款定制AI推理芯片 Jalapeño,该芯片是与Broadcom合作开发的,旨在减少对Nvidia GPU的依赖,预计在2026年底前部署。
推测带微型摄像头的耳机(由智能手机供电)是智能体AI的理想硬件形态,与智能眼镜不同,它提供了隐蔽性和自然交互。
宣布一款服务器配置,搭载4块Nvidia V100 GPU和128GB Tesla内存,面向AI大模型工作负载。
一份关于本地AI硬件在内存容量、带宽和软件栈方面的详细比较,涵盖GPU、Apple Silicon、AMD、Intel、Tenstorrent等,重点关注AI推理中哪些瓶颈最关键。
本文用产业链思维深度分析了HBM(高带宽内存)的关键技术、核心厂商(SK海力士、三星、美光)以及先进封装工艺(CoWoS、CoPoS),指出了相关投资机会。
Google研究人员发表了一篇论文,总结了从TPU v2到Ironwood的TPU超级计算机的演进,详细介绍了架构稳定性、规模、弹性、能效以及八年间3600倍的性能提升。
一条推文讨论了硬件如何桥接人工智能与物理世界,并链接到一份关于物理智能的指南。
在一条推文中,Sarah Hooker 指出 GPU 并不适合现实世界数据的长尾分布,并建议需要替代性 AI 硬件。
探讨人脑(15瓦)与AI硬件(实时模拟需数十亿瓦)之间巨大的能效差距,重点介绍旨在缩小这一差距的神经形态计算方案,如自旋忆阻器、相变材料和超级图灵AI。
伯恩斯坦研报预测 Agentic AI 时代将推动 CPU 在数据中心角色逆转,服务器 CPU 可寻址市场2030年或达2230亿美元,看好海光信息、Arm等标的。
一条推文声称,仅需4679美元,NVIDIA DGX Spark就能运行本地大语言模型,替代虚拟助手和员工,突出了其性价比。
讨论运行 Qwen 3.6 模型的最便宜硬件选项,比较 RTX 3090 和 Tesla V100 GPU,并详细列出约 2000 美元系统的成本构成。
NVIDIA 宣布推出第三代 DGX Spark AI 超级计算机。