nvidia

#nvidia

英伟达AI芯片在中国价格翻倍，同时应对AI带来的水耗问题

Reddit r/ArtificialInteligence ↗ · 10小时前缓存

由于美国出口限制，英伟达的AI芯片在中国以创纪录的高价销售，同时该公司还宣布推出新的液冷系统以减少数据中心用水量。

0 人收藏 0 人点赞

#nvidia

人工智能是‘一个大泡沫’吗？科技股抛售的背后

Reddit r/artificial ↗ · 14小时前缓存

本文探讨了人工智能相关科技股出现的抛售潮，引发人们质疑对人工智能的巨额投入是否能够带来回报。文章强调市场波动性，指出美光、英伟达、Alphabet等主要公司股价大幅下跌。

0 人收藏 0 人点赞

#nvidia

NVIDIA与AWS合作，将AI大规模投入生产

NVIDIA Blog ↗ · 23小时前缓存

NVIDIA与AWS宣布推出搭载NVIDIA RTX PRO 4500 Blackwell GPU的全新EC2 G7实例，以及在Amazon OpenSearch Serverless中提供GPU加速的向量搜索功能，使企业能够以更优的性能和更低的运营复杂性，大规模部署AI应用。

0 人收藏 0 人点赞

#nvidia

@charles_irl: dflash 高速运转

X AI KOLs Timeline ↗ · 23小时前缓存

NVIDIA 宣布推出 DFlash，一种用于推测解码的开源块扩散模型，在 Blackwell GPU 上可实现高达 15 倍的推理吞吐量提升，同时保持交互性。

0 人收藏 0 人点赞

#nvidia

NVIDIA的新芯片刚刚证明AI“安全”一直是场秀。我们还没为2029年做好准备。

Reddit r/ArtificialInteligence ↗ · 昨天

NVIDIA的新芯片使得在本地运行500B参数的模型成为可能，凸显出AI安全措施仅仅是行为上的减速带，离线即消失，为大规模欺骗和操纵带来了前所未有的风险。

0 人收藏 0 人点赞

#nvidia

AI泡沫即将破裂？英伟达悄然收购Essential AI团队，包括Transformer论文合著者Ashish Vaswani。Vaswani此前为其AI公司融资困难。

Reddit r/ArtificialInteligence ↗ · 昨天

英伟达悄然收购了Essential AI的团队，包括Transformer论文合著者Ashish Vaswani，他此前为其初创公司融资困难。Vaswani将参与英伟达Nemotron开源模型的开发。

0 人收藏 0 人点赞

#nvidia

@arcinstitute: 生物学的未来是代理性的。我们很自豪能与NVIDIA合作开发Evo系列模型，并期待看到…

X AI KOLs Following ↗ · 昨天缓存

NVIDIA推出了BioNeMo Agent Toolkit，这是一个开放的工具包，使AI代理能够执行蛋白质结构预测、分子对接和生成化学等任务，与Arc Institute合作加速可编程生物学。

0 人收藏 0 人点赞

#nvidia

我渴望在我的Strix Halo上获得15倍加速

Reddit r/LocalLLaMA ↗ · 昨天

Nvidia声称使用扩散模型在文本生成上实现15倍加速，一次性生成整个文本块。

0 人收藏 0 人点赞

#nvidia

xAI发布了65个生物、物理和化学辅导员的职位。追踪了8家AI实验室的招聘数据，以了解各实验室实际的发展方向。

Reddit r/ArtificialInteligence ↗ · 昨天

分析主要AI实验室的招聘数据以推断其战略方向，指出xAI专注于科学辅导员，Nvidia推动数据中心，OpenAI工程团队增长。

0 人收藏 0 人点赞

#nvidia

更新：适用于ik_llama.cpp的Qwen-27B-IQ4_KS和Qwen-27B-IQ_KS_KT量化版本，尤其针对16GB显存的NVIDIA显卡

Reddit r/LocalLLaMA ↗ · 昨天

面向16GB显存NVIDIA GPU优化的新型Qwen3.6-27B GGUF量化版本，包含实验性Trellis变体，并附带了困惑度基准测试。

0 人收藏 0 人点赞

#nvidia

@aijoey: 给我的所有新DGX Spark用户. https://github.com/joeynyc/spark-doctor…

X AI KOLs Timeline ↗ · 昨天缓存

Spark Doctor 是一个开源的诊断命令行工具，专为NVIDIA DGX Spark设计，可收集系统、GPU、内存、Docker和配方数据，应用特定规则，并输出常见问题的可能原因及后续步骤。

0 人收藏 0 人点赞

#nvidia

@PyTorch: SGLang 为 DeepSeek-V4 提供了首日支持，而 @lmsysorg 与 @NVIDIAAI 工程团队的合作…

X AI KOLs Following ↗ · 昨天缓存

SGLang 为 DeepSeek-V4 提供了首日支持，LMSys 与 NVIDIA 工程团队的合作在生产环境中实现了高达 5 倍的吞吐量提升，相关改进已在 SemiAnalysis InferenceX 仪表盘上展示。

0 人收藏 0 人点赞

#nvidia

企业如何构建值得信赖的专用AI

NVIDIA Blog ↗ · 昨天缓存

NVIDIA 推出 Agent Toolkit，这是一个开放的模块化基础架构，包含模型、工具、技能和安全运行时，帮助企业为各行各业构建专用、可信的AI智能体。

0 人收藏 0 人点赞

#nvidia

Valve确认正在与Intel和Nvidia合作，让SteamOS支持更多GPU

The Verge ↗ · 昨天缓存

Valve正在与Intel和Nvidia合作，将SteamOS支持扩展到更多GPU和手持设备，包括为Intel手持设备提供初始固件，以及为Nvidia持续进行驱动开发。

0 人收藏 0 人点赞

#nvidia

@DataChaz：@NVIDIA 刚刚悄悄发布了一个极其令人印象深刻的语音识别模型，它彻底改变了本地语音处理的计算方式……

X AI KOLs Timeline ↗ · 昨天缓存

NVIDIA 悄然发布了 Nemotron-3.5-ASR，这是一个轻量级、参数规模为 0.6B 的开源语音识别模型，专为实时流式传输设计，支持 40 多种语言、低延迟和缓存感知架构。

0 人收藏 0 人点赞

#nvidia

NVIDIA为全球500强最快超级计算机中的400多台提供动力

NVIDIA Blog ↗ · 昨天缓存

NVIDIA技术现已为全球500强最快超级计算机中的400多台提供动力（占TOP500的81%），GPU和网络采用率创下纪录，并在Green500榜单上获得最高效率。

0 人收藏 0 人点赞

#nvidia

NVIDIA 为电信运营带来可信赖的全天候 AI 代理

NVIDIA Blog ↗ · 昨天缓存

NVIDIA 在 DTW Ignite 2026 上发布了面向电信运营的新 AI 代理和工具，包括合成数据生成和安全代理运行时。该平台旨在通过结合领域特定模型、隐私安全的合成数据和基于策略的护栏，实现自主网络。

0 人收藏 0 人点赞

#nvidia

@RayFernando1337: “所选运行时使用NVFP4权重以获得最大性能。从原始FP8权重，我们进行了内部量…

X AI KOLs Following ↗ · 昨天

讨论使用NVFP4 4位浮点权重以获得最大性能，通过使用NVIDIA ModelOpt从FP8进行内部量化实现，突出了该数据格式的双缩放因子以保持高动态范围。

0 人收藏 0 人点赞

#nvidia

@philipkiely: https://x.com/philipkiely/status/2069212319746506968

X AI KOLs Timeline ↗ · 昨天缓存

Baseten 宣布推出针对 GLM-5.2 开源模型的世界最快 API，通过 NVFP4 量化、分离式推理等优化，实现每秒超过 280 个 token 的处理速度。

0 人收藏 0 人点赞

#nvidia

SpaceX与开源AI初创公司Reflection签署价值高达63亿美元的算力协议（4分钟阅读）

TLDR AI ↗ · 昨天缓存

SpaceX与开源AI初创公司Reflection签署了一项价值高达63亿美元的算力协议，允许Reflection通过SpaceX的Colossus数据中心使用Nvidia GB300s。这笔交易凸显了SpaceX向出售计算能力领域的扩张以及开源AI日益增长的势头。

0 人收藏 0 人点赞

nvidia

提交意见反馈