nvidia

标签

Cards List
#nvidia

英伟达AI芯片在中国价格翻倍,同时应对AI带来的水耗问题

Reddit r/ArtificialInteligence · 10小时前 缓存

由于美国出口限制,英伟达的AI芯片在中国以创纪录的高价销售,同时该公司还宣布推出新的液冷系统以减少数据中心用水量。

0 人收藏 0 人点赞
#nvidia

人工智能是‘一个大泡沫’吗?科技股抛售的背后

Reddit r/artificial · 14小时前 缓存

本文探讨了人工智能相关科技股出现的抛售潮,引发人们质疑对人工智能的巨额投入是否能够带来回报。文章强调市场波动性,指出美光、英伟达、Alphabet等主要公司股价大幅下跌。

0 人收藏 0 人点赞
#nvidia

NVIDIA与AWS合作,将AI大规模投入生产

NVIDIA Blog · 23小时前 缓存

NVIDIA与AWS宣布推出搭载NVIDIA RTX PRO 4500 Blackwell GPU的全新EC2 G7实例,以及在Amazon OpenSearch Serverless中提供GPU加速的向量搜索功能,使企业能够以更优的性能和更低的运营复杂性,大规模部署AI应用。

0 人收藏 0 人点赞
#nvidia

@charles_irl: dflash 高速运转

X AI KOLs Timeline · 23小时前 缓存

NVIDIA 宣布推出 DFlash,一种用于推测解码的开源块扩散模型,在 Blackwell GPU 上可实现高达 15 倍的推理吞吐量提升,同时保持交互性。

0 人收藏 0 人点赞
#nvidia

NVIDIA的新芯片刚刚证明AI“安全”一直是场秀。我们还没为2029年做好准备。

Reddit r/ArtificialInteligence · 昨天

NVIDIA的新芯片使得在本地运行500B参数的模型成为可能,凸显出AI安全措施仅仅是行为上的减速带,离线即消失,为大规模欺骗和操纵带来了前所未有的风险。

0 人收藏 0 人点赞
#nvidia

AI泡沫即将破裂?英伟达悄然收购Essential AI团队,包括Transformer论文合著者Ashish Vaswani。Vaswani此前为其AI公司融资困难。

Reddit r/ArtificialInteligence · 昨天

英伟达悄然收购了Essential AI的团队,包括Transformer论文合著者Ashish Vaswani,他此前为其初创公司融资困难。Vaswani将参与英伟达Nemotron开源模型的开发。

0 人收藏 0 人点赞
#nvidia

@arcinstitute: 生物学的未来是代理性的。我们很自豪能与NVIDIA合作开发Evo系列模型,并期待看到…

X AI KOLs Following · 昨天 缓存

NVIDIA推出了BioNeMo Agent Toolkit,这是一个开放的工具包,使AI代理能够执行蛋白质结构预测、分子对接和生成化学等任务,与Arc Institute合作加速可编程生物学。

0 人收藏 0 人点赞
#nvidia

我渴望在我的Strix Halo上获得15倍加速

Reddit r/LocalLLaMA · 昨天

Nvidia声称使用扩散模型在文本生成上实现15倍加速,一次性生成整个文本块。

0 人收藏 0 人点赞
#nvidia

xAI发布了65个生物、物理和化学辅导员的职位。追踪了8家AI实验室的招聘数据,以了解各实验室实际的发展方向。

Reddit r/ArtificialInteligence · 昨天

分析主要AI实验室的招聘数据以推断其战略方向,指出xAI专注于科学辅导员,Nvidia推动数据中心,OpenAI工程团队增长。

0 人收藏 0 人点赞
#nvidia

更新:适用于ik_llama.cpp的Qwen-27B-IQ4_KS和Qwen-27B-IQ_KS_KT量化版本,尤其针对16GB显存的NVIDIA显卡

Reddit r/LocalLLaMA · 昨天

面向16GB显存NVIDIA GPU优化的新型Qwen3.6-27B GGUF量化版本,包含实验性Trellis变体,并附带了困惑度基准测试。

0 人收藏 0 人点赞
#nvidia

@aijoey: 给我的所有新DGX Spark用户. https://github.com/joeynyc/spark-doctor…

X AI KOLs Timeline · 昨天 缓存

Spark Doctor 是一个开源的诊断命令行工具,专为NVIDIA DGX Spark设计,可收集系统、GPU、内存、Docker和配方数据,应用特定规则,并输出常见问题的可能原因及后续步骤。

0 人收藏 0 人点赞
#nvidia

@PyTorch: SGLang 为 DeepSeek-V4 提供了首日支持,而 @lmsysorg 与 @NVIDIAAI 工程团队的合作…

X AI KOLs Following · 昨天 缓存

SGLang 为 DeepSeek-V4 提供了首日支持,LMSys 与 NVIDIA 工程团队的合作在生产环境中实现了高达 5 倍的吞吐量提升,相关改进已在 SemiAnalysis InferenceX 仪表盘上展示。

0 人收藏 0 人点赞
#nvidia

企业如何构建值得信赖的专用AI

NVIDIA Blog · 昨天 缓存

NVIDIA 推出 Agent Toolkit,这是一个开放的模块化基础架构,包含模型、工具、技能和安全运行时,帮助企业为各行各业构建专用、可信的AI智能体。

0 人收藏 0 人点赞
#nvidia

Valve确认正在与Intel和Nvidia合作,让SteamOS支持更多GPU

The Verge · 昨天 缓存

Valve正在与Intel和Nvidia合作,将SteamOS支持扩展到更多GPU和手持设备,包括为Intel手持设备提供初始固件,以及为Nvidia持续进行驱动开发。

0 人收藏 0 人点赞
#nvidia

@DataChaz:@NVIDIA 刚刚悄悄发布了一个极其令人印象深刻的语音识别模型,它彻底改变了本地语音处理的计算方式……

X AI KOLs Timeline · 昨天 缓存

NVIDIA 悄然发布了 Nemotron-3.5-ASR,这是一个轻量级、参数规模为 0.6B 的开源语音识别模型,专为实时流式传输设计,支持 40 多种语言、低延迟和缓存感知架构。

0 人收藏 0 人点赞
#nvidia

NVIDIA为全球500强最快超级计算机中的400多台提供动力

NVIDIA Blog · 昨天 缓存

NVIDIA技术现已为全球500强最快超级计算机中的400多台提供动力(占TOP500的81%),GPU和网络采用率创下纪录,并在Green500榜单上获得最高效率。

0 人收藏 0 人点赞
#nvidia

NVIDIA 为电信运营带来可信赖的全天候 AI 代理

NVIDIA Blog · 昨天 缓存

NVIDIA 在 DTW Ignite 2026 上发布了面向电信运营的新 AI 代理和工具,包括合成数据生成和安全代理运行时。该平台旨在通过结合领域特定模型、隐私安全的合成数据和基于策略的护栏,实现自主网络。

0 人收藏 0 人点赞
#nvidia

@RayFernando1337: “所选运行时使用NVFP4权重以获得最大性能。从原始FP8权重,我们进行了内部量…

X AI KOLs Following · 昨天

讨论使用NVFP4 4位浮点权重以获得最大性能,通过使用NVIDIA ModelOpt从FP8进行内部量化实现,突出了该数据格式的双缩放因子以保持高动态范围。

0 人收藏 0 人点赞
#nvidia

@philipkiely: https://x.com/philipkiely/status/2069212319746506968

X AI KOLs Timeline · 昨天 缓存

Baseten 宣布推出针对 GLM-5.2 开源模型的世界最快 API,通过 NVFP4 量化、分离式推理等优化,实现每秒超过 280 个 token 的处理速度。

0 人收藏 0 人点赞
#nvidia

SpaceX与开源AI初创公司Reflection签署价值高达63亿美元的算力协议(4分钟阅读)

TLDR AI · 昨天 缓存

SpaceX与开源AI初创公司Reflection签署了一项价值高达63亿美元的算力协议,允许Reflection通过SpaceX的Colossus数据中心使用Nvidia GB300s。这笔交易凸显了SpaceX向出售计算能力领域的扩张以及开源AI日益增长的势头。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈