nvidia

标签

Cards List
#nvidia

SOLAR:AI驱动的光速性能分析

arXiv cs.LG · 8小时前 缓存

SOLAR是一个框架,它利用LLM前端和确定性分析,从PyTorch和JAX源代码自动推导经过验证的光速性能界限,从而为深度学习工作负载提供余量分析和优化洞察。

0 人收藏 0 人点赞
#nvidia

Nemotron-TwoTower:基于预训练自回归上下文的扩散语言建模

arXiv cs.CL · 8小时前 缓存

本文提出了Nemotron-TwoTower,一种扩散语言模型,通过冻结的自回归塔和可训练的扩散去噪器解耦上下文表示与去噪过程,以2.42倍吞吐量达到了基线质量98.7%的水平。

0 人收藏 0 人点赞
#nvidia

@KevinNaughtonJr:这种工程文化是所有科技公司都应该追求的

X AI KOLs Following · 18小时前 缓存

一条推文分享了关于NVIDIA工程文化的一则轶事,其中零裁员促进了合作而非内部竞争。

0 人收藏 0 人点赞
#nvidia

@timseyde: 小飞象的第一步 — LFM2.5-230M 使用 @nvidia SONIC 提供的预训练技能执行多步工具调用。同样的…

X AI KOLs Following · 21小时前 缓存

Liquid AI 的 LFM2.5-230M 模型在 Unitree G1 机器人上展示了多步工具调用能力,完全在 NVIDIA Jetson Orin 设备端运行,充当技能选择层。

0 人收藏 0 人点赞
#nvidia

终极夏日促销组合:Steam促销遇上GeForce NOW折扣

NVIDIA Blog · 23小时前 缓存

NVIDIA宣布在Steam夏季促销期间推出GeForce NOW夏季折扣,并新增云游戏库游戏,强调云游戏的优势。

0 人收藏 0 人点赞
#nvidia

NVIDIA 发布了 Nemotron-TwoTower-30B-A3B-Base-BF16,这是一种基于 Nemotron 3 Nano 30B-A3B 主干构建的异常扩散型语言模型。

Reddit r/LocalLLaMA · 昨天 缓存

NVIDIA 发布了 Nemotron-TwoTower-30B-A3B-Base-BF16,这是一种基于扩散的语言模型,采用逐块自回归扩散方法,通过对令牌块进行迭代去噪来生成文本,实现了自回归基线 2.42 倍的生成吞吐量,同时保留了基准测试质量 98.7% 的水平。

0 人收藏 0 人点赞
#nvidia

既然大语言模型编码这么厉害……

Reddit r/LocalLLaMA · 昨天

讨论为何大语言模型未能帮助ROCm和英特尔的软件生态系统追上CUDA,并指出NVIDIA的高定价和真正市场竞争的必要性。

0 人收藏 0 人点赞
#nvidia

在4× DGX Spark (GB10)上成功运行GLM-5.2 + MTP投机解码——并发现公开构建配方中缺失的组件

Reddit r/LocalLLaMA · 昨天

作者在4× DGX Spark (GB10)设备上成功运行了配备MTP投机解码的GLM-5.2,并揭示了公开构建配方中缺失的一个组件。

0 人收藏 0 人点赞
#nvidia

英伟达AI芯片在中国价格翻倍,同时应对AI带来的水耗问题

Reddit r/ArtificialInteligence · 昨天 缓存

由于美国出口限制,英伟达的AI芯片在中国以创纪录的高价销售,同时该公司还宣布推出新的液冷系统以减少数据中心用水量。

0 人收藏 0 人点赞
#nvidia

人工智能是‘一个大泡沫’吗?科技股抛售的背后

Reddit r/artificial · 2天前 缓存

本文探讨了人工智能相关科技股出现的抛售潮,引发人们质疑对人工智能的巨额投入是否能够带来回报。文章强调市场波动性,指出美光、英伟达、Alphabet等主要公司股价大幅下跌。

0 人收藏 0 人点赞
#nvidia

NVIDIA与AWS合作,将AI大规模投入生产

NVIDIA Blog · 2天前 缓存

NVIDIA与AWS宣布推出搭载NVIDIA RTX PRO 4500 Blackwell GPU的全新EC2 G7实例,以及在Amazon OpenSearch Serverless中提供GPU加速的向量搜索功能,使企业能够以更优的性能和更低的运营复杂性,大规模部署AI应用。

0 人收藏 0 人点赞
#nvidia

@charles_irl: dflash 高速运转

X AI KOLs Timeline · 2天前 缓存

NVIDIA 宣布推出 DFlash,一种用于推测解码的开源块扩散模型,在 Blackwell GPU 上可实现高达 15 倍的推理吞吐量提升,同时保持交互性。

0 人收藏 0 人点赞
#nvidia

NVIDIA的新芯片刚刚证明AI“安全”一直是场秀。我们还没为2029年做好准备。

Reddit r/ArtificialInteligence · 2天前

NVIDIA的新芯片使得在本地运行500B参数的模型成为可能,凸显出AI安全措施仅仅是行为上的减速带,离线即消失,为大规模欺骗和操纵带来了前所未有的风险。

0 人收藏 0 人点赞
#nvidia

AI泡沫即将破裂?英伟达悄然收购Essential AI团队,包括Transformer论文合著者Ashish Vaswani。Vaswani此前为其AI公司融资困难。

Reddit r/ArtificialInteligence · 2天前

英伟达悄然收购了Essential AI的团队,包括Transformer论文合著者Ashish Vaswani,他此前为其初创公司融资困难。Vaswani将参与英伟达Nemotron开源模型的开发。

0 人收藏 0 人点赞
#nvidia

@arcinstitute: 生物学的未来是代理性的。我们很自豪能与NVIDIA合作开发Evo系列模型,并期待看到…

X AI KOLs Following · 2天前 缓存

NVIDIA推出了BioNeMo Agent Toolkit,这是一个开放的工具包,使AI代理能够执行蛋白质结构预测、分子对接和生成化学等任务,与Arc Institute合作加速可编程生物学。

0 人收藏 0 人点赞
#nvidia

我渴望在我的Strix Halo上获得15倍加速

Reddit r/LocalLLaMA · 2天前

Nvidia声称使用扩散模型在文本生成上实现15倍加速,一次性生成整个文本块。

0 人收藏 0 人点赞
#nvidia

xAI发布了65个生物、物理和化学辅导员的职位。追踪了8家AI实验室的招聘数据,以了解各实验室实际的发展方向。

Reddit r/ArtificialInteligence · 2天前

分析主要AI实验室的招聘数据以推断其战略方向,指出xAI专注于科学辅导员,Nvidia推动数据中心,OpenAI工程团队增长。

0 人收藏 0 人点赞
#nvidia

更新:适用于ik_llama.cpp的Qwen-27B-IQ4_KS和Qwen-27B-IQ_KS_KT量化版本,尤其针对16GB显存的NVIDIA显卡

Reddit r/LocalLLaMA · 2天前

面向16GB显存NVIDIA GPU优化的新型Qwen3.6-27B GGUF量化版本,包含实验性Trellis变体,并附带了困惑度基准测试。

0 人收藏 0 人点赞
#nvidia

@aijoey: 给我的所有新DGX Spark用户. https://github.com/joeynyc/spark-doctor…

X AI KOLs Timeline · 2天前 缓存

Spark Doctor 是一个开源的诊断命令行工具,专为NVIDIA DGX Spark设计,可收集系统、GPU、内存、Docker和配方数据,应用特定规则,并输出常见问题的可能原因及后续步骤。

0 人收藏 0 人点赞
#nvidia

@PyTorch: SGLang 为 DeepSeek-V4 提供了首日支持,而 @lmsysorg 与 @NVIDIAAI 工程团队的合作…

X AI KOLs Following · 2天前 缓存

SGLang 为 DeepSeek-V4 提供了首日支持,LMSys 与 NVIDIA 工程团队的合作在生产环境中实现了高达 5 倍的吞吐量提升,相关改进已在 SemiAnalysis InferenceX 仪表盘上展示。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈