@RayFernando1337: Gemma 4 31B MULTIMODAL!!!! 以火箭般的速度运行。我的天啊!!!我现在激动得无法自已。速度是迈向超级智能的第一步……
摘要
推文宣布了 Gemma 4 31B 多模态模型,速度快如火箭,称这是通往超级智能的第一步。
Gemma 4 31B MULTIMODAL!!!! 以火箭般的速度运行。我的天啊!!!我现在激动得无法自已。速度是迈向超级智能的第一步。https://t.co/ruwcsyZDyF
查看缓存全文
缓存时间: 2026/06/25 07:13
Gemma 4 31B 多模态!!!!速度堪比火箭。我的天哪!!!我此刻已经控制不住自己了。速度是通往超级智能的第一步。https://t.co/ruwcsyZDyF
相似文章
@Freerunnering: 这实际上使得Gemma 4 26B-4A在我的MacBook Pro M1 Max上以72tk/s的速度可用于编码代理。这个视频是实时的,…
Unsloth AI宣布,Gemma 4在MTP GGUFs上运行速度快了2倍,使得在如MacBook Pro M1 Max这样的硬件上以72 tokens/s的速度运行本地编码代理成为可能。
Gemma 4 发布:前沿多模态智能,端侧可用
Google DeepMind 发布 Gemma 4,这是一系列前沿多模态模型,已在 Hugging Face 上以 Apache 2 协议开源,针对端侧部署进行了优化,并支持多种推理框架。
@googlegemma: Gemma 4 E2B 在英特尔AI PC上运行速度超快,得益于OpenVINO上的LiteRT NPU支持!预填充性能提升1.3倍……
Gemma 4 E2B 在采用OpenVINO与LiteRT NPU支持的英特尔AI PC上,实现了预填充速度提升1.3倍、每瓦性能提升2.8倍,从而能够高效运行后台LLM任务。
Gemma 4:同等参数规模下能力最强的开源模型
Google DeepMind 发布 Gemma 4,这是其迄今为止能力最强的开源模型系列,专为高级推理和智能体工作流设计,在多种参数规模下均实现了极高的智能密度。
@_philschmid: Gemma 迎来扩散模型!DiffusionGemma 每秒可处理高达1000+个token! - 基于Gemma 4构建,为26B MoE模型。 - 3.8B…
DiffusionGemma 是一个基于 Gemma 4 的 26B MoE 模型,通过扩散模型以256个token的块进行文本生成,每秒可处理超过1000个token,经量化后可在18GB显存内运行,已根据 Apache 2.0 许可发布。