Cerebras上的gemma-4-31B比ChatGPT语音模式更好

Reddit r/LocalLLaMA 2026/07/01 15:18 新闻

gemma cerebras voice-mode comparison huggingface realtime-voice

摘要

声称在Cerebras硬件上运行的Gemma-4-31B模型性能优于ChatGPT的语音模式，并通过Hugging Face Space展示了实时语音交互。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/07/01 16:17

HF Realtime Voice - 来自 smolagents 的 Hugging Face 空间

来源：https://huggingface.co/spaces/smolagents/hf-realtime-voice
正在从 HF Docker 仓库获取元数据……

Hugging Face Blog

Hugging Face和Cerebras展示了一个实时语音到语音流水线，结合了开源模型（Nvidia的Parakeet、Gemma 4、Qwen3TTS）与Cerebras的快速推理，实现了自然的对话式AI，并为Reachy Mini等机器人提供动力。

Reddit r/LocalLLaMA

用户记录：闭源模型（GPT-4o→5.3、Gemini）在翻译中文小说时质量下滑并自我审查，而本地 Gemma 4 31B 不仅零审查，翻译质量也全面反超。

Hugging Face Models Trending

Google DeepMind 发布了 Gemma 4，这是一个开源权重的多模态模型家族，支持文本、图像、视频和音频，具备增强的推理和编码能力，并通过多令牌预测（MTP）实现高达 2 倍的解码速度提升。

Hugging Face Blog

Google DeepMind 发布 Gemma 4，这是一系列前沿多模态模型，已在 Hugging Face 上以 Apache 2 协议开源，针对端侧部署进行了优化，并支持多种推理框架。

Simon Willison's Blog

ChatGPT 的语音模式运行在一个较弱的 GPT-4o 时代模型上，知识截止日期为 2024 年 4 月，比 OpenAI 最新能力要旧得多。文章强调了 OpenAI 消费者语音界面与其更高级付费模型之间日益扩大的差距，这种差距是由于奖励信号清晰度和 B2B 市场激励的差异造成的。