Cerebras上的gemma-4-31B比ChatGPT语音模式更好

Reddit r/LocalLLaMA 新闻

摘要

声称在Cerebras硬件上运行的Gemma-4-31B模型性能优于ChatGPT的语音模式,并通过Hugging Face Space展示了实时语音交互。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/07/01 16:17

HF Realtime Voice - 来自 smolagents 的 Hugging Face 空间

来源:https://huggingface.co/spaces/smolagents/hf-realtime-voice
正在从 HF Docker 仓库获取元数据……

相似文章

Hugging Face和Cerebras将Gemma 4引入实时语音AI

Hugging Face Blog

Hugging Face和Cerebras展示了一个实时语音到语音流水线,结合了开源模型(Nvidia的Parakeet、Gemma 4、Qwen3TTS)与Cerebras的快速推理,实现了自然的对话式AI,并为Reachy Mini等机器人提供动力。

google/gemma-4-31B-it-assistant

Hugging Face Models Trending

Google DeepMind 发布了 Gemma 4,这是一个开源权重的多模态模型家族,支持文本、图像、视频和音频,具备增强的推理和编码能力,并通过多令牌预测(MTP)实现高达 2 倍的解码速度提升。

ChatGPT 语音模式是一个较弱的模型

Simon Willison's Blog

ChatGPT 的语音模式运行在一个较弱的 GPT-4o 时代模型上,知识截止日期为 2024 年 4 月,比 OpenAI 最新能力要旧得多。文章强调了 OpenAI 消费者语音界面与其更高级付费模型之间日益扩大的差距,这种差距是由于奖励信号清晰度和 B2B 市场激励的差异造成的。