@Thom_Wolf: 大多数人都应该更新他们对开源语音到语音技术现状的认知。老实说，这有点令人…

X AI KOLs Following 2026/07/02 23:31 工具

open-source speech-to-speech realtime-voice cerebras huggingface demo

摘要

Thom Wolf 和 Cerebras 发布了一个完全开源、带有模型和代码的实时语音演示，展示了最先进的语音到语音能力。

大多数人都应该更新他们对开源语音到语音技术现状的认知。老实说，这真的有点令人难以置信。我们与 @cerebras 合作，构建了一个完全开源、实时语音演示（包含模型和代码），展示了今天可以实现的能力。演示：https://huggingface.co/spaces/smolagents/hf-realtime-voice… 博客：https://huggingface.co/blog/cerebras-gemma4-voice-ai… 去测试它，复制它，调整它，惊艳你的朋友。视频是原始录制，无剪辑，无加速，一次性完成。

查看原文

查看缓存全文

缓存时间: 2026/07/03 08:33

大多数人可能应该更新一下他们对开源语音到语音技术现状的认知。

坦白说，这确实令人震惊。

我们与@cerebras合作，构建了一个完全开源、实时的语音演示（模型 + 代码），展示如今能做到的程度。

演示：https://huggingface.co/spaces/smolagents/hf-realtime-voice…

博客：https://huggingface.co/blog/cerebras-gemma4-voice-ai…

去试试吧，复制它，修改它，然后让你的朋友们刮目相看。

视频是原始录制，无剪辑、无加速、一次性完成

HF Realtime Voice - 由 smolagents 创建的 Hugging Face 空间

来源：https://huggingface.co/spaces/smolagents/hf-realtime-voice 正在从 HF Docker 仓库获取元数据…

@Thom_Wolf: 大多数人都应该更新他们对开源语音到语音技术现状的认知。老实说，这有点令人…

HF Realtime Voice - 由 smolagents 创建的 Hugging Face 空间

相似文章

@kwindla：OpenAI 今天发布了一款新的语音到语音模型：gpt-realtime-2 这是首个足够好的语音到语音模型……

@kwindla: https://x.com/kwindla/status/2062544580105359686

OpenAI的新语音模型不止于回话

@tom_doerr: 零样本语音克隆支持30种语言 https://github.com/sunnyxrxrx/X-Voice…

@HarshalsinghCN: 我打造了一个开源的 Hinglish TTS，性能碾压市面所有模型。我没有任何研究背景。上周我 w…

提交意见反馈