开源了一个面向生产环境的语音助手全栈启动模板（Web端和电话端共用一个worker）

Reddit r/AI_Agents 2026/06/16 21:26 工具

voice-agents open-source livekit full-stack production telephony react

摘要

开源了一个基于LiveKit、FastAPI和React的全栈生产级语音助手启动模板，通过单一代码路径同时处理Web和电话端，可使用Docker Compose一键部署。

大多数语音助手教程都止步于"这是一个能回话的脚本。" 从演示到生产环境之间的差距在于围绕它的一切：生成房间令牌、真正的客户端、电话集成、部署、测试。我一直在重建这些，所以我将其打包成一个开源启动模板（MIT许可）。它是一个基于LiveKit的语音助手，分为三个部分：语音工作器（STT→LLM→TTS，带有语音端点检测）、一个FastAPI令牌服务器，以及一个带有实时转录和文本聊天的React客户端。我最满意的部分是：Web和SIP（电话）呼叫通过同一个参与者分支访问同一个助手，因此你不需要为"在浏览器中对话"和"拨打号码"维护两条代码路径。你可以通过添加功能工具或将任务移交来扩展助手，并且提供商是可切换的。Docker Compose用一个命令运行整个技术栈。对于那些已经部署过语音助手的人：从演示到生产环境之间的差距在哪里最让你头疼？我希望这个启动模板能覆盖真正的痛点，而不仅仅是顺风顺水的情况。

查看原文

开源了一个面向生产环境的语音助手全栈启动模板（Web端和电话端共用一个worker）

相似文章

学习构建语音代理的结构化路径：从首次STT通话到生产部署

OpenAI 如何实现大规模低延迟语音 AI 部署

jamiepine/voicebox

我构建了一个用于创建和管理AI代理的开源平台（MIT许可，可免费自托管）

2026年你当前/最佳AI语音代理技术栈是什么？

提交意见反馈