标签
ElevenLabs 引入了呼叫您的 Hermes Agent 的功能,通过他们的平台实现与AI代理的语音交互。
作者分享使用@leeoxiang 制作的skill、ElevenLabs和飞书cli制作50秒口播视频的体验,强调vtake-cut skill让更多人零门槛表达想法。
推荐基于PySide6和ElevenLabs API的开源语音转字幕工具Scribe2SRT,支持多语言并优化排版,快速生成高质量SRT字幕。
ElevenLabs 发布了 Dubbing v2,这是一款 AI 配音模型,通过直接基于原始音频进行条件处理,能够在 90 多种语言中保留原始说话者的情感、语调和表演,提供广播级品质的配音,而成本仅为传统方式的一小部分。
ElevenLabs 与斯坦·李宇宙签署协议,创建斯坦·李的声音和形象的AI克隆,用于数字客串、有声读物和一个读书俱乐部系列,引发了关于同意和剥削的伦理辩论。
Supertonic 3是一个99M参数的开源TTS模型,完全在设备上运行,在树莓派上击败了ElevenLabs,在笔记本电脑CPU上的性能是实时的167倍。
Nimit Sohoni 放弃了 Citadel 高薪的量化交易员职位,转而投身 Cartesia 打造下一代语音 AI,与 ElevenLabs 展开竞争,凸显了量化金融与 AI 研究之间的取舍。
Spotify宣布在其Spotify for Authors平台推出一款基于ElevenLabs的新工具,用于自助出版有声书,将于今年6月以测试版形式上线,支持英文。
Prajwal Tomar 展示了如何利用 ElevenLabs 提供文本转语音功能,并结合 Lovable 进行应用开发,快速构建出一个 AI 故事应用,实现带有配音和音效的个性化故事生成。
作者开发了一套可移植的用户偏好档案系统,该系统可与 ElevenLabs 和 Pipecat 代理集成,使语音助手能够跨平台记忆用户的风格与兴趣,从而跳过冗余的引导流程。