DramaBox - 基于LTX 2.3的最具表现力语音模型
摘要
DramaBox是一个基于LTX 2.3的高度表现力语音模型,由Resemble AI发布,其开源代码和模型可在GitHub和Hugging Face上获取。
最具表现力的语音模型。Github: [https://github.com/resemble-ai/DramaBox](https://github.com/resemble-ai/DramaBox) HF Model: [https://huggingface.co/ResembleAI/Dramabox](https://huggingface.co/ResembleAI/Dramabox) HF Space: [https://huggingface.co/spaces/ResembleAI/Dramabox](https://huggingface.co/spaces/ResembleAI/Dramabox)
相似文章
DramaBox:基于舞台提示构建的开源权重TTS模型
DramaBox是一个基于LTX-2.3微调的开源权重TTS模型,利用舞台提示(stage directions)生成富有表现力的语音,并支持通过10秒样本进行可选的语音克隆。
ResembleAI/Dramabox
Dramabox 是 Resemble AI 开发的一个富有表现力的文本转语音模型,通过提示驱动控制来实现说话人身份、情感和表达方式,并可选地使用 10 秒参考音频进行声音克隆。该模型基于 LTX-2.3 音频扩散变换器构建,已在 Hugging Face 上开源。
DramaBox by Resemble AI
DramaBox by Resemble AI 将场景描述转换为 AI 生成的人声表演。
@multimodalart: 他们只提取了LTX-2.3的音频部分,针对TTS任务进行了微调,实现了SOTA级别的TTS情感控制???试试看……
LTX-2.3模型音频组件的微调版本在文本转语音中实现了最先进的情感控制,现已在Hugging Face Space上以DramaBox(由ResembleAI提供)的形式提供。
@zohaibahmed: @resembleai研究团队的新语音AI模型:Dramabox!一个语音AI模型应该给你两样东西:奥斯卡级别的表演和可验证的签名,以证明它是你的。
Dramabox,来自Resemble AI的全新开源语音AI模型,声称既能提供高质量的表演效果,又能提供可验证的签名以证明其真实性。