Hush
摘要
Hush 是一个开源的噪声抑制工具,专为语音AI代理设计,可提升实时交互中的音频清晰度。
<p>为语音AI代理提供的开源噪声抑制</p> <p><a href="https://www.producthunt.com/products/hush-df34eafa-13f7-4d91-856f-162c2a9d81ee?utm_campaign=producthunt-atom-posts-feed&utm_medium=rss-feed&utm_source=producthunt-atom-posts-feed">讨论</a> | <a href="https://www.producthunt.com/r/p/1167249?app_id=339">链接</a></p>
相似文章
jamiepine/voicebox
Voicebox 是一个开源的、本地优先的 AI 语音工作室,支持语音克隆、语音生成、听写和 AI 代理集成,提供隐私保护和多引擎 TTS 支持。
从录音中去除'um'比听起来更难
一个本地CLI工具,利用OpenAI的Whisper检测并去除音频录音中的填充词(um、uh、erm),采用技术避免点击声和背景嘶嘶声等音频伪影。
嘈杂环境中的语音代理
一家语音公司训练了一个模型,该模型能消除噪声并识别主要说话者,在嘈杂环境中,领先的ASR模型的词错误率降低了50%。
Headroom (GitHub 仓库)
Headroom 是一个开源工具,能在 AI 代理读取上下文(工具输出、日志、RAG 块、对话历史等)之前对其进行压缩,在到达 LLM 时可减少 60–95% 的令牌数量,同时保留答案质量。它支持多种集成模式,包括库、代理、代理包装和 MCP 服务器,并提供可逆压缩与跨代理记忆。
开源:将声音模仿转化为音效(声音生成的新用户体验)
一个开源AI模型,通过声音模仿和文字描述生成音效,解决了搜索特定声音的难题。