Krisp 语音翻译 API
摘要
Krisp 推出专为高精度设计的实时语音到语音翻译 API。
<p>
专为高精度打造的实时语音到语音翻译
</p>
<p>
<a href="https://www.producthunt.com/products/krisp?utm_campaign=producthunt-atom-posts-feed&utm_medium=rss-feed&utm_source=producthunt-atom-posts-feed">讨论</a>
|
<a href="https://www.producthunt.com/r/p/1164111?app_id=339">链接</a>
</p>
相似文章
构建实时语音翻译应用(阅读时长:28 分钟)
OpenAI 发布了 gpt-realtime-translate,这是一款专为实时口译优化的低延迟语音转语音模型,并附有开发者实战指南,用于构建支持多语言的浏览器、移动及视频应用。
@kwindla: https://x.com/kwindla/status/2062544580105359686
NVIDIA 发布了 Nemotron 3.5 ASR,这是一款开源的多语言语音转文字模型,在测试中延迟最低,提供多语言和纯英文两个版本,非常适合语音助手和自托管部署场景。
Parrot Speech-to-text API
Parrot Speech-to-text API 为生产级语音代理提供快速准确的转写服务。
Gemini 3.5 Live Translate
Gemini 3.5 Live Translate 是一款全新的音频模型,用于实时语音到语音翻译。
@tom_doerr: 以70倍实时速度转录音频 https://github.com/m-bain/whisperX
WhisperX是一个用于快速自动语音识别的工具,提供词级时间戳和说话人分离,使用Whisper large-v2实现70倍实时转录。