#voice
一个泄露版 ChatGPT 搭载了 Bidi-1 语音模式,其声音逼真得令人不安,超过了此前的泄露版本。
0 人收藏
0 人点赞
#voice
即将推出的GPT双向语音模型的一个示例已被展示。
0 人收藏
0 人点赞
#voice
本文讨论了语音作为AI智能体输出层未被充分利用的潜力,重点介绍了超越简单文本转语音的实际用例和工作流程挑战。
0 人收藏
0 人点赞
#voice
VoiceDraw 是一款工具,在你说话时自动绘制系统设计图,并记录推理过程和权衡取舍。
0 人收藏
0 人点赞
#voice
Cotypist 是一款 Mac 应用,提供本地 AI 自动补全功能,通过语音实现系统任意位置的免提文本补全。
0 人收藏
0 人点赞
#voice
Juno 是一款适用于 Mac 的免费本地语音层,让用户可以通过说话而非打字与电脑交互。
0 人收藏
0 人点赞
#voice
Discord将其超过80%的语音和视频流量迁移至Cloudflare覆盖300多个城市的边缘网络,显著降低了全球延迟和丢包率,例如法兰克福的ping值降低了34%。
0 人收藏
0 人点赞
#voice
一个完全离线、仅使用CPU的语音循环,用于本地大模型,采用Silero VAD、Parakeet STT和Supertonic TTS,通过一条命令整合安装。兼容Ollama、LM Studio以及多种代理框架。
0 人收藏
0 人点赞
#voice
Krisp 推出专为高精度设计的实时语音到语音翻译 API。
0 人收藏
0 人点赞
#voice
Carbon Voice 推出了快速拨号功能,支持通过语音通信快速联系人类团队成员和AI智能体。
0 人收藏
0 人点赞
#voice
描述了一个多智能体系统,其中十二个智能体共享一个语音文件且没有记忆,每个智能体从零开始独立行动,身份锚定在文档中而非智能体本身。
0 人收藏
0 人点赞
#voice
一种让用户通过口头说明来处理文书工作的工具,使流程更高效且更具交互性。
0 人收藏
0 人点赞
#voice
Antigravity 2.0 是一款全新的桌面应用,专为 AI 代理、语音、任务和 Google 应用而打造。
0 人收藏
0 人点赞
#voice
Antigravity 2.0 是一款全新的独立桌面应用,基于多智能体团队、定时任务、原生语音以及一键集成 Google 产品重新构建。
0 人收藏
0 人点赞
#voice
AgentPhone 推出了一项API,为AI代理提供专属电话号码和身份,使其能够跨iMessage、WhatsApp、RCS和SMS等渠道拨打电话和发送消息。
0 人收藏
0 人点赞
#voice
OpenAI 推出实时 API,使开发者能够构建低延迟多模态语音对话体验,由 GPT-4o 驱动的自然语音交互。该 API 支持六种预设声音,简化开发流程,无需集成多个模型。
0 人收藏
0 人点赞