voice

标签

Cards List
#voice

语音感觉是AI智能体被低估的输出层

Reddit r/AI_Agents · 3天前

本文讨论了语音作为AI智能体输出层未被充分利用的潜力,重点介绍了超越简单文本转语音的实际用例和工作流程挑战。

0 人收藏 0 人点赞
#voice

Show HN:VoiceDraw – 大声讨论系统设计,图表自动生成

Hacker News Top · 5天前

VoiceDraw 是一款工具,在你说话时自动绘制系统设计图,并记录推理过程和权衡取舍。

0 人收藏 0 人点赞
#voice

Juno

Product Hunt · 2026-06-11

Juno 是一款适用于 Mac 的免费本地语音层,让用户可以通过说话而非打字与电脑交互。

0 人收藏 0 人点赞
#voice

我们如何将Discord语音迁移到边缘

Lobsters Hottest · 2026-06-11 缓存

Discord将其超过80%的语音和视频流量迁移至Cloudflare覆盖300多个城市的边缘网络,显著降低了全球延迟和丢包率,例如法兰克福的ping值降低了34%。

0 人收藏 0 人点赞
#voice

我搭建了一个完全离线的语音循环,对接Ollama和LM Studio——100% CPU,无需GPU,数据绝不离开你的电脑(Silero VAD + Parakeet STT + Supertonic TTS 3)

Reddit r/LocalLLaMA · 2026-06-11

一个完全离线、仅使用CPU的语音循环,用于本地大模型,采用Silero VAD、Parakeet STT和Supertonic TTS,通过一条命令整合安装。兼容Ollama、LM Studio以及多种代理框架。

0 人收藏 0 人点赞
#voice

Krisp 语音翻译 API

Product Hunt · 2026-06-05

Krisp 推出专为高精度设计的实时语音到语音翻译 API。

0 人收藏 0 人点赞
#voice

Carbon Voice 快速拨号

Product Hunt · 2026-06-03

Carbon Voice 推出了快速拨号功能,支持通过语音通信快速联系人类团队成员和AI智能体。

0 人收藏 0 人点赞
#voice

十二个智能体共享一个语音文件,彼此互不相识。

Reddit r/AI_Agents · 2026-06-03

描述了一个多智能体系统,其中十二个智能体共享一个语音文件且没有记忆,每个智能体从零开始独立行动,身份锚定在文档中而非智能体本身。

0 人收藏 0 人点赞
#voice

只需口头说明就能搞定文书工作(1分钟阅读)

TLDR AI · 2026-05-25 缓存

一种让用户通过口头说明来处理文书工作的工具,使流程更高效且更具交互性。

0 人收藏 0 人点赞
#voice

@FinanceYF5: 3. Antigravity 2.0 是一款全新的桌面应用,专为 AI 代理、语音、任务和 Google 应用而打造。

X AI KOLs Following · 2026-05-21 缓存

Antigravity 2.0 是一款全新的桌面应用,专为 AI 代理、语音、任务和 Google 应用而打造。

0 人收藏 0 人点赞
#voice

@antigravity: 推出 Antigravity 2.0,一款全新的独立桌面应用,完全实现了最初所瞥见的真正的……

X AI KOLs Following · 2026-05-19 缓存

Antigravity 2.0 是一款全新的独立桌面应用,基于多智能体团队、定时任务、原生语音以及一键集成 Google 产品重新构建。

0 人收藏 0 人点赞
#voice

@ycombinator:2万亿美元市值的电信行业原为人类而建。@AgentPhoneHQ 正为AI代理重建它。一个API让每个AI代理…

X AI KOLs Following · 2026-05-15 缓存

AgentPhone 推出了一项API,为AI代理提供专属电话号码和身份,使其能够跨iMessage、WhatsApp、RCS和SMS等渠道拨打电话和发送消息。

0 人收藏 0 人点赞
#voice

实时 API 介绍

OpenAI Blog · 2024-10-01 缓存

OpenAI 推出实时 API,使开发者能够构建低延迟多模态语音对话体验,由 GPT-4o 驱动的自然语音交互。该 API 支持六种预设声音,简化开发流程,无需集成多个模型。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈