@garrytan: 语音AI的瓶颈都一样：检索。智能体思考、网络往返向量数据库，然后……

X AI KOLs Following 2026/05/29 13:34 工具

voice-ai retrieval vector-db open-source real-time hackathon moss

摘要

Garry Tan指出检索是语音AI的关键瓶颈，并介绍了Moss，一个实现亚10毫秒向量搜索的开源工具，同时还宣布将于6月6日至7日在YC办公室举办黑客马拉松。

语音AI的瓶颈都一样：检索。智能体思考、网络往返向量数据库，魔法就消失了。 Moss以亚10毫秒（无跳转）运行搜索。开源。这就是语音智能体缺失的一层。6月6日至7日在YC办公室在此基础上进行构建。

查看原文

查看缓存全文

缓存时间: 2026/05/31 16:53

Everyone’s bottleneck in voice AI is the same: retrieval. The agent thinks, network round-trips to a vector DB, and the magic dies.

Moss runs search at sub-10ms (no hop). Open source. This is the layer voice agents were missing. Build on it June 6-7 at the YC office.

Pete Koomen (@koomen): 来打造能真正流畅对话的智能体吧，参加由 @usemoss 在 YC 办公室举办的 24 小时对话式 AI 黑客马拉松，6 月 6-7 日。第一名将获得与 YC 合伙人面试的机会。

相似文章

@MaxForAI: 如果你在做语音Agent，你应该试一下这个项目来自南洋理工、新国立和上海 AI Lab的团队发布了：Mega-ASR 这个完全开源的ASR基于 Qwen3-ASR构建，目的是打破长期困扰ASR的在嘈杂、混响或其他受损现实环境中表现的瓶颈…

X AI KOLs Timeline

南洋理工、新国立和上海 AI Lab 联合发布 Mega-ASR，一个基于 Qwen3-ASR 构建的完全开源 ASR 模型，通过 Voices-in-the-Wild-2M 数据集和渐进式声学到语义优化，在真实世界嘈杂环境中实现最高 30% 的相对词错误率下降，且仅 1.7B 参数可在消费级硬件高效推理。

@garrytan: 语音AI的瓶颈都一样：检索。智能体思考、网络往返向量数据库，然后……

相似文章

@MaxForAI: 如果你在做语音Agent，你应该试一下这个项目来自南洋理工、新国立和上海 AI Lab的团队发布了：Mega-ASR 这个完全开源的ASR基于 Qwen3-ASR构建，目的是打破长期困扰ASR的在嘈杂、混响或其他受损现实环境中表现的瓶颈…

OpenAI 如何实现大规模低延迟语音 AI 部署

@garrytan: GBrain 是面向智能体的 SOTA 检索工具，免费使用，MIT 许可证。目前专为 OpenClaw 和 Herme…

@garrytan: https://x.com/garrytan/status/2053127519872614419

为服务型企业运行生产级语音代理6个月：延迟计算远比演示所暗示的复杂。

提交意见反馈

相似文章

@MaxForAI: 如果你在做语音Agent，你应该试一下这个项目 来自南洋理工、新国立和上海 AI Lab的团队发布了：Mega-ASR 这个完全开源的ASR基于 Qwen3-ASR构建，目的是打破长期困扰ASR的在嘈杂、混响或其他受损现实环境中表现的瓶颈…

OpenAI 如何实现大规模低延迟语音 AI 部署

@garrytan: GBrain 是面向智能体的 SOTA 检索工具，免费使用，MIT 许可证。目前专为 OpenClaw 和 Herme…

@garrytan: https://x.com/garrytan/status/2053127519872614419

为服务型企业运行生产级语音代理6个月：延迟计算远比演示所暗示的复杂。

提交意见反馈

@MaxForAI: 如果你在做语音Agent，你应该试一下这个项目来自南洋理工、新国立和上海 AI Lab的团队发布了：Mega-ASR 这个完全开源的ASR基于 Qwen3-ASR构建，目的是打破长期困扰ASR的在嘈杂、混响或其他受损现实环境中表现的瓶颈…