推出 HN:Voker(YC S24)—— AI 代理分析工具
摘要
Voker 是一家获得 YC 支持的初创公司,推出了一款分析平台,旨在衡量 AI Agent 的性能和业务影响,为产品和业务团队提供自助式洞察。
嘿 HN,我们是 Alex 和 Tyler,Voker.ai (<a href="https://voker.ai/">https://voker.ai/</a>) 的联合创始人,这是一款专为 AI 产品团队打造的智能体(Agent)分析平台。Voker 能让你们全面掌握用户向智能体提出的问题以及智能体是否有效解决了这些问题,无需手动挖掘日志。我们的核心产品是一个轻量级 SDK,与 LLM 技术栈无关,专为智能体产品打造。(<a href="https://app.voker.ai/docs">https://app.voker.ai/docs</a>)
<p>智能体工程师和 AI 产品团队无法在生产环境中对智能体性能获得足够的可见性,这导致糟糕的用户体验、用户流失,以及为了查找和调试智能体配置问题而浪费的数百小时的人工抽检时间。</p>
<p>演示视频:<a href="https://www.tella.tv/video/vid_cmoukcsk1000i07jgb4j65u67/view" rel="nofollow">https://www.tella.tv/video/vid_cmoukcsk1000i07jgb4j65u67/vie...</a></p>
<p>我们最近对 YC 创始人进行了一项调查,超过 90% 的受访者表示,他们得知智能体在生产环境中未能满足用户需求的唯一方式就是收到客户的投诉。他们推送提示词修改,希望这能解决问题且不破坏其他地方,然后这个循环不断重复。</p>
<p>我们看到大量可观测性和评估产品涌现出来,试图解决这些问题,但我们仍然感觉智能体监控栈中缺少了一些东西。可观测性工具(Obs)适合单个追踪调试,但仅限于工程师使用。评估工具(Evals)适合测试已知问题,但无法洞察团队未预见的趋势,因此工程师总是处于被动追赶状态。传统的产品分析工具擅长追踪产品界面上的点击和页面浏览量,但并非从零开始为智能体产品构建。了解用户对智能体的期望以及智能体是否满足这些需求,需要特定的对话智能和非结构化数据处理技术。</p>
<p>我们提出了智能体分析的基本元素:意图(Intents)、纠正(Corrections)和解决(Resolutions),以描述几乎所有对话智能体共有的特征:用户总是带着某种意图来到智能体面前,在解决意图的过程中,用户可能需要纠正智能体,希望用户的每个意图最终都能由智能体解决。</p>
<p>Voker 通过自动标注单个对话并提取用户意图和纠正行为来处理 LLM 调用。Voker 利用这些数据和层次化文本分类技术创建动态类别,从而提供高级别洞察,让你无需阅读单个对话即可了解用户的主要使用模式。</p>
<p>我们最常见的替代解决方案是将可观测性日志上传到 Claude 或 ChatGPT 并要求总结洞察。这存在几个问题——主要是 LLM 不擅长数学或数据科学,因此无法获得准确或一致的统计数据。LLM 很可能对某些洞察过拟合,而对其他洞察欠拟合。LLM 并不是以编程方式读取和分类每个单独的会话或交互。这就是为什么我们不使用 LLM 进行任何核心数据工程(处理事件、计算统计),所以我们生成的分析结果具有一致性、可复现性和准确性。</p>
<p>我们提供了一个公开可用的轻量级 SDK,可以在 Python 和 Typescript 中封装对 OpenAI、Anthropic 和 Gemini 的 LLM 调用。Voker 负责数据工程,将原始数据转化为可用的分析基本元素和高级别洞察。</p>
<p>免费层级:每月 2,000 个事件,需要注册邮箱。付费计划每月 80 美元起,并提供 30 天免费试用。</p>
<p>我们很想听听你们目前如何检测趋势,以及如果你们尝试了 Voker,告诉我们我们的分析中哪些部分有价值,以及哪些部分仍然感觉缺失。谢谢阅读,期待在评论中看到你们的想法!
查看缓存全文
缓存时间: 2026/05/13 00:26
# Voker | AI Agent 分析
来源: https://voker.ai/
## 确保您的 AI Agent 是在提供帮助,而不仅仅是做出回应。
Voker 是专为 Agent 时代设计的分析工具,帮助您打造尽可能优秀的 Agent。
显示总会话数、修正率、解决率、新意图类别的分析仪表板,以及比较随时间变化的修正率和解决率的折线图,还有展示意图类别会话百分比的彩色条形图。分析仪表板显示总会话数为 654 次,增长 +1882%,平均修正率为 42%(下降 37%),平均解决率为 34%,以及 309 个新意图类别。
淡色云层漂浮在渐变青色背景上的模糊图像,两侧带有微妙的加号轮廓。
## 您真的了解您的 Agent 正在对用户说什么吗?
感觉就像在盲目飞行
扫描追踪数据并不能告诉您 Agent 是否有帮助、准确或遇到瓶颈。您往往只有在客户投诉或流失率飙升时才会发现问题。
获取有用的使用数据资源密集
每个利益相关者都需要数据。每个请求都会将工程师从构建工作中拉走。没有人能够自助获取见解。
证明 Agent 的投资回报率(ROI)很困难
产品和业务团队需要量化 AI 投资。您拥有使用统计数据,但难以将 Agent 的表现与转化、留存或收入联系起来。
## 一个平台。全面可见性。更优秀的 Agent。
Voker 将 AI Agent 的互动转化为结构化分析数据,您的团队任何人都可以使用。
自助分析
产品经理、分析师和业务团队可以获得他们需要的易于理解的见解,无需工单、瓶颈或延迟。
坐在办公桌前使用笔记本电脑和显示代码及通讯应用器的台式显示器工作的男子。
性能智能
追踪 AI Agent 正在说什么,识别知识差距,检测异常,并衡量随时间的改进。
业务影响
通过将对话数据与您已收集的用户数据进行关联,将 Agent 指标与重要的结果联系起来。
自助分析
产品经理、分析师和业务团队可以获得他们需要的易于理解的见解,无需工单、瓶颈或延迟。
业务影响
通过将对话数据与您已收集的用户数据进行关联,将 Agent 指标与重要的结果联系起来。
性能智能
追踪 AI Agent 正在说什么,识别知识差距,检测异常,并衡量随时间的改进。
自助分析
产品经理、分析师和业务团队可以获得他们需要的易于理解的见解,无需工单、瓶颈或延迟。
性能智能
追踪 AI Agent 正在说什么,识别知识差距,检测异常,并衡量随时间的改进。
戴眼镜穿白色 T 恤的男子在办公室里用手势比划,另一名穿格子衬衫的男子拿着标记笔。
业务影响
通过将对话数据与您已收集的用户数据进行关联,将 Agent 指标与重要的结果联系起来。
自助分析
产品经理、分析师和业务团队可以获得他们需要的易于理解的见解,无需工单、瓶颈或延迟。
坐在办公桌前使用笔记本电脑和显示代码及通讯应用器的台式显示器工作的男子。
性能智能
追踪 AI Agent 正在说什么,识别知识差距,检测异常,并衡量随时间的改进。
戴眼镜穿白色 T 恤的男子在办公室里用手势比划,另一名穿格子衬衫的男子拿着标记笔。
业务影响
通过将对话数据与您已收集的用户数据进行关联,将 Agent 指标与重要的结果联系起来。
透明背景上的深绿色形状,带有弯曲边缘和一个圆角。
意图
识别用户想要什么。Voker 从自然对话中自动分类用户目标。
“帮我预订下一次度假。”
留着卷曲黑发、戴眼镜、穿灰色衬衫的年轻男子,户外背景模糊自然。
修正
检测用户未得到所需内容的时候。在流失发生之前暴露摩擦点。
“帮我预订下一次度假。”
留着卷曲黑发、戴眼镜、穿灰色衬衫的年轻男子,户外背景模糊自然。
不,你把日期搞错了……又是这样。是 4/5 - 4/18
留着卷曲黑发、戴眼镜、穿灰色衬衫的年轻男子,户外背景模糊自然。
解决
识别 Agent 解决用户意图的时候。衡量每次互动的成功率。
不,你把日期搞错了……又是这样。是 4/5 - 4/18
留着卷曲黑发、戴眼镜、穿灰色衬衫的年轻男子,户外背景模糊自然。
明白了,正在为您预订 4/5 - 4/18 的航班。
Voker logo.svg)
## 专为打造顶级 Agent 产品的团队打造
Checkmark_Icon
高互动量(每月 1k+ 聊天会话)
Checkmark_Icon
复杂的多轮对话(工具、RAG、MCP)
Checkmark_Icon
需要 Agent 见解的跨职能团队
四个人在小办公室讨论,配有白板和电脑显示器。
白色背景上的深绿色抽象形状,带有圆边。
透明背景上的深绿色形状,带有弯曲边缘和一个圆角。
## 与您的技术栈兼容。无供应商锁定。拥有您的数据。
Voker 支持任何 LLM 框架或模型,并与 OpenAI、Anthropic 和 Gemini 无缝集成。
chatgpt
OpenAI
anthropic
Anthropic
gemini icon
Gemini
langchain icon
Langchain
crew icon
CrewAI
vercel icon
Vercel AI SDK
轻量级 SDK
Python 和 Typescript。两行代码即可安装。
拥有您的数据
保留对您数据的完全所有权。
支持自托管
针对企业需求进行架构设计。
## 只需几行代码即可获取见解
轻量级集成。无需基础设施更改。免费开始,随着您的成长而扩展。
1
安装 SDK
一个代码片段,适用于任何框架
2
连接您的 Agent
自动开始数据收集
```python
from voker.ai.provider_openai import OpenAI
```
已复制
3
开始分析
仪表板填充见解
## 了解您的 Agent 所需的一切
为运行高容量对话式 AI 的团队构建的强大功能。
可查询的对话时间线
通过用户的眼光查看 Agent 对话。搜索所有对话中的主题、意图和问题。
OnboardingAssist_Pro Agent 的仪表板,显示 30 天内的 101 个会话,平均解决率 42%,平均修正率 37%,带有会话详情和意图类别选项卡。
性能追踪
在做出更改时量化改进。知道何时在更新破坏系统时回滚。
显示 Daniel Carter 互动摘要的用户分析仪表板,包括 39% 的解决率、41% 的修正率、常见意图类别和详细的行为摘要。
用户行为见解
追踪用户询问的内容,Agent 是否交付。当用户感到沮丧或愤怒退出时获得警报。
安装 Voker SDK 的分步指南,配置 API 密钥,使用 OpenAI 创建第一个事件,并等待第一个事件。
生态系统友好
与 Langfuse、Langsmith、PostHog、Mixpanel、Amplitude 等协同工作。
白色背景上的深黑色抽象形状,带有圆边。
留着棕色短发、胡须和蓝色眼睛的男子,身穿黑色衬衫,背景为黑色,面带微笑。
.svg)
## 受需要最佳表现的产品团队信赖
“数据驱动了 True Classic 的所有决策,但我们没有方法来追踪 AI 性能。Voker 使得快速监控和优化我们的 AI 功能成为可能。”
Ben Yahalom,
True Classic CEO
戴黑色眼镜、黑发、穿栗色衬衫的男子,黄色背景,看向侧面。
.svg)
## 受需要最佳表现的产品团队信赖
“Voker 使我们在生产中优化 Agent 成为可能,确保在记录时间内实现正 ROI 结果,而不影响工程资源。”
Carlos Moreno,
Dutch CTO
留着深色长发、穿无袖深色上衣的女子,蓝色背景,面带微笑。
.svg)
## 受需要最佳表现的产品团队信赖
“使用 Voker,我们可以比竞争对手更快地迭代改进我们的 Agent。它为我们简化了一切。”
Ariel Herrera,
Coffee Clozers CTO
.svg)
## 受需要最佳表现的产品团队信赖
“Voker 一直是我们出色的合作伙伴。通过他们的意图和解决率追踪,我们了解了需要在产品和客户成功方面进行投资的地方,以及我们正在实现目标的地方!”
Peter Greig,
Lull 数据与分析副总裁
两个连接的圆角正方形组成的黑色几何形状,形成类似 L 的图形。
透明背景上带有渐变阴影的抽象重叠圆角矩形,形成几何设计。
## 免费开始,随着您的 Agent 成长而扩展
适用于 Agent 旅程每个阶段的计划。免费开始,随着您的 Agent 成长而扩展。邀请整个团队。
正在尝试向产品中添加 Agent。从一开始就捕获分析。
/ 每月 2,000 个事件
/ 30 天保留
/ 社区支持
/ 无限席位
正在尝试向产品中添加 Agent。从一开始就捕获分析。
/ 无限席位
/ 每月 2,000 个事件
/ 30 天保留
/ 社区支持
30 天免费试用
您的产品最近推出了 Agent,但使用量仍然有限。
/ 无限席位
/ 每月最多 20,000 个事件
/ 90 天数据保留
/ 电子邮件支持
30 天免费试用
Agent 是您产品体验的核心部分,用户定期依赖它们。
/ 无限席位
/ 每月 2,000,000 个事件
/ 1 年数据保留
/ Agent 自动优化
/ 电子邮件 + Slack 支持
Agent 在大规模运行,可靠性、优化和治理至关重要。
/ 无限席位
/ 自定义事件量
/ 自定义数据保留
/ 自托管部署
/ SSO
/ 专用优化工程师
意图、修正和解决检测
可查询的对话时间线
Agent 性能追踪
Agent 自动优化(测试版)
事件包括用户消息、助手消息和由您的 Agent 生成的工具调用。
大多数对话平均生成约 15 个事件。
白色背景上的深黑色抽象形状,带有圆边。
相似文章
HeyAgent ProductHunt 发布 || AI Agent 的 LinkedIn
HeyAgent 推出 AI 代理,可自主与其他代理建立联系、评估职业匹配度,并每日为你简报。
@ycombinator: Hyper (@heyhyperai) 正在为企业打造自动驾驶式的大脑。Hyper 的智能体通过整合数百万封电子邮件、文档……
Hyper 正在推出一款 AI 智能体平台,旨在通过整合来自电子邮件、文档和 Slack 的数据,充当企业的“自动驾驶式大脑”,从而增强内部 AI 工具的能力。
@ycombinator: http://Trigger.dev 让开发者能够通过简单的 SDK 为产品添加 AI Agent,并处理执行、长时间运行……
Trigger.dev 完成了 1600 万美元的 A 轮融资,以扩展其平台,该平台使开发者能够通过简单的 SDK 构建和部署可靠的 AI Agent 和工作流。这家由 Y Combinator 支持的公司强调了其长期任务执行、实时流传输和编程式检查点等功能。
@ycombinator:Foaster(@Foaster_ai)正在打造可替代传统咨询公司的 AI Agent。它们负责梳理贵公司的业务流程,快速搭建 AI 转型路线图……
Foaster 是一家由 Y Combinator 投资的初创企业,正推出旨在替代传统咨询公司的 AI Agent。它通过梳理企业工作流、生成 AI 转型路线图,以及指导员工落地应用与技能升级来实现这一目标。
@hyperagent:如果你在评估新的 Agent 平台,先看这个。前 1,000 名 Hyperagent 订阅者将获得 1,000 美元奖励额度。
Hyperagent 推出企业级 AI Agent 平台,可自主处理招聘、运营、营销等复杂工作流,并持续学习组织上下文。该初创公司向前 1,000 名注册用户提供 1,000 美元奖励额度。