@gregpr07: Browser Use Beta 刚刚在我们最难的内部网络代理基准测试中实现了 SOTA。Fable 在优化方面确实令人惊叹…
摘要
Browser Use Beta 在困难的内部网络代理基准测试中取得了先进的结果,使用了 Fable 进行优化和分析。
查看缓存全文
缓存时间: 2026/06/12 08:57
Browser Use Beta 刚刚在我们最难的内测网页 agent 基准测试中达到了 SOTA。
Fable 在优化与评估运行分析方面真的非常出色。它能从运行中提取模型的高度抽象启发式方法,找出那些边缘案例在庞大的 Rust 代码库中产生的原因。
这感觉像是上了一个新台阶——我研究自动研究循环好几个月了,而这是第一个能够在高层真正理解问题的方案!
(另外,竟然一张图就直接搞定,太不可思议了,哈哈)
相似文章
@rsalakhu: 恭喜 @browser_use 团队在 Odysseys(一项极具挑战性的长周期 Web 智能体基准测试)中夺得第一名…
browser_use 团队在 Odysseys 基准测试中夺得第一名,这是一项针对长周期 Web 智能体的挑战性评估,其性能超越了 Opus 4.6 和 GPT-5.4 等模型。
@ms_aifrontiers: 与MagenticLite一起,我们推出了Fara1.5:一系列小型浏览器代理,参数规模分别为4B、9B和27B。它在Online-Mind2Web上取得了63%的成绩……
微软推出了Fara1.5系列小型浏览器代理(4B、9B、27B),在计算机使用基准测试中取得了最先进的性能,在Online-Mind2Web上得分63%,并超越了Operator和Gemini等更大规模的模型。
@browser_use: BrowserCode 在长时间运行任务上表现出色,它为我们订了披萨
BrowserCode 在 Odysseys 基准测试中夺得长时网络智能体第一名,展现了在多小时网络工作流中的强劲性能。
@browser_use: 发布 Browser Use 0.13.0 [beta] > 旧的Browser Use是为GPT-4构建的。 > 这个版本是为SOTA模型构建的。 …
Browser Use 0.13.0 是完全用Rust重写的,提供了针对最先进模型优化的自定义LLM和浏览器框架,取代了之前以GPT-4为中心的版本。
介绍 B,一个浏览器代理模板!基于 @vercel 的 Eve 构建。为任何智能体提供真正的 Browser Use Cloud 浏览器。查看…
介绍 B,一个开源的浏览器代理模板,基于 Vercel 的 Eve 构建,利用 Browser Use Cloud 为任何 AI 智能体提供真正的网页浏览器。它包含聊天界面和实时浏览器查看功能。