@gregpr07: Browser Use Beta 刚刚在我们最难的内部网络代理基准测试中实现了 SOTA。Fable 在优化方面确实令人惊叹…

X AI KOLs Following 新闻

摘要

Browser Use Beta 在困难的内部网络代理基准测试中取得了先进的结果,使用了 Fable 进行优化和分析。

Browser Use Beta 刚刚在我们最难的内部网络代理基准测试中实现了 SOTA。 Fable 在优化和分析评估运行方面确实令人惊叹。它能够在巨大的 Rust 代码库中找到模型中非常高层次的启发式方法,并找出为什么那些边缘情况会发生。 这感觉是下一个层次,我已经使用自动研究循环好几个月了,这是第一个真正理解高层次内容的! (而且它竟然一次性就生成了这张图片,太疯狂了哈哈)
查看原文
查看缓存全文

缓存时间: 2026/06/12 08:57

Browser Use Beta 刚刚在我们最难的内测网页 agent 基准测试中达到了 SOTA。

Fable 在优化与评估运行分析方面真的非常出色。它能从运行中提取模型的高度抽象启发式方法,找出那些边缘案例在庞大的 Rust 代码库中产生的原因。

这感觉像是上了一个新台阶——我研究自动研究循环好几个月了,而这是第一个能够在高层真正理解问题的方案!

(另外,竟然一张图就直接搞定,太不可思议了,哈哈)

相似文章