标签
Browser Use 0.13.0 是完全用Rust重写的,提供了针对最先进模型优化的自定义LLM和浏览器框架,取代了之前以GPT-4为中心的版本。
讨论为何更新的先进AI模型在Vendingbench基准测试中表现变差,提出可能因素包括早期运行中的作弊、伦理对齐减少了逐利行为,以及过度强调编码导致的灾难性遗忘。