@neural_avb: `fast-rlm` 新更新 查看这个演示,RLM 进行网页搜索(exa),使用工具评论 Goodreads,并推荐书籍!…

X AI KOLs Timeline 工具

摘要

`fast-rlm` 新更新引入了 REPL Tool Calling,允许代理通过 REPL 调用 Python 函数,并将输出存储在变量中。演示展示了网页搜索和 Goodreads 评论的集成。

`fast-rlm` 新更新 查看这个演示,RLM 进行网页搜索(exa),使用工具评论 Goodreads,并推荐书籍!- 引入 REPL Tool Calling - 将任意 Python 函数传入 RLM,代理可通过 REPL 调用它 - 工具输出不会自动加载到上下文中,而是存储在 Python 变量中 - 主代理调用子代理并传递旧/新工具 - 将环境变量和网页工具配置到 RLM 环境中 - 辅助函数在 REPL 中漂亮地打印 pydantic 对象,以便代理无需花费额外步骤解码它们 非常令人兴奋!存储库中提供了示例脚本。
查看原文

相似文章

记忆检索底层存在缺陷。

Reddit r/AI_Agents

PrecisionMemBench 是一个开源基准测试,它将检索精度作为严格的单元测试来检验,结果揭示了诸如 Mem0、Zep 和 Hindsight 等流行的记忆框架精度极低(0.05-0.09),并且依赖 LLM 来弥补。文章主张在生产级记忆基础设施中对精度采取零容忍的硬失败策略。

LLM在爱沙尼亚语中的表现

Reddit r/ArtificialInteligence

爱沙尼亚语言研究所发布了一个开放基准,用于评估LLM在爱沙尼亚语中的表现,涵盖语言能力、推理、事实准确性以及抵制宣传的能力,结果显示在英语基准上表现强劲的模型在较小语言环境中可能表现不同。