@neural_avb: `fast-rlm` 新更新 查看这个演示,RLM 进行网页搜索(exa),使用工具评论 Goodreads,并推荐书籍!…
摘要
`fast-rlm` 新更新引入了 REPL Tool Calling,允许代理通过 REPL 调用 Python 函数,并将输出存储在变量中。演示展示了网页搜索和 Goodreads 评论的集成。
`fast-rlm` 新更新 查看这个演示,RLM 进行网页搜索(exa),使用工具评论 Goodreads,并推荐书籍!- 引入 REPL Tool Calling - 将任意 Python 函数传入 RLM,代理可通过 REPL 调用它 - 工具输出不会自动加载到上下文中,而是存储在 Python 变量中 - 主代理调用子代理并传递旧/新工具 - 将环境变量和网页工具配置到 RLM 环境中 - 辅助函数在 REPL 中漂亮地打印 pydantic 对象,以便代理无需花费额外步骤解码它们 非常令人兴奋!存储库中提供了示例脚本。
相似文章
@micka_design: 新组件发布:聊天式消息编辑器,带自动调整大小的文本区域,灵活的左/右操作槽。简洁…
Fluid Functionalism 发布了一个开源的聊天式消息编辑器组件,具有自动调整大小的文本区域和灵活的左/右操作槽。
@victormustar: 在本周结束之前,让我们回顾一下开放AI领域最疯狂的一周,发布了超过25个引人注目的开放权重模型…
本周开放AI领域异常精彩,发布了超过25个开放权重模型,涵盖大语言模型、图像生成、音频/语音、视觉和视频/3D等领域,NVIDIA、Google等机构贡献突出。
记忆检索底层存在缺陷。
PrecisionMemBench 是一个开源基准测试,它将检索精度作为严格的单元测试来检验,结果揭示了诸如 Mem0、Zep 和 Hindsight 等流行的记忆框架精度极低(0.05-0.09),并且依赖 LLM 来弥补。文章主张在生产级记忆基础设施中对精度采取零容忍的硬失败策略。
OpenLumara - 一种与众不同的AI代理,从头编写,非Vibe编码。极其节省Token,系统提示非常小,专为本地模型设计。一切皆模块化。
OpenLumara是一个全新的开源AI代理框架,专为本地模型设计,强调Token效率、模块化和安全性。它从头编写,拥有小巧的系统提示,并能完全控制AI能力。
LLM在爱沙尼亚语中的表现
爱沙尼亚语言研究所发布了一个开放基准,用于评估LLM在爱沙尼亚语中的表现,涵盖语言能力、推理、事实准确性以及抵制宣传的能力,结果显示在英语基准上表现强劲的模型在较小语言环境中可能表现不同。