@gabepereyra: Harvey与@appliedcompute合作训练法律智能体。我们优化了智能体堆栈的每个部分,包括……
摘要
Harvey与Applied Compute合作训练了一个法律智能体,对智能体堆栈进行了优化,并使用来自其法律智能体基准(LAB)的奖励信号对GLM-5.1模型进行了后训练。
查看缓存全文
缓存时间: 2026/06/23 15:51
Harvey 与 @appliedcompute 合作训练了一个法律智能体。
我们优化了智能体技术栈的每个部分,包括评估循环、智能体框架与压缩,并利用 Harvey 法律智能体基准(LAB)的奖励信号对底层 GLM-5.1 模型进行了后训练。
欢迎在下方智能体训练深度解析中了解更多详情。
感谢 @nikogrupen、@ItsJulioPereyra、@rhythmrg、@jacob_dphillips 和 @raymondmfeng 主导这项工作——更多精彩即将到来,结合 GLM-5.2 将带来大量探索前沿的机会。
相似文章
Harvey 发布法律智能体基准测试(Legal Agent Benchmark,阅读约 12 分钟)
Harvey 发布法律智能体基准测试(LAB),这是一个开源工具,旨在评估 AI 智能体在长周期法律任务中的表现,帮助律所衡量投资回报率并追踪进展。
为法律专业人士定制模型
法律专业人士生成式AI平台Harvey与OpenAI合作,创建了一个定制训练的案例法模型,该模型减少了幻觉现象,改善了文件起草和合同分析等复杂法律任务的推理能力。该定制模型在10亿个美国案例法令牌上进行了训练,在律师偏好度测试中超过标准基础模型97%。
@ClementDelangue:路由和后训练开源模型不仅能让你的系统更准确,还能显著提升速度并降低成本……
讨论路由和后训练开源模型如何在准确性、速度和成本上超越前沿模型。Harvey与Fireworks AI的合作表明,混合法律代理在质量和成本上均优于前沿模型。
我为一家中型律所构建了一个多智能体 AI 系统——以下是真正有效(和无效)的做法
作者分享了在律所部署基于 Claude 和 LangGraph 的多智能体 AI 系统时的经验教训,重点介绍了基于置信度评分的任务交接机制的成功应用,以及防止幻觉产生所需的人机协作监管的重要性。
@aiDotEngineer: 您的智能体现在可以训练模型。来自@mervenoyann 的观点:开源模型已经迎头赶上。GLM 5.1 在人工智能分析指数上领先……
@mervenoyann 的演讲展示了开源模型(如 GLM 5.1)已赶上闭源模型,并说明了 Hugging Face 生态系统如何让智能体训练模型、执行推理和构建工作流。