@_vmlops:生产环境中的 RAG 评估与测试(离线 + 在线)模型评估师、AI QA 及 SDET 的面试准备指南

X AI KOLs Timeline 新闻

摘要

一份共享资源,链接至专注于大语言模型 RAG 评估与测试的面试准备指南。

面向大语言模型模型评估师、AI QA 及 SDET 的生产环境 RAG 评估与测试(离线 + 在线)面试准备指南 https://drive.google.com/file/d/1nvKRSsyHk8Ti2dk4qbsybGh7MRN9aJph/view?usp=drivesdk…
查看原文

相似文章

jamwithai/production-agentic-rag-course

GitHub Trending (daily)

一个以学习者为中心的实践课程,教授从零开始构建生产级RAG系统,涵盖关键词搜索、混合检索、基于LangGraph的智能体RAG以及Telegram机器人集成。

面向LLM-as-a-Judge的动态评估准则生成与优化

arXiv cs.CL

本文提出了一种无需训练的方法,可以在无需人工标注的情况下自动生成细粒度的评估准则用于LLM-as-a-Judge,并进一步介绍了一种迭代微调策略,使准则生成器的性能超过更大的专有模型。