@_vmlops:生产环境中的 RAG 评估与测试(离线 + 在线)模型评估师、AI QA 及 SDET 的面试准备指南
摘要
一份共享资源,链接至专注于大语言模型 RAG 评估与测试的面试准备指南。
面向大语言模型模型评估师、AI QA 及 SDET 的生产环境 RAG 评估与测试(离线 + 在线)面试准备指南 https://drive.google.com/file/d/1nvKRSsyHk8Ti2dk4qbsybGh7MRN9aJph/view?usp=drivesdk…
相似文章
@techNmak: https://x.com/techNmak/status/2064388143781130421
一份面向2026年AI/ML工程师面试的全面两篇指南,涵盖经典机器学习、大语言模型、微调、检索增强生成、智能体以及生产系统,强调需同时准备传统与现代主题。
jamwithai/production-agentic-rag-course
一个以学习者为中心的实践课程,教授从零开始构建生产级RAG系统,涵盖关键词搜索、混合检索、基于LangGraph的智能体RAG以及Telegram机器人集成。
Agent 评估:详细指南(53 分钟阅读)
关于评估基于 LLM 的 Agent 系统的全面指南,涵盖基本概念、评估框架以及来自近期基准测试的案例研究。
面向LLM-as-a-Judge的动态评估准则生成与优化
本文提出了一种无需训练的方法,可以在无需人工标注的情况下自动生成细粒度的评估准则用于LLM-as-a-Judge,并进一步介绍了一种迭代微调策略,使准则生成器的性能超过更大的专有模型。
@_vmlops: 大语言模型文本生成的端到端推理管线——模拟面试指南 https://drive.google.com/file/d/1eDqEtWWtIe…
本指南解释了大语言模型的端到端推理管线,作为理解文本生成的模拟面试资源。