@0xlelouch_: 上周面试了一位AI工程师,他不知道最新的框架名称。不知道LangGraph。不了解vLLM内部细节。混淆了一些。

X AI KOLs Timeline 新闻

摘要

一条推文分享了一个轶事:面试了一位AI工程师,他虽然不了解最新框架,但擅长调试一个实际性能问题,强调了实际问题解决能力比工具熟悉度更重要。

上周面试了一位AI工程师,他不知道最新的框架名称。不知道LangGraph。不了解vLLM内部细节。混淆了几个RAG模式。没法告诉我如何在最新工具链中正确设置评估(evals)。 然后我们给了一个有问题的推理服务:p95从200ms跳到了2s,GPU利用率低,错误率持平。 他们要了日志,对请求进行了端到端跟踪,发现分词(tokenization)发生了两次,并且模型每次部署都会重新加载,因为容器镜像缺少权重层缓存。他们增加了预热操作,修复了缓存键,并在慢路径周围加了一个简单的OpenTelemetry span。30分钟内p95恢复到300ms以下。 经验是在压力下知道如何解决问题,而不是知道每个库的名称。
查看原文
查看缓存全文

缓存时间: 2026/06/29 08:25

上周面试了一位AI工程师,他不知道最新的框架名称。不知道LangGraph,不了解vLLM内部原理,把几种RAG模式搞混了,也说不出在最新工具链中如何“正确”配置评估。

然后我们给他们一个出问题的推理服务:p95从200ms飙升到2秒,GPU利用率很低,错误率持平。

他们要求查看日志,从头到尾追踪了一个请求,发现分词执行了两次,而且由于容器镜像缺少权重层缓存,模型在每次部署时都会重新加载。他们添加了预热机制,修复了缓存键,并在慢速路径周围加了一个简单的OpenTelemetry跟踪段。30分钟内,p95恢复到300毫秒以下。

经验是在压力下知道如何解决问题,而不是记住每一个库的名称。

相似文章

@GergelyOrosz:来自德国的一位首席全栈工程师在面试中观察到:“面试已经发生了巨大变化!过去,面试问题/讨论会涉及React vs Angular、Java vs Go等话题。如今,问题是:你能根据一个瀑布式规范,在两小时内一次性推导出一个产品吗?这本来需要十年时间……因为这才是我们应该做的。我觉得团队居然相信这一切简直是疯狂。但你要么接受并拿到工作机会,要么反驳并解释其中的问题,然后你就没机会了。”

X AI KOLs Following

一位德国首席全栈工程师观察到,科技面试已从讨论React vs Angular等框架转向要求候选人使用AI根据规范快速生成产品,称这一趋势“纯粹是疯狂”。