EMNLP workshop 值得投吗?或其他适合 VLM 评测工作的 NLP 会议?
摘要
一位博士生在顶级影像会议被拒后,询问将视觉-语言模型评测工作投到 EMNLP workshop 是否划算。
我的论文被一家 A\* 影像顶会拒了,理由是缺乏临床验证,且“更适合 NLP”。我对这个结果很失望,因为方法扎实、发现对该会场非常对症。我在考虑转投 EMNLP,但又担心太偏 NLP,论文会被淹没。不过我发现 EMNLP 的一个 workshop 跟主题极度契合。请问这种顶会旗下的 workshop 对博士生到底值不值?还是干脆再等等,改投低一档的影像会议?我博士毕业后就转业界,只想快点发出来,最好简历上能有几篇 A\*,实话实说。
相似文章
@DanKornas:LLM评估是大多数AI演示开始成为真正系统的地方。LLM-Evaluation是一个公共GitHub资源,包含研讨会幻灯片…
一条推文宣布了LLM-Evaluation,这是一个公共GitHub仓库,包含用于评估LLM、生成式AI和RAG系统的研讨会幻灯片、示例笔记本、提示词和参考链接,旨在提供评估工作流的实用地图。
VLMs 是否像工程师一样推理?一个基准与分阶段评估
本文介绍了 EngVQA,一个用于评估视觉语言模型工程推理能力的多模态基准,以及一个 8 阶段自动评估框架,能够对推理失败进行细粒度分析。它揭示了当前 VLMs 在工程推理能力上的重大局限性。
@ArizePhoenix:免费的两个小时评估工作坊!在AI Engineer: Europe会议上,开发者关系主管Laurie Voss主持了这场工作坊…
Arize Phoenix宣布在AI Engineer: Europe会议上举办免费的两小时评估工作坊,由开发者关系主管Laurie Voss主讲,内容包括手动数据检查以及内置与自定义评估。
EnvSimBench:用于评估和改善基于大语言模型的环境模拟的基准
本文介绍了 EnvSimBench,这是一个用于评估大语言模型在智能体训练中模拟环境能力的基准。它指出了当前大语言模型中存在的“状态变化悬崖”问题,并提出了一种约束驱动的流水线以减少幻觉和降低成本。
EMNLP 投稿量已达11000?[D]
EMNLP 2024 的投稿量已达 11000 篇,高于去年的 8000 篇,凸显了 NLP 领域的快速增长。