shared-task

标签

Cards List
#shared-task

CUNY在CLPsych 2026中的工作:一种用于心理健康变化分类与总结的流水线方法

arXiv cs.CL · 2026-05-26 缓存

CUNY在CLPsych 2026共享任务中的提交采用了一种流水线方法,结合了上下文学习与开放权重大型语言模型、监督分类器和检索增强生成,用于从Reddit时间线中分类和总结心理健康变化,在多个子任务中取得了最高排名。

0 人收藏 0 人点赞
#shared-task

Counter Turing Test 的发现:AI生成文本检测

arXiv cs.CL · 2026-05-21 缓存

本文介绍了 Counter Turing Test 共享任务在AI生成文本检测方面的发现,顶级系统在二分类任务中达到了完美表现,但在模型归因方面性能显著较低,突显了区分不同大语言模型输出的难度。

0 人收藏 0 人点赞
#shared-task

面向文化图像描述的长上下文检索增强翻译:Gators在AmericasNLP 2026共享任务中的提交

arXiv cs.CL · 2026-05-21 缓存

佛罗里达大学Gators团队提交至AmericasNLP 2026共享任务,该任务涉及面向土著语言的文化图像描述。我们采用双阶段流水线:使用Qwen2.5-VL生成西班牙语中间描述,然后通过检索增强的多示例提示,利用Gemini 2.5 Flash生成目标语言描述。与基线相比,取得了显著提升。

0 人收藏 0 人点赞
#shared-task

缩小CRAC 2026差距:基于LLM的多语言共指解析的两阶段自适应方法

arXiv cs.CL · 2026-05-19 缓存

本文提出了一种基于LLM的多语言共指解析的两阶段自适应方法,在CRAC 2026的LLM赛道中以74.32的CoNLL F1分数获得第一名。该方法使用多语言基适配器后接数据集特定适配器对Gemma-3-27b进行微调。

0 人收藏 0 人点赞
#shared-task

单词难度由何决定?Sakura在BEA 2026词汇难度预测共享任务中的表现

arXiv cs.CL · 2026-05-15 缓存

本文介绍了两种词汇难度预测模型:一种是通过软目标损失微调的黑盒大语言模型,实现了高准确度;另一种是可解释模型,能提供对难度因素的深入分析。这些模型参与了BEA 2026共享任务,并取得了强相关性。

0 人收藏 0 人点赞
#shared-task

RETUYT-INCO 在 BEA 2026 共享任务 2 中的表现:德语基于评分标准的元提示词方法

arXiv cs.CL · 2026-05-13 缓存

本文详细介绍了 RETUYT-INCO 团队参与 BEA 2026 共享任务 2 的情况,提出了一种用于德语简答题基于评分标准(rubric-based)评分的元提示词(meta-prompting)方法。

0 人收藏 0 人点赞
#shared-task

PSK@EEUCA 2026:利用合成数据增强微调大型语言模型以检测游戏聊天中的多类毒性

arXiv cs.CL · 2026-05-11 缓存

本文介绍了一个用于 EEUCA 2026 游戏聊天毒性检测共享任务的系统,该系统通过结合合成数据增强微调 Llama 3.1 8B 模型,获得了第四名。文章重点阐述了一种“验证陷阱”现象:由于数据分布偏移,较高的验证分数与测试集表现并不相关。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈