acl-2026

标签

Cards List
#acl-2026

结构引导实体解析:微调大语言模型实现复杂语言环境下的鲁棒姓名匹配

arXiv cs.CL · 2026-05-25 缓存

本文提出结构引导实体解析(SGER)框架,通过课程学习微调大语言模型,在语言多样化环境中实现鲁棒的人名匹配,在印度身份数据上达到99.02%准确率,并已在Dream11部署。

0 人收藏 0 人点赞
#acl-2026

我训练了TIME:基于Qwen模型的短时上下文触发思考而非过度思考

Reddit r/LocalLLaMA · 2026-05-18

一个个人项目最终产出了一篇ACL 2026论文,介绍了TIME方法,训练Qwen3模型进行短时、上下文触发的思考,而非过度推理。该工作使用了QLoRA和四阶段课程,所有数据和代码均已开源发布。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈