标签
本文描述了UOL@IDEM在BEA 2026 L1感知词汇难度预测共享任务中的封闭赛道提交方案,结合多语言上下文表示与工程化特征。该系统在西班牙语、德语和中文上取得了有竞争力的RMSE分数,其中词频是最稳定的预测因子。
本文提出了一种用于教育对话去标识化的全本地AI级联框架,结合了先召回候选生成器与上下文感知的移除/保留评审器。该方法在不将数据发送到外部API的情况下实现了高精度,在数学辅导记录上优于更小的本地模型和商业API。