标签
RuleChef 是一个框架,利用大型语言模型(LLM)为自然语言处理任务(如文本分类、命名实体识别或关系抽取)生成人类可编辑、可执行的规则。它基于任务描述和一组标注示例生成规则,然后根据更多示例和人类对现有规则的反馈进行迭代改进。RuleChef 还可以通过观察任何现有模型在给定任务上的输入-输出对来引导规则生成。LLM 仅在训练阶段使用,合成规则并根据在留出集上测量的失败进行迭代修补。这个过程最终产生一个快速、确定且可审查的规则系统。初步评估在分类和命名实体识别任务上进行。我们将 RuleChef 作为开源软件发布,采用 Apache 2.0 许可。
本文刻画了保形风险控制何时能为结构化LLM输出提供认证,证明了不可能性界限,并分析了不同界限下的认证层次。在六个开放权重模型上的实证验证表明,困难配置在低风险水平下无法被认证,但在放宽目标下可实现实际认证。
本文介绍了BERTomelo,一种基于ModernBERT架构预训练的下一代单语编码器,专为葡萄牙语优化。在STS和NER等下游任务中,其性能优于以往的葡萄牙语模型和多语言模型。
GLiNER-Relex 是一个用于联合命名实体识别(NER)与关系提取(RE)的统一框架,利用共享的 Transformer 编码器实现零样本能力。该论文展示了模型在标准基准测试中具有竞争力的性能,并将其作为开源 Python 包发布。