open-source-llms

标签

Cards List
#open-source-llms

它们能走多远?利用大型语言模型对在线影响力进行红队测试

arXiv cs.CL · 2026-05-25 缓存

本文介绍了一个红队测试框架,用于衡量开源LLM能够表达的政治观点的“奥弗顿窗口”,并评估简单的越狱手段如何扩大该范围,发现30多个模型存在系统性的左倾偏见和漏洞。

0 人收藏 0 人点赞
#open-source-llms

CompactQE: 通过小型开放权重LLMs实现可解释的翻译质量评估

arXiv cs.CL · 2026-05-18 缓存

本文证明,小型开放权重LLMs(参数小于30B)能够实现具有竞争力的可解释翻译质量评估,包括MQM错误标注和修正,与更大的专有模型相媲美,同时保护数据隐私。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈