@LightOnIO:在 @huggingface 上获得5000万次下载!LightOn 的 SOTA 后期交互与密集检索器、OCR 模型及大语言模型已获验证…
摘要
LightOn 庆祝其最先进的检索、OCR 和语言模型在 Hugging Face 上获得5000万次下载,这些模型已获社区验证并投入生产使用。
在 @huggingface 上获得5000万次下载!
LightOn 的 SOTA 后期交互与密集检索器、OCR 模型及大语言模型已获社区验证,并每天在生产环境中进行测试。
🧪 LightOn 现已成为全球检索领域最活跃的实验室之一,不断推动帕累托前沿 https://t.co/cnfrTnsY7K
查看缓存全文
缓存时间: 2026/05/29 18:13
@huggingface 下载量突破 5000 万!
LightOn 的 SOTA 后期交互与稠密检索模型、OCR 模型以及大语言模型,获得了社区的广泛验证,并每日在生产环境中接受测试。
🧪 LightOn 现已成为全球最活跃的检索研究实验室之一,不断推动帕累托前沿。https://t.co/cnfrTnsY7K
相似文章
Hugging Face 数据集突破 100 万!
庆祝 Hugging Face 社区达成 100 万个数据集的里程碑,彰显社区通过开放数据协作推动 AI 发展的共同努力。
@Fenng: HuggingFace、GitHub 四榜登顶,仅 5 天 Star 破万,百度 Unlimited OCR 跻身增长最快开源项目之一。 前两天时间线里看到不少人在说百度发布的 Unlimited-OCR。 其实 OCR 是百度的传统优势…
百度发布的 Unlimited-OCR 开源项目在 HuggingFace 和 GitHub 四榜登顶,5 天内 Star 破万。该模型采用 MoE 架构(3B 总参数、570M 激活参数),在长文档连续识别能力上表现突出,灵感来自人类抄书方式,也为大模型长期记忆管理提供了新思路。
@antoine_chaffin:新一代开源SOTA单向量与多向量检索模型来了——DenseOn & LateOn上线
LightOn发布DenseOn与LateOn,新一代开源SOTA单向量与多向量检索模型,全面超越现有模型。
@huggingface: 我们刚刚在 Hugging Face Hub 上达到了 100 万个开放数据集。开放模型需要开放数据。今天我们达成了这一里程碑,共同……
Hugging Face 宣布其 Hub 上的开放数据集数量已达到 100 万个的里程碑,强调了开放数据对于开放模型的重要性。
@KrzakalaF: LightOn 使用一个 1.5 亿参数的后期交互模型,达到了 GPT-5 级别的深度研究检索性能,这简直……
LightOn 使用一个 1.5 亿参数的后期交互模型,达到了 GPT-5 级别的深度研究检索性能,这是一项了不起的成就。