[新模型] Supra-Title-0.3B 刚刚发布!

Reddit r/LocalLLaMA 模型

摘要

Supra Labs 发布了 Supra Title,这是一个参数为 350M 的专用模型,用于生成聊天对话标题。该模型基于 LFM2.5 构建,以 GGUF 格式运行在任何硬件上,且无需系统提示。

# Supra Title 现已上线!🦅 我们刚刚发布了 **Supra Title(实验版)**,这是一个专为生成聊天对话标题而设计的 350M 参数模型,基于 LFM2.5-350M 构建。 [https://huggingface.co/SupraLabs/Supra-Title-350M-exp-GGUF](https://huggingface.co/SupraLabs/Supra-Title-350M-exp-GGUF) [https://huggingface.co/SupraLabs](https://huggingface.co/SupraLabs) 大多数平台使用大型通用模型来生成对话标题。Supra Title 只做这一件事,而且速度飞快,以 GGUF 格式运行在任何硬件上。 **无需系统提示。** 只需发送用户消息,即可获得一个标题。 **示例:** |用户消息|标题| |:-|:-| |bruh my wifi keeps disconnecting every 10 minutes 😭|WiFi Issues| |what's the easiest way to make fluffy pancakes?|Fluffy Pancakes| |can someone explain taxes to me like i'm five|Understanding Taxes| |I am so dumb brooo|Understanding The Person That Think It's Dumb| **快速开始:** ollama run hf.co/SupraLabs/Supra-Title-350M-exp-GGUF:Q4_K_M 提供从 Q2(177 MB)到 BF16(711 MB)的版本。推荐使用 Q4\_K\_M。 这是一个实验性发布。我们正在扩展 SFT 数据集并探索偏好优化,之后才会正式发布。欢迎反馈!
查看原文

相似文章

[新发布] Supra-50M 正式推出!

Reddit r/LocalLLaMA

SupraLabs 发布了 Supra-50M,一个紧凑的 5000 万参数因果语言模型,包含基础版和指令版,基于 fineweb-edu 的 200 亿个 token 训练,在多项关键基准测试中达到了可与 GPT-2 和 SmolLM 等更大模型竞争的水平。

[新模型] SupraLabs 推出了 Any2Any 模型系列!

Reddit r/LocalLLaMA

SupraLabs 发布了 Supra-A2A-Nano-Exp,这是一个小型任意到任意自回归模型,将文本和图像标记化统一到单个 Transformer 中,作为教育原型而非生产就绪系统。