small-language-model

标签

Cards List
#small-language-model

[新模型] SupraLabs 刚刚发布了 supra-title-FFT-preview,115K 样本,几乎是我们的首个聊天标题数据集的10倍

Reddit r/LocalLLaMA · 4天前

SupraLabs 发布了 supra-title-FFT-preview,一个完全微调的0.4B参数模型,用于聊天标题生成,在115K样本上训练——比之前的数据集大了近10倍。

0 人收藏 0 人点赞
#small-language-model

@xdotli: 我的朋友 @xeophon 认为编码问题已经解决了,这里有一个验证:一个3B模型接受了以算法效率为重点的训练……

X AI KOLs Timeline · 4天前 缓存

Nanbeige 4.1,一个3B模型,在编码任务中专注于算法效率,超越了Qwen3-30b-A3b和Qwen 3.5 4b,实现了600多次工具调用的长时任务。

0 人收藏 0 人点赞
#small-language-model

@cjzafir: 一个3B参数的小语言模型:VibeThinker(基于Qwen 2.5微调)性能媲美Claude Opus 4.5。性能与以下模型相当: > De…

X AI KOLs Timeline · 6天前 缓存

VibeThinker是一个3B参数的模型,基于Qwen 2.5微调,通过创新的后训练方法(包括多路径思维和在数学、编程、科学上的分阶段训练),实现了与Claude Opus 4.5以及更大的模型(如DeepSeek v3)相当的性能。

0 人收藏 0 人点赞
#small-language-model

微软测试Phi Silica在Nvidia GPU上用于Windows AI(6分钟阅读)

TLDR AI · 2026-06-17 缓存

微软正在测试Phi Silica在Nvidia GPU上的支持,允许开发者在配备RTX 30系列或更新GPU的Windows设备上本地运行这一小型语言模型,不过缺少仅限NPU的功能,比如提示压缩。

0 人收藏 0 人点赞
#small-language-model

为什么微博的迷你VibeThinker-3B再次引发AI界关于基准测试的争论(15分钟阅读)

TLDR AI · 2026-06-17 缓存

微博的VibeThinker-3B,一个3B参数模型,声称在数学和编程基准测试中匹配或超越DeepSeek V3.2和Gemini 3 Pro等更大模型的推理性能,引发了关于基准测试可靠性和扩展必要性的争论。

0 人收藏 0 人点赞
#small-language-model

将原先的VibeThinker-1.5B扩展到3B——现已达到前沿数学与编程性能

Reddit r/LocalLLaMA · 2026-06-16

VibeThinker-3B模型在数学和编程推理性能上达到了最先进水平,在AIME'26上得分为94.3,在未见过的LeetCode问题上正确率为96.1%,表明小模型在可验证领域可以达到前沿推理水平。

0 人收藏 0 人点赞
#small-language-model

Cleo: 尝试在2B模型中拟合完整的分析师行为 [P]

Reddit r/MachineLearning · 2026-06-15

Cleo 是 Qwen3.5-2B-Base 的微调版本,专为Text-to-SQL任务设计,使用统一的训练和推理框架,支持实时执行证据和安全检查。所有代码、模型和数据集均为开源。

0 人收藏 0 人点赞
#small-language-model

@GitTrend0x: 专攻纯本地桌面自动化神器,最重要省钱! https://github.com/microsoft/fara 这就是 Fara-7B,微软推出的高效 Computer Use Agent 小模型!一句话干翻传统大模型 CUA:仅 7B 参数…

X AI KOLs Timeline · 2026-06-15 缓存

微软推出 Fara-7B,一款仅 7B 参数的高效 Computer Use Agent,在网页任务上超越更大模型,支持纯本地部署,低成本实现桌面自动化。

0 人收藏 0 人点赞
#small-language-model

@nini_incrypto_: 微软最近推出的走实战路线的东东,直接让 7B 模型接管你的鼠标键盘! FARA,它抛弃了无意义的聊天,专攻纯本地桌面自动化。 它的核心优势就两个词,听话、省钱: 1. 纯桌面执行:自己打开网页、填表单,自动跑完所有重复的机械流程。 2. …

X AI KOLs Timeline · 2026-06-14 缓存

微软发布了Fara-7B,一个7B参数的小型语言模型,专攻纯本地桌面自动化,能直接接管鼠标键盘执行重复流程,成本低且无需联网。

0 人收藏 0 人点赞
#small-language-model

[新模型] Supra-Title-0.3B 刚刚发布!

Reddit r/LocalLLaMA · 2026-06-12

Supra Labs 发布了 Supra Title,这是一个参数为 350M 的专用模型,用于生成聊天对话标题。该模型基于 LFM2.5 构建,以 GGUF 格式运行在任何硬件上,且无需系统提示。

0 人收藏 0 人点赞
#small-language-model

WeiboAI/VibeThinker-3B

Hugging Face Models Trending · 2026-06-12 缓存

VibeThinker-3B 是一个拥有 3B 参数的模型,通过优化 Spectrum-to-Signal Principle (SSP) 后训练流程,在数学、编程和 STEM 基准测试上实现了前沿水平的推理性能,达到了与更大模型相当的性能。

0 人收藏 0 人点赞
#small-language-model

IAPO:面向小规模多模态智能体工具使用的输入归因感知策略优化

arXiv cs.LG · 2026-06-11 缓存

本文介绍了IAPO,一种通过将输入归因与更强大的教师模型对齐,来提升多模态小语言模型工具调用能力的强化学习算法。在Qwen2.5-VL-3B上的实验表明,在六个测试集上,视觉问答准确率平均提升了3%。

0 人收藏 0 人点赞
#small-language-model

@harshbhatt7585: https://x.com/harshbhatt7585/status/2063593933314113587

X AI KOLs Timeline · 2026-06-07 缓存

作者分享了从头训练一个160M参数大语言模型的经验,尝试了多种架构,如多Token预测和分层推理模型。他强调快速迭代、简化思路以及理解架构有效原因的重要性。

0 人收藏 0 人点赞
#small-language-model

Microsoft Aion 1.0 Instruct 和 Aion 1.0 Plan 模型!

Reddit r/LocalLLaMA · 2026-06-03

微软在 Build 2026 上宣布了两款新的设备端 AI 模型:Aion 1.0 Instruct(一款开放权重的小型语言模型)和 Aion 1.0 Plan(一款 140 亿参数的推理与工具调用模型,适用于本地智能体工作流)。

0 人收藏 0 人点赞
#small-language-model

我从零开始训练了一个75M参数的LLM,使用18B tokens,它击败了几乎两倍大小的模型

Reddit r/LocalLLaMA · 2026-06-02

从零开始训练了一个名为KeyLM的75M参数LLM,使用18B tokens,在指令跟随得分上与更大模型竞争,同时使用更少的参数和更少的数据。

0 人收藏 0 人点赞
#small-language-model

OpenBMB 发布 MiniCPM5-1B 大语言模型。目前同尺寸下最强大的大语言模型之一。(在 Artificial Analysis Intelligence Index 上得分为 17.9)

Reddit r/singularity · 2026-05-27 缓存

OpenBMB 发布 MiniCPM5-1B,这是一款领先的 1B 参数开源权重大语言模型,在同尺寸类别中取得了 Artificial Analysis Intelligence Index 最高分(17.9),超越了 Qwen3.5 2B 等更大模型,而使用的参数更少。

0 人收藏 0 人点赞
#small-language-model

@AdinaYakup: MiniCPM5-1B 是 1B 参数级别中的一款令人印象深刻的发布!@OpenBMB https://huggingface.co/collections/openbmb/minicpm5… 1B …

X AI KOLs Following · 2026-05-25 缓存

MiniCPM5-1B 是 OpenBMB 推出的全新 1B 参数 AI 模型,具有 Think/No-Think 模式的混合推理能力、128K 上下文窗口、Apache 2.0 许可证,并可在多种硬件上运行。

0 人收藏 0 人点赞
#small-language-model

@ModelScope2022: MiniCPM5-1B 现已完全开源,包含权重、训练数据和部署代码。1B参数,在Artificial Analysis上排名第一…

X AI KOLs Following · 2026-05-25 缓存

MiniCPM5-1B 已完全开源,包含权重、训练数据和部署代码;它在2B以下模型中取得最高评分,并可在边缘设备上运行。

0 人收藏 0 人点赞
#small-language-model

[新发布] Supra-50M 正式推出!

Reddit r/LocalLLaMA · 2026-05-22

SupraLabs 发布了 Supra-50M,一个紧凑的 5000 万参数因果语言模型,包含基础版和指令版,基于 fineweb-edu 的 200 亿个 token 训练,在多项关键基准测试中达到了可与 GPT-2 和 SmolLM 等更大模型竞争的水平。

0 人收藏 0 人点赞
#small-language-model

@Sapient_Int: 推出 HRM-Text。一个超精简的 1B 参数推理语言模型,旨在提供强大的通用性能…

X AI KOLs Timeline · 2026-05-18 缓存

Sapient Intelligence 推出 HRM-Text,这是一个 1B 参数的推理语言模型,仅使用 40B tokens 训练,预算为 1000 美元,在大幅减少数据和计算需求的同时实现了具有竞争力的性能。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈