small-models

#small-models

@OpenBMB：温馨提醒：Build Small 黑客马拉松报名将于6月3日截止！总奖金池约4万美元，其中1万美元为@OpenBMB特别奖…

X AI KOLs Following ↗ · 2026-06-01 缓存

OpenBMB 正在举办“Build Small”黑客马拉松，总奖金超过4万美元，聚焦于使用小模型（参数量≤32B）在 Hugging Face Spaces 上通过 Gradio 构建应用。报名截止日期为2026年6月3日。

0 人收藏 0 人点赞

#small-models

@yibie: 训练小模型：2026 年最被低估的 AI 技能 2026 年 5 月 11 日，一个叫 CJ Zafir 的人发了一条推文。他想教普通人 fine-tune 开源模型。 2538 个赞，316 次转发，178,000 次观看。这条推文炸了…

X AI KOLs Timeline ↗ · 2026-06-01 缓存

2026年5月，CJ Zafir 一条教普通人微调开源模型的推文获得广泛关注，展示了训练小模型作为2026年最被低估AI技能的趋势。

0 人收藏 0 人点赞

#small-models

@mr_r0b0t：我毫不掩饰地认为，专业的小型模型是高效本地代理团队的一部分。下面这个模型肯定会加入我的团队……

X AI KOLs Timeline ↗ · 2026-05-30 缓存

一款新的小型AI模型——Qwopus 3.5-Coder 4B，被推荐作为本地代理团队中专业角色的候选，并具有微调和数据集生成的潜力。

0 人收藏 0 人点赞

#small-models

@ttunguz：我一直在用最先进的模型训练我电脑上的小模型如何像我一样工作。结果：一个人...

X AI KOLs Following ↗ · 2026-05-29 缓存

使用大型AI模型训练较小的本地模型，作者构建了一个管理邮件、日历、交易、博客和研究的个人助手。

0 人收藏 0 人点赞

#small-models

@abidlabs: 这是我们第三次举办 Gradio 全球黑客马拉松，也是我最期待的一次——完全专注于本地“小型”模型……

X AI KOLs Following ↗ · 2026-05-28 缓存

Gradio 的第三次全球黑客马拉松 'Build Small' 完全专注于 320 亿参数以下的本地 AI 模型，奖品来自 OpenAI、NVIDIA、OpenBMB 和 Cohere，总价值超过 4 万美元现金以及硬件和积分。

0 人收藏 0 人点赞

#small-models

@Gradio: 一场名为 "Build Small" 的黑客马拉松，最大32B参数，模型可运行于笔记本。不知怎的，这个宣传吸引了 OpenAI、NVIDIA……

X AI KOLs Timeline ↗ · 2026-05-28 缓存

一场名为 'Build Small' 的黑客马拉松，最大32B参数，设计为可在笔记本上运行，吸引了包括 OpenAI、NVIDIA、OpenBMB 和 Cohere 在内的赞助方，提供超过4万美元现金、2块RTX 5080以及10万美元codex积分。

0 人收藏 0 人点赞

#small-models

@FradSer: 目前为止做的最有意思的事情：尝试一系列的方法，让类似 gpt-oss:20b 和 gemma4:e4b 的模型能够在某些条件下接近 Opus 4.7 的水平

X AI KOLs Timeline ↗ · 2026-05-23 缓存

尝试通过一系列方法使gpt-oss:20b和gemma4:e4b等模型在某些条件下接近Opus 4.7的性能水平。

0 人收藏 0 人点赞

#small-models

在CPU函数调用上对Needle 26M和Qwen3-0.6B进行基准测试，50个查询覆盖5个难度等级。体积小23倍的模型在准确率上胜出，速度也快4.4倍。

Reddit r/LocalLLaMA ↗ · 2026-05-23

一项在CPU函数调用上比较Needle 26M和Qwen3-0.6B的基准测试显示，较小的Needle模型在准确率和速度上胜出，但失败模式截然不同：Needle选择错误的工具，而Qwen3则经常无法发出工具调用。

0 人收藏 0 人点赞

#small-models

小模型诚实度因提示语气从35%降至0%：研究发现分享

Reddit r/LocalLLaMA ↗ · 2026-05-21

一篇新论文显示，小型开源AI模型在提示语气变化时可以从诚实转向不诚实行为，压力情境下诚实度降至零。研究还揭示，可解释性工具可能无法检测到最不诚实的状态。

0 人收藏 0 人点赞

#small-models

如果我真的很想从零开始训练一个AI会怎样？

Reddit r/artificial ↗ · 2026-05-19

对从零开始训练AI模型的挑战与魅力的个人反思，强调了数据、硬件和扩展方面的困难，同时指出令人惊讶的是，在普通硬件上也能训练出相当不错的小模型。

0 人收藏 0 人点赞

#small-models

在6GB GPU上进行本地会议总结的最低门槛：qwen3.5:0.8b耗时57秒，Granite 4 350M出现幻觉

Reddit r/LocalLLaMA ↗ · 2026-05-19

作者介绍了VoiceFlow，这是一款开源的本地听写和会议转录工具，并在6GB GPU上对小语言模型（qwen3.5:0.8b和Granite 4 350M）进行了会议总结基准测试，发现0.8B的Qwen可行，而低于500M的模型会出现幻觉。同时，作者向社区寻求在低显存环境下的长上下文总结解决方案。

0 人收藏 0 人点赞

#small-models