small-models

标签

Cards List
#small-models

@OpenBMB:温馨提醒:Build Small 黑客马拉松报名将于6月3日截止!总奖金池约4万美元,其中1万美元为@OpenBMB特别奖…

X AI KOLs Following · 2026-06-01 缓存

OpenBMB 正在举办“Build Small”黑客马拉松,总奖金超过4万美元,聚焦于使用小模型(参数量≤32B)在 Hugging Face Spaces 上通过 Gradio 构建应用。报名截止日期为2026年6月3日。

0 人收藏 0 人点赞
#small-models

@yibie: 训练小模型:2026 年最被低估的 AI 技能 2026 年 5 月 11 日,一个叫 CJ Zafir 的人发了一条推文。他想教普通人 fine-tune 开源模型。 2538 个赞,316 次转发,178,000 次观看。这条推文炸了…

X AI KOLs Timeline · 2026-06-01 缓存

2026年5月,CJ Zafir 一条教普通人微调开源模型的推文获得广泛关注,展示了训练小模型作为2026年最被低估AI技能的趋势。

0 人收藏 0 人点赞
#small-models

@mr_r0b0t:我毫不掩饰地认为,专业的小型模型是高效本地代理团队的一部分。下面这个模型肯定会加入我的团队……

X AI KOLs Timeline · 2026-05-30 缓存

一款新的小型AI模型——Qwopus 3.5-Coder 4B,被推荐作为本地代理团队中专业角色的候选,并具有微调和数据集生成的潜力。

0 人收藏 0 人点赞
#small-models

@ttunguz:我一直在用最先进的模型训练我电脑上的小模型如何像我一样工作。结果:一个人...

X AI KOLs Following · 2026-05-29 缓存

使用大型AI模型训练较小的本地模型,作者构建了一个管理邮件、日历、交易、博客和研究的个人助手。

0 人收藏 0 人点赞
#small-models

@abidlabs: 这是我们第三次举办 Gradio 全球黑客马拉松,也是我最期待的一次——完全专注于本地“小型”模型……

X AI KOLs Following · 2026-05-28 缓存

Gradio 的第三次全球黑客马拉松 'Build Small' 完全专注于 320 亿参数以下的本地 AI 模型,奖品来自 OpenAI、NVIDIA、OpenBMB 和 Cohere,总价值超过 4 万美元现金以及硬件和积分。

0 人收藏 0 人点赞
#small-models

@Gradio: 一场名为 "Build Small" 的黑客马拉松,最大32B参数,模型可运行于笔记本。不知怎的,这个宣传吸引了 OpenAI、NVIDIA……

X AI KOLs Timeline · 2026-05-28 缓存

一场名为 'Build Small' 的黑客马拉松,最大32B参数,设计为可在笔记本上运行,吸引了包括 OpenAI、NVIDIA、OpenBMB 和 Cohere 在内的赞助方,提供超过4万美元现金、2块RTX 5080以及10万美元codex积分。

0 人收藏 0 人点赞
#small-models

@FradSer: 目前为止做的最有意思的事情: 尝试一系列的方法,让类似 gpt-oss:20b 和 gemma4:e4b 的模型能够在某些条件下接近 Opus 4.7 的水平

X AI KOLs Timeline · 2026-05-23 缓存

尝试通过一系列方法使gpt-oss:20b和gemma4:e4b等模型在某些条件下接近Opus 4.7的性能水平。

0 人收藏 0 人点赞
#small-models

在CPU函数调用上对Needle 26M和Qwen3-0.6B进行基准测试,50个查询覆盖5个难度等级。体积小23倍的模型在准确率上胜出,速度也快4.4倍。

Reddit r/LocalLLaMA · 2026-05-23

一项在CPU函数调用上比较Needle 26M和Qwen3-0.6B的基准测试显示,较小的Needle模型在准确率和速度上胜出,但失败模式截然不同:Needle选择错误的工具,而Qwen3则经常无法发出工具调用。

0 人收藏 0 人点赞
#small-models

小模型诚实度因提示语气从35%降至0%:研究发现分享

Reddit r/LocalLLaMA · 2026-05-21

一篇新论文显示,小型开源AI模型在提示语气变化时可以从诚实转向不诚实行为,压力情境下诚实度降至零。研究还揭示,可解释性工具可能无法检测到最不诚实的状态。

0 人收藏 0 人点赞
#small-models

如果我真的很想从零开始训练一个AI会怎样?

Reddit r/artificial · 2026-05-19

对从零开始训练AI模型的挑战与魅力的个人反思,强调了数据、硬件和扩展方面的困难,同时指出令人惊讶的是,在普通硬件上也能训练出相当不错的小模型。

0 人收藏 0 人点赞
#small-models

在6GB GPU上进行本地会议总结的最低门槛:qwen3.5:0.8b耗时57秒,Granite 4 350M出现幻觉

Reddit r/LocalLLaMA · 2026-05-19

作者介绍了VoiceFlow,这是一款开源的本地听写和会议转录工具,并在6GB GPU上对小语言模型(qwen3.5:0.8b和Granite 4 350M)进行了会议总结基准测试,发现0.8B的Qwen可行,而低于500M的模型会出现幻觉。同时,作者向社区寻求在低显存环境下的长上下文总结解决方案。

0 人收藏 0 人点赞
#small-models

超小型LLM真的有用吗?

Reddit r/singularity · 2026-05-19

探讨了非常小的语言模型是否能妥善处理日常对话,以及哪些训练因素使它们表现更佳。

0 人收藏 0 人点赞
#small-models

我用4B参数模型构建的编码智能体在基准测试中达到87%,诀窍如下

Reddit r/LocalLLaMA · 2026-05-18

作者构建了SmallCode,一个针对小型本地模型优化的编码智能体,通过复合工具、改进循环和令牌预算等技术,在4B参数模型上实现了87%的基准测试成功率。

1 人收藏 1 人点赞
#small-models

结构化工作流与小规模本地模型的力量

Reddit r/LocalLLaMA · 2026-05-17

作者详细介绍了使用小型本地模型(Qwen3.5 9B)结合结构化工作流和map-reduce模式来管理上下文限制、构建自定义智能体循环的经验,并已用其取代Claude Code处理大部分任务。

0 人收藏 0 人点赞
#small-models

@rohanpaul_ai: 设备端小模型的可能性太多了。@adrgrondin 正在 iPhone 17 Pro 上运行 Google 的 Gemma 4 E2B。大约 4…

X AI KOLs Following · 2026-05-17 缓存

Google 的 Gemma 4 E2B 通过 MLX 优化在 iPhone 17 Pro 上运行演示,达到约 40 tokens/秒,支持 128K 上下文以及离线思考模式,适用于编程和数学。

0 人收藏 0 人点赞
#small-models

[成立] SupraLabs - 为你带来真正开源的人工智能模型!

Reddit r/LocalLLaMA · 2026-05-15

SupraLabs 宣布成立,专注于训练和发布面向边缘设备的开源小型语言模型(SLM),已在 Hugging Face 上发布 Supra-Mini-v4-2M 等模型。

0 人收藏 0 人点赞
#small-models

@EBorgnia:今天,我们推出了 Jacq。这是一个编码代理,与我们一直在@relace_ai 训练的小模型一起构建,用于……

X AI KOLs Following · 2026-05-13

Jacq 是一个基于云的编码代理,与 Slack、Linear、GitHub、电子邮件和其他工具集成,使用 Relace AI 训练的小模型从连接的设备中提取上下文,并维护持久线程以记录工作历史。

0 人收藏 0 人点赞
#small-models

强化递归语言模型(18分钟阅读)

TLDR AI · 2026-05-13 缓存

本文探讨了利用强化学习微调小型(4B)递归语言模型(RLM)从科学文档中选取证据,结果表明经过强化学习训练的4B模型在模型大小和成本仅为其一小部分的情况下,达到了与Claude Sonnet 4.6相当的性能。

0 人收藏 0 人点赞
#small-models

首次微调求把关——多任务推理选3B还是7B?

Reddit r/MachineLearning · 2026-04-23

一位自学开发者首次做多任务微调,想训练模型深入理解问题本质,在社区请教3B与7B模型该如何选择。

0 人收藏 0 人点赞
#small-models

Meta-Tool:小语言模型的高效少样本工具适配

arXiv cs.CL · 2026-04-23 缓存

独立研究表明,在 3B Llama 的工具使用中,227M 参数的超网络相比精心设计的少样本提示毫无增益,仅用 1/10 延迟即可达到 GPT-5 性能的 79.7%。

0 人收藏 0 人点赞
← Previous
Next →
← 返回首页

提交意见反馈