small-models

#small-models

小型LLM架构：Raven Agent（本地RTX5080）+ Trinity Cortex（7B/13B/MoE在线）

Reddit r/ArtificialInteligence ↗ · 7小时前

描述了一个双层小型LLM架构：一个本地常驻代理（Raven）运行在RTX5080上，以及一个在线推理栈（Trinity Cortex），包含三个小模型和一个知识图谱，论证了小模型在基于图的推理中优于大型前沿模型。

0 人收藏 0 人点赞

#small-models

更新：小模型程序性技能迁移测试的首批人工结果

Reddit r/LocalLLaMA ↗ · 17小时前

本文报告了在小AI模型上测试程序性技能迁移实验的首批人工结果，提供了关于技能如何在模型间迁移的见解。

0 人收藏 0 人点赞

#small-models

我为小模型构建了一个智能体框架，让Qwen 3.5 4b管理服务器。

Reddit r/LocalLLaMA ↗ · 21小时前

为小模型构建了一个智能体框架，让Qwen 3.5 4b能够管理服务器。

0 人收藏 0 人点赞

#small-models

一种无需微调测试小模型技能迁移的盲视范式

Reddit r/LocalLLaMA ↗ · 昨天

提出一种使用Three.js的盲视觉范式，用于测试从大模型提取的过程性脚手架能否在无需微调的情况下提升小模型输出，并由盲评模型验证。

0 人收藏 0 人点赞

#small-models

连谷歌也仍然相信小型模型在编程方面的潜力。

Reddit r/LocalLLaMA ↗ · 2天前

一篇新闻报道，讨论了尽管行业趋势倾向于大型模型，但谷歌依然坚持使用小型AI模型进行代码生成。

0 人收藏 0 人点赞

#small-models

专为小型模型设计的新基准：ObviousBench.com

Reddit r/LocalLLaMA ↗ · 2天前

ObviousBench 是一个专门为评估小型 AI 模型而设计的新基准。

0 人收藏 0 人点赞

#small-models

@ms_aifrontiers：它是什么：一系列能够执行真实浏览器工作的智能体，例如填写表单和预订。从像素到动作…

X AI KOLs Following ↗ · 5天前

微软AI Frontiers发布了一系列浏览器智能体，能够通过“观察-思考-行动”循环，从像素直接到动作，实现填写表单和预订等功能。提供4B、9B和27B三种参数规模，可在普通硬件上部署。

0 人收藏 0 人点赞

#small-models

小型本地模型用于自动化，真的可行吗？

Reddit r/LocalLLaMA ↗ · 2026-06-16

一位 Reddit 用户探讨了小规模本地语言模型（1B-4B 参数）在自动化和脚本编写方面的潜力，并询问了专注于这一应用场景的资源。

0 人收藏 0 人点赞

#small-models

最近发展区策略优化：教师存在于提示中，而非梯度

Hugging Face Daily Papers ↗ · 2026-06-16 缓存

最近发展区策略优化（ZPPO）通过使用重新构建的提示来改进知识蒸馏，帮助学生从正确和错误的回答中学习，尤其在小模型规模下提升了性能。

0 人收藏 0 人点赞

#small-models

CacheRL：基于缓存回滚和混合奖励的多轮工具调用智能体

arXiv cs.CL ↗ · 2026-06-15 缓存

CacheRL训练用于多步工具调用任务的小型智能体基础模型，通过缓存回滚和混合奖励塑造，以100倍更少的计算量实现了92%的过程准确率（接近GPT-5的94%），并在知识迁移、缓存感知奖励以及迭代SFT/GRPO训练方面进行了创新。

0 人收藏 0 人点赞

#small-models

发布 Apodex-1.0 Smol 模型（0.8B、2B、4B 开源权重），专为智能体验证优化 + AgentHarness 评估

Reddit r/LocalLLaMA ↗ · 2026-06-10

Apodex 发布了开源权重的小型模型（0.8B、2B、4B），专为智能体验证任务优化，同时推出了用于本地智能体工作流的 AgentHarness 评估框架。

0 人收藏 0 人点赞

#small-models

科技公司能否学会青睐更便宜的AI模型？

TechCrunch AI ↗ · 2026-06-09 缓存

TechCrunch报道称，随着成本不断攀升，企业开始考虑转向更便宜、更小的AI模型，而非始终使用最强大的模型，这可能引发行业转变。布赖恩·阿姆斯特朗等人的预测表明，12-18个月内，80%的工作负载可能运行在价格便宜99%的模型上，这将严重冲击OpenAI和Anthropic等主要AI实验室。

0 人收藏 0 人点赞

#small-models

测试了小模型在对话中能记住一个事实多长时间。记忆失败模式对智能体来说是一个真正的问题，而且这并非我所预料的。

Reddit r/AI_Agents ↗ · 2026-06-08

一位开发者测试了小型边缘模型（LFM2.5、Gemma 变体）在多个对话轮次中保持一个事实的能力，发现模型常常自信地否认知道仍在上下文中的信息，这给智能体架构带来了信任问题，并暗示了记忆与格式规范之间的权衡。

0 人收藏 0 人点赞

#small-models

@LottoLabs: 对优秀小模型的需求非常大，看看下载量最高的Qwen模型吧，全部<9B

X AI KOLs Following ↗ · 2026-06-08 缓存

观察到对小AI模型的高需求，体现在Qwen系列9B参数以下模型的下载量上。

0 人收藏 0 人点赞

#small-models

五个实验室，五种思维：基于小模型构建多模型金融剧（6分钟阅读）

TLDR AI ↗ · 2026-06-08 缓存

关于构建多模型金融剧游戏的实地报告，其中每个代理运行在不同实验室的小模型上，展示了模型异构性的工程挑战和优势。

0 人收藏 0 人点赞

#small-models

我们是否低估了小型边缘AI模型？[D]

Reddit r/MachineLearning ↗ · 2026-06-05

一位开发者认为，边缘AI社区忽视了那些可以在智能手机等设备上本地运行的小型专门模型，并以自建的离线摩尔斯电码识别功能为例。该项目使用了小于5MB的AI模型，基于TensorFlow/Keras和LiteRT，从数据生成到移动端集成的整个流程均为自建。

0 人收藏 0 人点赞

#small-models

Gemma 2B多模态模型无需编码器即可媲美更大模型

Reddit r/singularity ↗ · 2026-06-04

谷歌的Gemma 4 12B引入了无需编码器的多模态架构，可与更大模型竞争，但基准测试对比显示它在大多数任务上落后于Qwen 2.5 9B。文章还涵盖了相关进展，包括开放权重模型的安全风险、Uber对Claude Code的支出上限以及NeurIPS对未校准AI检测器的误用。

0 人收藏 0 人点赞

#small-models

@hooeem: https://x.com/hooeem/status/2062266452921491934

X AI KOLs Timeline ↗ · 2026-06-03 缓存

一份指南，解释如何通过将固定流程编译成更小的微调模型，而不是反复提示前沿模型，从而使代理工作流成本降低高达462倍。

1 人收藏 1 人点赞

#small-models

这两位创始人离开高盛和Meta，为被忽视的市场打造语音AI

TechCrunch AI ↗ · 2026-06-03 缓存

由前高盛和Meta员工创立的AethexAI筹集了300万美元，为非洲和中东市场打造语音AI，使用小模型降低延迟，并推出带有API和SDK的平台。

0 人收藏 0 人点赞

#small-models

@stevibe: Qwen3.6 35B A3B 自己无法填写纸质表格，但配上 NVIDIA 的 LocateAnything-3B——HuggingFace 上排名第一的热门模型……

X AI KOLs Timeline ↗ · 2026-06-02 缓存

演示显示，Qwen3.6 35B A3B 结合 NVIDIA 的 LocateAnything-3B 作为视觉工具，能够通过检测字段位置准确填写纸质表格，证明小型模型可以通过协作完成单个大模型无法胜任的任务。

0 人收藏 0 人点赞

small-models

提交意见反馈