标签
描述了一种'distill-on-idle'流水线,它使得一个4B参数的本地模型能够作为设备端记忆助手有效运行,展示了小型模型的实际应用。
Autofit2 是一个基于 setfit 和 SBERT 嵌入的自动化端到端流水线,用于少样本多语言文本分类,支持 50 多种语言,仅需少量标注数据即可实现高精度。
本文提出了一种用于搜索4专家异构Mixture-of-Experts架构的自动化流水线,探索了理论组合空间的4.8%,并识别出高产和低产专家家族。该工作发布了分析工件和一个修正后的生成器,作为开源NNGPT项目的一部分。
一位开发者讲述了他们的自动化管道如何因速率限制静默跳过失败的API调用,产生了看似成功但实际包含空数据的运行。他们讨论了重试与硬失败之间的权衡,并向社区询问代理错误处理的最佳实践。
loop-engineering 是一个开源框架,为 AI 编码代理(如 Claude Code、Codex、Cursor)提供自循环和智能编排能力,包含 7 个生产级循环模式、实用 CLI 工具和五大数据块设计,帮助开发者从手动提示转向系统化自动化。
AgentFinVQA是一个多代理管道,用于金融图表问答,它将查询分解为规划、OCR、图例确认、视觉检查和验证步骤,并将每一步记录在可追溯的模型评估包中。与零样本基线相比,它实现了显著的准确性提升,同时支持本地部署和可审计性。
Merve (@mervenoyann) 分享了使用多个小型 VLM 作为评判器的管线的第二天发现,在道路标志检测中仅用 1.3k 样本就达到了 map@50=0.8028。这条推文比较了模型拒绝率,讨论了数据集缩小、超具体提示以及泛化该库的计划。
关于构建自主工程流水线的指南,涵盖与Slack、GitHub等服务的集成,并强调Devin内置的快速设置能力。
Claude Fable 5在3小时内完成了一个通常需要4个月的fine-tuning项目,包括完整的7阶段pipeline、TUI界面、HTML仪表盘、39个专项技能、8700行代码和235个测试,达到98%完成度,one-shot完成。
Refiner是Macrodata Labs开发的开源引擎,用于将原始机器人和多模态数据转换为高质量训练数据集,支持本地和云端执行。
深入技术解析Nosdesk的Rust后端,涵盖架构决策如流式管道、Postgres同步以及贯穿12万行代码的类型安全设计模式。
Anthropic 发布了开源的漏洞发现与修复参考实现,基于 Claude 构建了一个包含七阶段管道的验证链,旨在减少误报并确保修复验证闭环。
Sim 是一个开源的视觉 AI 工作空间,允许您直接在数据库表中运行丰富化和工作流逻辑,将多步骤 CRM 流水线合并为单个表,无需外部服务或 webhooks。
一个开源的Python库,可创建AI驱动的数据科学团队,自动化从数据加载到建模的工作流程,并提供可视化管道工作室以确保可重复性。
Matthias Endler 回顾了在 lychee 中实现递归的五年的艰难历程,lychee 是一个被大型科技公司使用的 Rust 链接检查器,详细描述了架构上的挑战和多次失败的尝试。
ACO System 是一个开源的多智能体框架,通过六个专门的AI智能体自主管理从GitHub Issue到合并PR的软件开发流水线,并配备确定性的架构师关卡以防止不良PR。
OmniParse 是一个仓库,几乎能摄取任何文件并将其转换为干净、结构化的 Markdown,完全本地运行,无需外部 API,非常适合 RAG 管道和本地代理。
一份详细指南,解释构建大型语言模型的五个阶段流程,强调数据质量和工程实践比架构更为重要。