model-routing

标签

Cards List
#model-routing

AI代理安全是模型说‘不’的小小祈祷。你们是如何路由模型的?

Reddit r/AI_Agents · 7小时前

作者在Gmail上进行了实验,通过OAuth连接AI代理,发送了经过混淆的提示注入邮件。前沿模型有时能捕捉到攻击,而廉价模型则默默执行,揭示了代理安全很大程度上取决于模型成本和令牌预算,而非架构安全措施。

0 人收藏 0 人点赞
#model-routing

@wquguru: new-api从2023年4月至今,已经有3年有余,支撑了大大小小成百上千个中转站,市面上超过90%都是用这个系统 ,而new-api的核心开发者们 @Ion_Mio_ @Seefs_ 则深藏功与名,这篇文章尝试挖掘一下new-api和另…

X AI KOLs Timeline · 昨天 缓存

本文介绍了开源AI模型路由工具New-API自2023年4月发布以来的发展情况,指出其已占据市面上超90%的中转站份额,并探讨了该工具的核心开发者贡献与底层路由算法。

0 人收藏 0 人点赞
#model-routing

Switchcraft:用于智能体工具调用的 AI 模型路由

arXiv cs.AI · 2天前 缓存

本文介绍了 Switchcraft,这是首个专为智能体工具调用优化的 AI 模型路由器,旨在降低推理成本。通过使用轻量级的 DistilBERT 分类器,它在保持高工具使用准确性的同时,实现了显著的成本节约。

0 人收藏 0 人点赞
#model-routing

我们不再手动优化 LLM 技术栈——现在它实现了自我优化

Reddit r/artificial · 2天前

本文描述了一家企业如何实现向自我优化 LLM 技术栈的转型。该系统利用生产环境中的调用追踪数据,自动路由请求并微调模型,从而显著降低了成本并提升了性能。

0 人收藏 0 人点赞
#model-routing

本地模型是否比预期更快变得“足够好”?

Reddit r/LocalLLaMA · 6天前

这篇文章讨论了本地AI模型在日常任务中日益增长的可行性,暗示了向混合架构的转变,这种架构优化成本和延迟,而不是仅仅依赖前沿的云模型。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈