inference-routing

标签

Cards List
#inference-routing

@Hevalon: 本周二,我将发布一份指南,介绍如何构建一个完整的Agentic系统,配备支持沙盒、并行子智能体、带控制策略的工具调用、推理路由以及防范注入和权限提升攻击的框架。

X AI KOLs Timeline · 4天前 缓存

一份关于构建安全Agentic系统的指南,包含沙盒隔离、并行子智能体、带控制策略的工具调用、推理路由以及防范注入和权限提升攻击,由Evangelos Pappas发布。

0 人收藏 0 人点赞
#inference-routing

IR3DE: 一种面向大语言模型的线性路由器

Hugging Face Daily Papers · 2026-06-04 缓存

IR3DE 是一种基于岭回归的路由器,可为不同任务选择领域专家大语言模型,在实现具有竞争力的性能的同时,还支持动态添加或移除专家而无需重新训练。

0 人收藏 0 人点赞
#inference-routing

LoRe:面向迭代图求解器的自适应交互评估路由与每步交互预算

arXiv cs.LG · 2026-05-29 缓存

介绍LoRe,一种无需训练的封装器,为迭代图求解器强制实施每步交互预算,在MIS和TSP等组合优化问题上实现了显著的加速和内存减少。

0 人收藏 0 人点赞
#inference-routing

INAR-VL: 面向边缘-云端视觉语言推理的输入感知路由

arXiv cs.LG · 2026-05-20

INAR-VL 提出了一种轻量级路由系统,用于边缘-云端视觉语言推理。该系统根据查询复杂度动态选择边缘或云端模型,在保持接近云端准确率的同时,显著降低延迟和能耗。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈