latency-energy

标签

Cards List
#latency-energy

INAR-VL: 面向边缘-云端视觉语言推理的输入感知路由

arXiv cs.LG · 2026-05-20

INAR-VL 提出了一种轻量级路由系统,用于边缘-云端视觉语言推理。该系统根据查询复杂度动态选择边缘或云端模型,在保持接近云端准确率的同时,显著降低延迟和能耗。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈