标签
IR3DE 是一种基于岭回归的路由器,可为不同任务选择领域专家大语言模型,在实现具有竞争力的性能的同时,还支持动态添加或移除专家而无需重新训练。
GeoStack 引入了一种几何框架,用于在视觉语言模型中组合独立训练的领域专家,而不会出现灾难性遗忘,实现了常数时间推理,并将几何误差降低了10倍。