标签
描述了一个双层小型LLM架构:一个本地常驻代理(Raven)运行在RTX5080上,以及一个在线推理栈(Trinity Cortex),包含三个小模型和一个知识图谱,论证了小模型在基于图的推理中优于大型前沿模型。