rtx5080

#rtx5080

小型LLM架构：Raven Agent（本地RTX5080）+ Trinity Cortex（7B/13B/MoE在线）

Reddit r/ArtificialInteligence ↗ · 6小时前

描述了一个双层小型LLM架构：一个本地常驻代理（Raven）运行在RTX5080上，以及一个在线推理栈（Trinity Cortex），包含三个小模型和一个知识图谱，论证了小模型在基于图的推理中优于大型前沿模型。

0 人收藏 0 人点赞