parallel-inference

#parallel-inference

@QingQ77: 在 pi 里同时跑多个模型，把各自的回答揉成一条，花更少的钱拿更好的结果。 https://github.com/leblancfg/pi-fusion… pi-fusion 是 pi 的一个扩展，给你的编码代理加了一道"并行扇出"流程。…

X AI KOLs Timeline ↗ · 2026-06-23 缓存

pi-fusion 是 pi 的一个扩展，通过并行扇出多个模型并将结果融合，以更低成本获得更好性能，支持提示词重写和会话存档。

0 人收藏 0 人点赞

#parallel-inference

X AI KOLs Following ↗ · 2026-06-10 缓存

DiffusionGemma 是一个基于 Gemma 4 的 26B MoE 模型，通过扩散模型以256个token的块进行文本生成，每秒可处理超过1000个token，经量化后可在18GB显存内运行，已根据 Apache 2.0 许可发布。

0 人收藏 0 人点赞

#parallel-inference

Hugging Face Daily Papers ↗ · 2026-06-08 缓存

Visual Para-Thinker++提出了一种用于视觉推理的单策略多智能体框架，该框架使用角色条件化智能体（主智能体、工作智能体、汇总智能体）和专用训练方法，以减少幻觉并提高效率，在幻觉敏感基准测试上优于基线。

0 人收藏 0 人点赞