@charles_irl: 来自你的友好本地疯子 (r/localllama) 的更多氛围检查 https://reddit.com/r/LocalLLaMA/s/vqBVXvIT…
摘要
Modal 宣布对 Step 3.7 Flash 提供 Day 0 支持,该模型是一个 198B 参数的 MoE 模型,拥有 256K 上下文窗口和原生图像/视频理解能力。
查看缓存全文
缓存时间: 2026/05/29 21:56
来自你友好的本地疯子 r/localllama 的更多氛围测评:
https://t.co/NkKBSlgfaL https://t.co/oa7DIvJM0Q
Modal (@modal): Modal 对 Step 3.7 Flash 提供 Day 0 支持。
- 198B 参数 MoE(11B 激活)
- 256K 上下文
- 3 个推理层级
- 原生图像和视频理解
与 @StepFun_ai 和 @sgl_project 合作非常愉快。
相似文章
@modal: Modal上Step 3.7 Flash的Day 0支持 - 198B参数的MoE,11B激活参数 - 256K上下文 - 3个推理层级 - N…
Modal宣布为Step 3.7 Flash AI模型提供Day 0支持,该模型拥有198B参数的MoE(11B激活参数)、256K上下文、三个推理层级,以及原生图像和视频理解能力。
stepfun-ai/Step-3.7-Flash
Step 3.7 Flash 是一个198B参数的稀疏MoE视觉语言模型,每个token有11B活跃参数,支持256k上下文和三种推理级别,专为高吞吐量的代理工作流设计。
@AdinaYakup: Step-3.7-Flash 来自@StepFun_ai的新VL模型 198B/11B活跃参数 - MoE 256K上下文 3推理等级 高达400 tokens/秒
StepFun 发布了 Step-3.7-Flash,这是一个新的视觉语言 MoE 大模型,拥有 198B 参数(11B 激活),256K 上下文,推理速度高达 400 tokens/秒。
stepfun-ai/Step-3.7-Flash-GGUF
StepFun 发布了其 198B 参数的稀疏 MoE 视觉语言模型 Step-3.7-Flash 的 GGUF 量化版本,支持本地部署,最高 256K 上下文长度和可选择的推理级别。
@abidlabs:对于一个8B模型来说,非常出色!在这里查看 @Gradio 应用:https://huggingface.co/spaces/LiquidAI/LFM2.5-8B-A1B…
Liquid AI 发布了 LFM2.5-8B-A1B,这是一个8B MoE模型,拥有1.5B活跃参数和128K上下文,为边缘设备优化。