@PrajwalTomar_: 大部分Flash模型止步于更便宜、更快。而这款模型被设计用来真正完成工作。我在一个...上运行了Step 3.7 Flash。
摘要
Step 3.7 Flash 是一款紧凑型模型,能够处理视觉、实时数据检索和代码生成,从一张截图开始,在几分钟内自主构建一个可用的仪表盘,每次会话成本约为50美分。
查看缓存全文
缓存时间: 2026/06/26 18:14
大多数 Flash 模型止步于更便宜和更快速。而这款模型的设计目标,是真正把活儿干完。
我在真实任务上测试了 Step 3.7 Flash:输入一个仪表盘截图,输出一个带实时加密货币价格的可运行应用。
它读取了截图,自主从网页抓取实时价格,编写了前端和后端代码,并成功运行。没有借助独立的视觉模块,也不需要我手动粘贴任何数据。
我的运行数据: → 约 3 到 4 分钟生成可运行仪表盘 → 整个会话费用约 50 美分 → 视觉、实时数据和代码全部来自同一个模型
这正是让我印象深刻的地方。一个小而廉价的模型完成了视觉识别、信息搜索和代码编写,并且真的交付了成果。
它就是 @StepFun_ai 推出的 Step 3.7 Flash。
坦诚地说:我偶尔需要微调几次才能让一切完美。但对于一个能完成真实多步骤构建任务的快速、廉价模型,我愿意接受这一点。
相似文章
Step 3.7 Flash
Step 3.7 Flash 是一款快速代理模型,旨在实时观察并采取行动。
Stepfun 3.7 Flash 表现非常出色
Stepfun 3.7 Flash 是一款紧凑型视觉模型,在美学方面接近 GLM 5.1,在 3D 世界理解方面达到其 80% 的水平,同时仅使用 25% 的参数,因此内存效率极高。
StepFun 3.7 Flash
StepFun 发布了 Step 3.7 Flash,这是一个高效的多模态模型,针对真实世界的智能体任务进行了优化,具有改进的编码基准(SWE-Bench Pro、Terminal-Bench)并兼容多种智能体框架。
StepFun称Step 3.7 Flash以九分之一成本达到Claude Opus 4.6编码性能的97%
StepFun的Step 3.7 Flash是一款198B稀疏MoE模型,活跃参数11B,在SWE-Bench Verified上以约九分之一的成本达到Claude Opus 4.6编码性能的97%。该模型采用Advisor Mode策略,将昂贵的前沿模型调用保留给关键决策点。
@AdinaYakup: Step-3.7-Flash 来自@StepFun_ai的新VL模型 198B/11B活跃参数 - MoE 256K上下文 3推理等级 高达400 tokens/秒
StepFun 发布了 Step-3.7-Flash,这是一个新的视觉语言 MoE 大模型,拥有 198B 参数(11B 激活),256K 上下文,推理速度高达 400 tokens/秒。