标签
GLM-5.2 通过 Hugging Face Inference Providers 在接下来的 6 小时内免费提供,鼓励与编码代理一起使用,以展示开源进展。
本文分析智谱GLM-5.2性能飞跃的原因,认为其40B激活参数在扣除固定开销后提供更大有效容量,使RL后训练更有效;同时回顾中国AI模型发展史,指出大模型路线最终获胜。
我们率先通过将稀疏注意力内核移植到 Ada GPU,在 RTX 4090 上运行完整的 GLM-5.2(753B FP8),从而让前沿开放权重模型可在消费级硬件上运行。
UnslothAI 宣布 GLM-5.2,Z.ai 的最强开源模型,拥有 744B 参数,现在可以通过动态 GGUF 量化在本地运行,将大小减少约 84% 至 239GB,同时保留约 82% 的准确率。它适用于 256GB Mac 以及 RAM/VRAM 配置,并支持长上下文、推理和代理任务。
一位用户对通过 API 调用的 GLM-5.2 进行了详细评测,称赞其长上下文连贯性、自适应推理能力以及与 GPT-5.5 相当的前沿文本性能,同时指出缺乏原生视觉能力且本地计算需求较高。
中国AI实验室Z.ai发布了GLM-5.2,这是一个拥有7530亿参数的开放权重大语言模型,支持100万token的上下文窗口,采用MIT许可证。该模型在Artificial Analysis Intelligence Index上获得最高分,并在Code Arena WebDev排行榜上排名第二。
一位用户分享他们使用SGLang在HGX-H200硬件上运行GLM-5.2-FP8模型的Docker部署配置,实现了262k上下文和70 tokens/s的推理速度。
Z.ai 发布了 GLM-5.2,这是一款具有开放权重的 AI 模型,在编码和智能体性能方面有所提升,通过在三个任务的物理模拟基准测试中击败 Kimi K2.7 Code 得到证明。
GLM 5.2 已发布,采用 MIT 许可协议在 HuggingFace 上开放权重,可通过 API 和 Ollama 获取,其基准测试结果具有竞争力,仅落后 Opus 4.8 一个点,领先 GPT-5.5 一个点。
GLM-5.2 是 zai-org 的一个开源 AI 模型,现已在 HuggingChat 上可用。
Sentdex报告称,Zai的GLM 5.2是首个能够在许多任务上取代GPT-5.5和Opus 4.8的开源模型,具有强大的编码和代理性能,以及1M上下文窗口。
GLM 5.2 作为一款753B参数的开源模型发布,拥有1M上下文长度,MIT许可证,在AIME 2026上达到99.2分,超越了GPT-5.5、Gemini 3.1 Pro和Claude Opus 4.8。
Z.AI 发布了 GLM-5.2,这是一款新的旗舰模型,拥有稳定的 1M token 上下文窗口,通过灵活的思考努力增强了编码能力,并通过 IndexShare 改进了架构。该模型在 MIT 开源许可证下发布。
Z.AI 发布 GLM-5.2,一款旗舰级开源模型,拥有可靠的 1M token 上下文窗口,改进的编码能力,以及新的 IndexShare 稀疏注意力架构,在 1M 上下文下 FLOPs 减少了 2.9 倍。
用户称赞 GLM 5.2 效果可靠且聪明,但指出缺乏算力导致运行不稳定。
智谱发布了GLM 5.2模型,专注于Coding能力,开源且支持1M上下文。实测显示其在大型工程和代码任务上接近Claude Opus 4.8水平,但缺乏多模态能力,受限于算力导致速度较慢。文章也提及Anthropic因美国商务部要求关停Fable 5和Mythos 5的事件,突显了AI开源与封闭的对比。
智谱AI发布GLM-5.2,这是其能力最强的开源模型,支持100万上下文窗口,定位为复杂智能体应用和编码模型的基础,即日起向GLM Coding Plan用户提供,API将于下周上线。