标签
一份每日AI通讯,涵盖多个故事,包括央行行长对AI债务泡沫的警告、中国开发者通过灰色市场API购买便宜的Claude访问权限、Sakana的Fugu报告、中美AI模型成本对比、Deepseek新的推理优化方法,以及Meta开源的脑机文本系统。
有传言称,智谱AI的新模型(可能是GLM 5.2)在网络安全能力上与Fable5相当,正如《华尔街日报》一篇文章所提及的。
智谱AI发布了一款新模型,据称在识别安全漏洞方面与Claude Mythos性能相当。
作者高度评价腾讯ima AI应用,认为其在提高工作效率方面远超美国同类产品。
在解雇Junyang Lin之后,Qwen锁定了其大型模型,不再发布开源模型,而其他中国AI实验室继续开源最新模型。传闻小模型团队已解散,Qwen 3.6/3.7可能是最后一代开源模型。
Z.ai(原智谱AI)发布了GLM-5.2,一个7440亿参数的混合专家AI模型,专为智能体任务(如自主软件工程)设计,拥有100万token的上下文窗口、低审查机制,并在国产华为昇腾芯片上训练。
本文分析智谱GLM-5.2性能飞跃的原因,认为其40B激活参数在扣除固定开销后提供更大有效容量,使RL后训练更有效;同时回顾中国AI模型发展史,指出大模型路线最终获胜。
文章回顾了中国早期大模型的发展历史,指出智源研究院支持了最早的清源CPM(2020年)和悟道1.0(2021年),并纠正了关于华为盘古是国内首个大模型的说法。
本文详细解释了机器学习中知识蒸馏的技术原理,指出仅靠收集ChatGPT/Claude的输出对话无法实现有效蒸馏,因为缺少概率分布信息,并讨论了SFT和预训练中使用生成数据的局限性。
智谱发布了GLM 5.2模型,专注于Coding能力,开源且支持1M上下文。实测显示其在大型工程和代码任务上接近Claude Opus 4.8水平,但缺乏多模态能力,受限于算力导致速度较慢。文章也提及Anthropic因美国商务部要求关停Fable 5和Mythos 5的事件,突显了AI开源与封闭的对比。
有用户观察到,Kimi K2.6模型的思维链变得更短更简洁,提升了Kimi Code中的编码性能,并希望即将发布的GLM 5.2和Fable 5能够继续通过开源进行竞争。
报道一个科研AI辅助工具,通过三个Skill(scientific-toolkit、research-writing、office-academic)打通科研全流程,从数据计算到论文写作再到PPT制作,支持在Claude Code和Codex中一键安装,中文优先。
像DeepSeek和Qwen这样的中国AI模型,以比西方同类产品低5至20倍的成本提供有竞争力的性能,正在重塑AI经济学并推动多模型部署策略。
腾讯Workbuddy正在逐渐成为一个现象级产品,可能具有重要影响。
文章指出,腾讯的Hy3 Preview开放模型在评估中表现惊人,缩小了与顶级闭源模型的差距,但与西方AI实验室相比仍讨论不足。
OpenBMB 发布 MiniCPM5-1B,这是一款领先的 1B 参数开源权重大语言模型,在同尺寸类别中取得了 Artificial Analysis Intelligence Index 最高分(17.9),超越了 Qwen3.5 2B 等更大模型,而使用的参数更少。