@j_golebiowski：17 亿参数模型在 Schema Guided Dialogue 上击败 7440 亿参数的 GLM-5——即便训练数据被污染。这相当于……

X AI KOLs Timeline 2026/04/21 17:52 模型

small-model dialogue-task data-corruption model-compression

摘要

17 亿参数模型在训练数据受损的情况下，仍在 Schema Guided Dialogue 任务上超越 7440 亿参数的 GLM-5，体积效率高达 437 倍。

17 亿参数模型在 Schema Guided Dialogue 上击败 7440 亿参数的 GLM-5——即便训练数据被污染。体积差距达 437 倍。

查看缓存全文

缓存时间: 2026/04/22 05:19

一个 17 亿参数的模型在 Schema Guided Dialogue 任务上击败了 7440 亿参数的 GLM-5——即使训练数据被污染。两者规模相差 437 倍。

相似文章

Hugging Face Models Trending

GLM-5.1 是一款新一代旗舰AI模型，针对代理工程进行了优化，编码能力显著增强，在SWE-Bench Pro上达到了最先进性能，并通过扩展迭代和工具使用展示了卓越的长周期任务处理能力。

X AI KOLs Timeline

作者演示了，通过使用开源模型和Codex编排进行高性价比微调，小型垂直语言模型（6B-15B）能够在细分基准上超越顶级大语言模型，仅用价值300美元的数据集就取得了成果。

X AI KOLs Timeline

一条推文称，在自定义数据上微调的小型视觉语言模型准确率可媲美GPT-5，成本却低50倍，并举例Liquid AI的1.6B模型可用llama.cpp本地全速运行。

arXiv cs.CL

独立研究表明，在 3B Llama 的工具使用中，227M 参数的超网络相比精心设计的少样本提示毫无增益，仅用 1/10 延迟即可达到 GPT-5 性能的 79.7%。

Hugging Face Models Trending

Google DeepMind 发布 Gemma 4，一系列开放权重的多模态模型，参数量从2.3B到31B，支持文本、图像、视频和音频输入。模型具有256K上下文窗口，MoE和密集架构，增强的推理能力，并针对从移动设备到服务器的部署进行优化。