@0xshimei: https://x.com/0xshimei/status/2053088751862288846

X AI KOLs Timeline 2026/05/09 12:24 新闻

摘要

This article provides a comprehensive 2026 guide to free and low-cost large language models, comparing domestic (China) and international options.

https://t.co/5VBaULgEWl

查看原文

查看缓存全文

缓存时间: 2026/05/09 20:14

2026年大模型白嫖全攻略，国内国外免费低价一网打尽

小米送16亿、Mistral送10亿、DeepSeek一天几毛钱…

2026 年的大模型市场卷到飞起，免费和低价的选项多到用不过来。今天一次性盘清国内国外的免费+低价大模型，按需取用。

一、国内·免费

1. 小米 MiMo 100T

小米直接送 Token，这波羊毛不薅就亏了：

✓额度：免费申请 Token Plan 或赠金，最高 16 亿 Token

✓模型：MiMo V2.5（旗舰推理 + 多模态 + 语音合成）

✓时间：2026年4月28日 - 5月28日（还剩22天！）

✓注册地址：https://100t.xiaomimimo.com

✓平台：https://platform.xiaomimimo.com

流程：填表申请 → 等3天评估 → 邮件通知 → 24小时内到账

适合场景：编程辅助、多模态应用、语音合成

一句话评价：小米这波属于撒钱拉生态，不拿白不拿。

2. 阿里云百炼（新用户福利）

千问系列新用户有免费额度：

✓模型：qwen3.6-max-preview、qwen3.6-flash
✓免费额度：新用户送 各100万 Token（90天有效）
✓注册地址：https://bailian.console.aliyun.com

适合场景：中文对话、内容创作、编程辅助

一句话评价：阿里云的羊毛，不拿白不拿。

3. 硅基流动 SiliconFlow（部分模型免费）

国产聚合平台，部分模型完全免费：

✓模型：DeepSeek-V3、Qwen2.5 全系列、Llama 3.3 等
✓免费额度：部分模型完全免费调用
✓注册地址：https://cloud.siliconflow.cn

适合场景：国内用户、需要低延迟的场景

一句话评价：国内白嫖党的快乐老家。

4. 智谱 AI（GLM-4-Flash 免费）

清华系的大模型，Flash 版本免费：

✓模型：GLM-4-Flash（免费）、GLM-4-Air
✓免费额度：Flash 版本价格极低，新用户有赠送
✓注册地址：https://open.bigmodel.cn

适合场景：中文内容创作、中文对话

一句话评价：中文场景的平替之王。

二、国内·低价

5. DeepSeek V4（国产之光）

已经更新到 V4 了，价格依然感人：

✓模型：deepseek-v4-flash、deepseek-v4-pro
✓价格：输入 1 元/百万 tokens，输出 2 元/百万 tokens
✓特点：推理能力强，开源生态好，兼容 OpenAI/Anthropic 格式
✓注册地址：https://platform.deepseek.com
✓注意：旧的 deepseek-chat 和 deepseek-reasoner 将在 2026/07/24 下线

实际成本：一天写几万字代码，可能也就几毛钱

一句话评价：这个价格，买瓶水都不够用一天的。

6. MiniMax M2.7（全模态选手）

订阅制，覆盖文本+语音+视频+图像+音乐：

✓按量计费：输入 2.1 元/百万 tokens，输出 8.4 元/百万 tokens
✓Token Plan：订阅后按请求次数计费，5 小时滚动重置
✓特点：全模态能力，适合多模态应用
✓注册地址：https://platform.minimaxi.com

适合场景：多模态应用、语音合成、视频生成

一句话评价：一个订阅搞定所有模态。

7. 阿里千问（按量计费也很便宜）

阿里云百炼的按量计费版本：

✓模型：qwen3-max、qwen3.6-plus
✓价格：输入 2.5 元/百万 tokens，输出 10 元/百万 tokens
✓特点：中文能力强，支持思考模式
✓注册地址：https://bailian.console.aliyun.com

适合场景：中文对话、内容创作、编程辅助

一句话评价：阿里云的东西，便宜又大碗。

三、国外·免费

8. Mistral（10亿tokens/月！）

法国 AI 公司 Mistral 给的免费额度堪称业界最良心：

✓模型：Mistral 系列全模型（包括闭源模型）
✓免费额度：10 亿 tokens/月
✓限制：1 请求/秒，500K tokens/min
✓注册地址：https://console.mistral.ai
✓要求：需手机号验证

适合场景：重度使用、编程辅助、多语言任务

一句话评价：10 亿 tokens 免费，这羊毛不薅简直对不起自己。

9. Google AI Studio（Gemini 免费层）

Google 的免费层一直很稳：

✓模型：Gemini 3 Flash、Gemini 2.5 Flash、Gemma 系列
✓免费额度：250K tokens/min，20 请求/天
✓特点：多模态支持（文本+图片+音频），推理能力强
✓注册地址：https://aistudio.google.com/apikey

适合场景：日常对话、轻量编程、内容理解

一句话评价：谷歌的羊毛，不薅白不薅。

10. Groq（速度之王）

Groq 用的是自研 LPU 芯片，推理速度快到离谱：

✓模型：Llama 4 Scout、GPT-OSS-120B、Llama 3.3 70B
✓免费额度：Llama 4 Scout 1000请求/天，30K tokens/min
✓特点：响应速度是普通 GPU 的 5-10 倍
✓注册地址：https://console.groq.com

适合场景：需要快速响应的应用、实时对话

一句话评价：快是真快，free 是真 free。

11. Cerebras（GPT-OSS-120B 免费推理）

Cerebras 提供 OpenAI 开源模型的免费推理：

✓模型：GPT-OSS-120B（OpenAI 开源的 1200 亿参数模型）
✓免费额度：30 req/min，60K tokens/min
✓注册地址：https://cloud.cerebras.ai

适合场景：需要强推理能力的场景

一句话评价：OpenAI 开源模型 + Cerebras 加速 = 免费享受 GPT 级体验。

12. OpenRouter（30+免费模型）

一个 API Key 切几十个免费模型：

✓模型：30+ 免费模型（带 :free 后缀）
✓热门免费模型： **✓**Gemma 4 31B / Gemma 3 系列 **✓**Llama 3.3 70B / Llama 3.2 3B **✓OpenAI GPT-OSS-120B ✓MiniMax M2.5 ✓Qwen3 Coder ✓GLM-4.5 Air ✓**NVIDIA Nemotron 系列
✓免费额度：50 请求/天，1000 请求/天（充$10后）
✓注册地址：https://openrouter.ai

适合场景：想对比不同模型效果、需要灵活切换

一句话评价：模型界的拼多多，啥都有。

13. NVIDIA NIM

NVIDIA 提供的免费推理服务：

✓模型：各种开源模型
✓免费额度：40 req/min
✓注册地址：https://build.nvidia.com

四、国外·低价

14. OpenAI GPT-OSS 系列

OpenAI 开源的模型，通过各种平台免费或低价使用：

✓模型：GPT-OSS-120B、GPT-OSS-20B
✓免费渠道：Cerebras、Groq、OpenRouter 都有免费额度
✓低价渠道：各种云平台按量计费

适合场景：需要 GPT 级别能力但预算有限

一句话评价：OpenAI 终于开源了，白嫖党的胜利。

15. OpenRouter（多模型低价切换）

一个 API Key 切几十个模型，很多低价选项：

✓模型：各种开源和闭源模型
✓价格：按模型不同，很多低于 1 元/百万 tokens
✓特点：统一接口，切换模型超方便
✓注册地址：https://openrouter.ai

适合场景：想对比不同模型效果、需要灵活切换

一句话评价：模型界的拼多多，啥都有。

注意事项

1.限时活动要抓紧：小米 MiMo 100T 到 5月28日截止，赠完即止
2.免费≠无限：大部分免费层都有速率限制，商用要注意
3.API Key 安全：别把 Key 提交到 GitHub，血泪教训
4.数据隐私：部分平台免费层数据可能被用于训练
5.价格可能变动：大模型价格战打得激烈，今天便宜的明天可能更便宜

相似文章

中国开源模型是否即将成为唯一选择？

Reddit r/LocalLLaMA

探讨中国开源AI模型在不久的将来成为主导选项的可能性。

@0xCodez: https://x.com/0xCodez/status/2058911661973454915

X AI KOLs Timeline

一份详细指南，解释构建大型语言模型的五个阶段流程，强调数据质量和工程实践比架构更为重要。

@hooeem: https://x.com/hooeem/status/2068752941553476002

X AI KOLs Timeline

一份全面指南，介绍如何部署 GLM 5.2（一款自称在编程基准测试中超越 GPT-5.5 且成本更低的开源 AI 模型），涵盖云端和本地部署方案。

@FeitengLi: Hy-MT2 新的开源多语言翻译模型能力可以跟顶尖大模型匹配、支持 33 种语言之间的互译，而且具备灵活的 Instruct 能力，实现了 2-bit 量化不足 500MB 的空间占用可以很好的跑在端侧 https://modelsc…

X AI KOLs Timeline

Hy-MT2 is a new open-source multilingual translation model from Tencent Hy that supports 33 languages, offers flexible instruction capabilities, and achieves 2-bit quantization under 500MB for on-device deployment.

@bytebytego: 如何在本地运行LLMs

X AI KOLs Timeline

一份指南，说明如何在您自己的硬件上本地运行大型语言模型。

2026年大模型白嫖全攻略，国内国外免费低价一网打尽

一、国内·免费

二、国内·低价

三、国外·免费

四、国外·低价

注意事项

相似文章

中国开源模型是否即将成为唯一选择？

@0xCodez: https://x.com/0xCodez/status/2058911661973454915

@hooeem: https://x.com/hooeem/status/2068752941553476002

@FeitengLi: Hy-MT2 新的开源多语言翻译模型 能力可以跟顶尖大模型匹配、支持 33 种语言之间的互译，而且具备灵活的 Instruct 能力，实现了 2-bit 量化不足 500MB 的空间占用 可以很好的跑在端侧 https://modelsc…

@bytebytego: 如何在本地运行LLMs

提交意见反馈

@FeitengLi: Hy-MT2 新的开源多语言翻译模型能力可以跟顶尖大模型匹配、支持 33 种语言之间的互译，而且具备灵活的 Instruct 能力，实现了 2-bit 量化不足 500MB 的空间占用可以很好的跑在端侧 https://modelsc…