@0xshimei: https://x.com/0xshimei/status/2053088751862288846
摘要
This article provides a comprehensive 2026 guide to free and low-cost large language models, comparing domestic (China) and international options.
查看缓存全文
缓存时间: 2026/05/09 20:14
2026年大模型白嫖全攻略,国内国外免费低价一网打尽
小米送16亿、Mistral送10亿、DeepSeek一天几毛钱…
2026 年的大模型市场卷到飞起,免费和低价的选项多到用不过来。今天一次性盘清国内国外的免费+低价大模型,按需取用。
一、国内·免费
1. 小米 MiMo 100T
小米直接送 Token,这波羊毛不薅就亏了:
✓额度:免费申请 Token Plan 或赠金,最高 16 亿 Token
✓模型:MiMo V2.5(旗舰推理 + 多模态 + 语音合成)
✓时间:2026年4月28日 - 5月28日(还剩22天!)
✓注册地址:https://100t.xiaomimimo.com
✓平台:https://platform.xiaomimimo.com
流程:填表申请 → 等3天评估 → 邮件通知 → 24小时内到账
适合场景:编程辅助、多模态应用、语音合成
一句话评价:小米这波属于撒钱拉生态,不拿白不拿。
2. 阿里云百炼(新用户福利)
千问系列新用户有免费额度:
-
✓模型:qwen3.6-max-preview、qwen3.6-flash
-
✓免费额度:新用户送 各100万 Token(90天有效)
-
✓注册地址:https://bailian.console.aliyun.com
适合场景:中文对话、内容创作、编程辅助
一句话评价:阿里云的羊毛,不拿白不拿。
3. 硅基流动 SiliconFlow(部分模型免费)
国产聚合平台,部分模型完全免费:
-
✓模型:DeepSeek-V3、Qwen2.5 全系列、Llama 3.3 等
-
✓免费额度:部分模型完全免费调用
-
✓注册地址:https://cloud.siliconflow.cn
适合场景:国内用户、需要低延迟的场景
一句话评价:国内白嫖党的快乐老家。
4. 智谱 AI(GLM-4-Flash 免费)
清华系的大模型,Flash 版本免费:
-
✓模型:GLM-4-Flash(免费)、GLM-4-Air
-
✓免费额度:Flash 版本价格极低,新用户有赠送
-
✓注册地址:https://open.bigmodel.cn
适合场景:中文内容创作、中文对话
一句话评价:中文场景的平替之王。
二、国内·低价
5. DeepSeek V4(国产之光)
已经更新到 V4 了,价格依然感人:
-
✓模型:deepseek-v4-flash、deepseek-v4-pro
-
✓价格:输入 1 元/百万 tokens,输出 2 元/百万 tokens
-
✓特点:推理能力强,开源生态好,兼容 OpenAI/Anthropic 格式
-
✓注册地址:https://platform.deepseek.com
-
✓注意:旧的 deepseek-chat 和 deepseek-reasoner 将在 2026/07/24 下线
实际成本:一天写几万字代码,可能也就几毛钱
一句话评价:这个价格,买瓶水都不够用一天的。
6. MiniMax M2.7(全模态选手)
订阅制,覆盖文本+语音+视频+图像+音乐:
-
✓按量计费:输入 2.1 元/百万 tokens,输出 8.4 元/百万 tokens
-
✓Token Plan:订阅后按请求次数计费,5 小时滚动重置
-
✓特点:全模态能力,适合多模态应用
-
✓注册地址:https://platform.minimaxi.com
适合场景:多模态应用、语音合成、视频生成
一句话评价:一个订阅搞定所有模态。
7. 阿里千问(按量计费也很便宜)
阿里云百炼的按量计费版本:
-
✓模型:qwen3-max、qwen3.6-plus
-
✓价格:输入 2.5 元/百万 tokens,输出 10 元/百万 tokens
-
✓特点:中文能力强,支持思考模式
-
✓注册地址:https://bailian.console.aliyun.com
适合场景:中文对话、内容创作、编程辅助
一句话评价:阿里云的东西,便宜又大碗。
三、国外·免费
8. Mistral(10亿tokens/月!)
法国 AI 公司 Mistral 给的免费额度堪称业界最良心:
-
✓模型:Mistral 系列全模型(包括闭源模型)
-
✓免费额度:10 亿 tokens/月
-
✓限制:1 请求/秒,500K tokens/min
-
✓注册地址:https://console.mistral.ai
-
✓要求:需手机号验证
适合场景:重度使用、编程辅助、多语言任务
一句话评价:10 亿 tokens 免费,这羊毛不薅简直对不起自己。
9. Google AI Studio(Gemini 免费层)
Google 的免费层一直很稳:
-
✓模型:Gemini 3 Flash、Gemini 2.5 Flash、Gemma 系列
-
✓免费额度:250K tokens/min,20 请求/天
-
✓特点:多模态支持(文本+图片+音频),推理能力强
-
✓注册地址:https://aistudio.google.com/apikey
适合场景:日常对话、轻量编程、内容理解
一句话评价:谷歌的羊毛,不薅白不薅。
10. Groq(速度之王)
Groq 用的是自研 LPU 芯片,推理速度快到离谱:
-
✓模型:Llama 4 Scout、GPT-OSS-120B、Llama 3.3 70B
-
✓免费额度:Llama 4 Scout 1000请求/天,30K tokens/min
-
✓特点:响应速度是普通 GPU 的 5-10 倍
-
✓注册地址:https://console.groq.com
适合场景:需要快速响应的应用、实时对话
一句话评价:快是真快,free 是真 free。
11. Cerebras(GPT-OSS-120B 免费推理)
Cerebras 提供 OpenAI 开源模型的免费推理:
-
✓模型:GPT-OSS-120B(OpenAI 开源的 1200 亿参数模型)
-
✓免费额度:30 req/min,60K tokens/min
-
✓注册地址:https://cloud.cerebras.ai
适合场景:需要强推理能力的场景
一句话评价:OpenAI 开源模型 + Cerebras 加速 = 免费享受 GPT 级体验。
12. OpenRouter(30+免费模型)
一个 API Key 切几十个免费模型:
-
✓模型:30+ 免费模型(带 :free 后缀)
-
✓热门免费模型: **✓**Gemma 4 31B / Gemma 3 系列 **✓**Llama 3.3 70B / Llama 3.2 3B **✓OpenAI GPT-OSS-120B ✓MiniMax M2.5 ✓Qwen3 Coder ✓GLM-4.5 Air ✓**NVIDIA Nemotron 系列
-
✓免费额度:50 请求/天,1000 请求/天(充$10后)
-
✓注册地址:https://openrouter.ai
适合场景:想对比不同模型效果、需要灵活切换
一句话评价:模型界的拼多多,啥都有。
13. NVIDIA NIM
NVIDIA 提供的免费推理服务:
-
✓模型:各种开源模型
-
✓免费额度:40 req/min
-
✓注册地址:https://build.nvidia.com
四、国外·低价
14. OpenAI GPT-OSS 系列
OpenAI 开源的模型,通过各种平台免费或低价使用:
-
✓模型:GPT-OSS-120B、GPT-OSS-20B
-
✓免费渠道:Cerebras、Groq、OpenRouter 都有免费额度
-
✓低价渠道:各种云平台按量计费
适合场景:需要 GPT 级别能力但预算有限
一句话评价:OpenAI 终于开源了,白嫖党的胜利。
15. OpenRouter(多模型低价切换)
一个 API Key 切几十个模型,很多低价选项:
-
✓模型:各种开源和闭源模型
-
✓价格:按模型不同,很多低于 1 元/百万 tokens
-
✓特点:统一接口,切换模型超方便
-
✓注册地址:https://openrouter.ai
适合场景:想对比不同模型效果、需要灵活切换
一句话评价:模型界的拼多多,啥都有。
注意事项
-
1.限时活动要抓紧:小米 MiMo 100T 到 5月28日截止,赠完即止
-
2.免费≠无限:大部分免费层都有速率限制,商用要注意
-
3.API Key 安全:别把 Key 提交到 GitHub,血泪教训
-
4.数据隐私:部分平台免费层数据可能被用于训练
-
5.价格可能变动:大模型价格战打得激烈,今天便宜的明天可能更便宜
相似文章
@0xCodez: https://x.com/0xCodez/status/2058911661973454915
一份详细指南,解释构建大型语言模型的五个阶段流程,强调数据质量和工程实践比架构更为重要。
@hooeem: https://x.com/hooeem/status/2068752941553476002
一份全面指南,介绍如何部署 GLM 5.2(一款自称在编程基准测试中超越 GPT-5.5 且成本更低的开源 AI 模型),涵盖云端和本地部署方案。
@FeitengLi: Hy-MT2 新的开源多语言翻译模型 能力可以跟顶尖大模型匹配、支持 33 种语言之间的互译,而且具备灵活的 Instruct 能力,实现了 2-bit 量化不足 500MB 的空间占用 可以很好的跑在端侧 https://modelsc…
Hy-MT2 is a new open-source multilingual translation model from Tencent Hy that supports 33 languages, offers flexible instruction capabilities, and achieves 2-bit quantization under 500MB for on-device deployment.
@bytebytego: 如何在本地运行LLMs
一份指南,说明如何在您自己的硬件上本地运行大型语言模型。
@PandaTalk8: 1/ 最近读到一本很适合系统补 LLM 基础的书: 《Foundations of Large Language Models》 作者是 Tong Xiao 和 Jingbo Zhu,来自中国东北大学 NLP Lab 与 NiuTrans…
推荐一本系统学习大型语言模型基础的中文书籍《Foundations of Large Language Models》,由东北大学 NLP Lab 与 NiuTrans Research 的 Tong Xiao 和 Jingbo Zhu 撰写。