@0xshimei: https://x.com/0xshimei/status/2053088751862288846
摘要
This article provides a comprehensive 2026 guide to free and low-cost large language models, comparing domestic (China) and international options.
查看缓存全文
缓存时间: 2026/05/09 20:14
2026年大模型白嫖全攻略,国内国外免费低价一网打尽
小米送16亿、Mistral送10亿、DeepSeek一天几毛钱…
2026 年的大模型市场卷到飞起,免费和低价的选项多到用不过来。今天一次性盘清国内国外的免费+低价大模型,按需取用。
一、国内·免费
1. 小米 MiMo 100T
小米直接送 Token,这波羊毛不薅就亏了:
✓额度:免费申请 Token Plan 或赠金,最高 16 亿 Token
✓模型:MiMo V2.5(旗舰推理 + 多模态 + 语音合成)
✓时间:2026年4月28日 - 5月28日(还剩22天!)
✓注册地址:https://100t.xiaomimimo.com
✓平台:https://platform.xiaomimimo.com
流程:填表申请 → 等3天评估 → 邮件通知 → 24小时内到账
适合场景:编程辅助、多模态应用、语音合成
一句话评价:小米这波属于撒钱拉生态,不拿白不拿。
2. 阿里云百炼(新用户福利)
千问系列新用户有免费额度:
-
✓模型:qwen3.6-max-preview、qwen3.6-flash
-
✓免费额度:新用户送 各100万 Token(90天有效)
-
✓注册地址:https://bailian.console.aliyun.com
适合场景:中文对话、内容创作、编程辅助
一句话评价:阿里云的羊毛,不拿白不拿。
3. 硅基流动 SiliconFlow(部分模型免费)
国产聚合平台,部分模型完全免费:
-
✓模型:DeepSeek-V3、Qwen2.5 全系列、Llama 3.3 等
-
✓免费额度:部分模型完全免费调用
-
✓注册地址:https://cloud.siliconflow.cn
适合场景:国内用户、需要低延迟的场景
一句话评价:国内白嫖党的快乐老家。
4. 智谱 AI(GLM-4-Flash 免费)
清华系的大模型,Flash 版本免费:
-
✓模型:GLM-4-Flash(免费)、GLM-4-Air
-
✓免费额度:Flash 版本价格极低,新用户有赠送
-
✓注册地址:https://open.bigmodel.cn
适合场景:中文内容创作、中文对话
一句话评价:中文场景的平替之王。
二、国内·低价
5. DeepSeek V4(国产之光)
已经更新到 V4 了,价格依然感人:
-
✓模型:deepseek-v4-flash、deepseek-v4-pro
-
✓价格:输入 1 元/百万 tokens,输出 2 元/百万 tokens
-
✓特点:推理能力强,开源生态好,兼容 OpenAI/Anthropic 格式
-
✓注册地址:https://platform.deepseek.com
-
✓注意:旧的 deepseek-chat 和 deepseek-reasoner 将在 2026/07/24 下线
实际成本:一天写几万字代码,可能也就几毛钱
一句话评价:这个价格,买瓶水都不够用一天的。
6. MiniMax M2.7(全模态选手)
订阅制,覆盖文本+语音+视频+图像+音乐:
-
✓按量计费:输入 2.1 元/百万 tokens,输出 8.4 元/百万 tokens
-
✓Token Plan:订阅后按请求次数计费,5 小时滚动重置
-
✓特点:全模态能力,适合多模态应用
-
✓注册地址:https://platform.minimaxi.com
适合场景:多模态应用、语音合成、视频生成
一句话评价:一个订阅搞定所有模态。
7. 阿里千问(按量计费也很便宜)
阿里云百炼的按量计费版本:
-
✓模型:qwen3-max、qwen3.6-plus
-
✓价格:输入 2.5 元/百万 tokens,输出 10 元/百万 tokens
-
✓特点:中文能力强,支持思考模式
-
✓注册地址:https://bailian.console.aliyun.com
适合场景:中文对话、内容创作、编程辅助
一句话评价:阿里云的东西,便宜又大碗。
三、国外·免费
8. Mistral(10亿tokens/月!)
法国 AI 公司 Mistral 给的免费额度堪称业界最良心:
-
✓模型:Mistral 系列全模型(包括闭源模型)
-
✓免费额度:10 亿 tokens/月
-
✓限制:1 请求/秒,500K tokens/min
-
✓注册地址:https://console.mistral.ai
-
✓要求:需手机号验证
适合场景:重度使用、编程辅助、多语言任务
一句话评价:10 亿 tokens 免费,这羊毛不薅简直对不起自己。
9. Google AI Studio(Gemini 免费层)
Google 的免费层一直很稳:
-
✓模型:Gemini 3 Flash、Gemini 2.5 Flash、Gemma 系列
-
✓免费额度:250K tokens/min,20 请求/天
-
✓特点:多模态支持(文本+图片+音频),推理能力强
-
✓注册地址:https://aistudio.google.com/apikey
适合场景:日常对话、轻量编程、内容理解
一句话评价:谷歌的羊毛,不薅白不薅。
10. Groq(速度之王)
Groq 用的是自研 LPU 芯片,推理速度快到离谱:
-
✓模型:Llama 4 Scout、GPT-OSS-120B、Llama 3.3 70B
-
✓免费额度:Llama 4 Scout 1000请求/天,30K tokens/min
-
✓特点:响应速度是普通 GPU 的 5-10 倍
-
✓注册地址:https://console.groq.com
适合场景:需要快速响应的应用、实时对话
一句话评价:快是真快,free 是真 free。
11. Cerebras(GPT-OSS-120B 免费推理)
Cerebras 提供 OpenAI 开源模型的免费推理:
-
✓模型:GPT-OSS-120B(OpenAI 开源的 1200 亿参数模型)
-
✓免费额度:30 req/min,60K tokens/min
-
✓注册地址:https://cloud.cerebras.ai
适合场景:需要强推理能力的场景
一句话评价:OpenAI 开源模型 + Cerebras 加速 = 免费享受 GPT 级体验。
12. OpenRouter(30+免费模型)
一个 API Key 切几十个免费模型:
-
✓模型:30+ 免费模型(带 :free 后缀)
-
✓热门免费模型: **✓**Gemma 4 31B / Gemma 3 系列 **✓**Llama 3.3 70B / Llama 3.2 3B **✓OpenAI GPT-OSS-120B ✓MiniMax M2.5 ✓Qwen3 Coder ✓GLM-4.5 Air ✓**NVIDIA Nemotron 系列
-
✓免费额度:50 请求/天,1000 请求/天(充$10后)
-
✓注册地址:https://openrouter.ai
适合场景:想对比不同模型效果、需要灵活切换
一句话评价:模型界的拼多多,啥都有。
13. NVIDIA NIM
NVIDIA 提供的免费推理服务:
-
✓模型:各种开源模型
-
✓免费额度:40 req/min
-
✓注册地址:https://build.nvidia.com
四、国外·低价
14. OpenAI GPT-OSS 系列
OpenAI 开源的模型,通过各种平台免费或低价使用:
-
✓模型:GPT-OSS-120B、GPT-OSS-20B
-
✓免费渠道:Cerebras、Groq、OpenRouter 都有免费额度
-
✓低价渠道:各种云平台按量计费
适合场景:需要 GPT 级别能力但预算有限
一句话评价:OpenAI 终于开源了,白嫖党的胜利。
15. OpenRouter(多模型低价切换)
一个 API Key 切几十个模型,很多低价选项:
-
✓模型:各种开源和闭源模型
-
✓价格:按模型不同,很多低于 1 元/百万 tokens
-
✓特点:统一接口,切换模型超方便
-
✓注册地址:https://openrouter.ai
适合场景:想对比不同模型效果、需要灵活切换
一句话评价:模型界的拼多多,啥都有。
注意事项
-
1.限时活动要抓紧:小米 MiMo 100T 到 5月28日截止,赠完即止
-
2.免费≠无限:大部分免费层都有速率限制,商用要注意
-
3.API Key 安全:别把 Key 提交到 GitHub,血泪教训
-
4.数据隐私:部分平台免费层数据可能被用于训练
-
5.价格可能变动:大模型价格战打得激烈,今天便宜的明天可能更便宜
相似文章
@cjzafir: 垂直语言模型(VLMs)正在击败顶级大语言模型。这些参数量7B到15B的小型专精模型在各自的细分领域击败了SoTA模型……
作者演示了,通过使用开源模型和Codex编排进行高性价比微调,小型垂直语言模型(6B-15B)能够在细分基准上超越顶级大语言模型,仅用价值300美元的数据集就取得了成果。
2026 年“免费层级 AI 技术栈”现状
本文概述了预计 2026 年的“免费层级 AI 技术栈”,列出了各大平台(包括 Gemini、GPT 和 Llama 等主要模型)当前及预期的免费访问限额。
@yidabuilds: https://x.com/yidabuilds/status/2053409619641602286
作者对DeepSeek V4、Kimi K2.6、GLM-5.1和MiniMax M2.7四款国产AI模型进行了横向对比测试,分析了它们在成本、长上下文处理能力、编程稳定性及推理性能上的优劣,并给出了针对大文档分析、长程后台任务和批量内容生产的具体分流建议。
@oliviscusAI: 有人刚刚开发了一款工具,可以准确告诉你哪些大语言模型可以在你的硬件上运行。它会扫描你的内存、CPU 和 GPU……
一款新工具已发布,它通过扫描用户的硬件规格(内存、CPU、GPU)来确定哪些大语言模型可以本地运行,并根据性能指标对这些模型进行排名。
@dhruvtwt_:怎么没人聊这事?@nvidia 正免费提供约 80 款 AI 模型的托管 API
Nvidia 低调开放约 80 款免费托管 AI 模型 API,包括 MiniMax M2.7、GLM 5.1、Kimi 2.5、DeepSeek 3.2、GPT-OSS-120B 等,可直接接入 OpenClaude、Zed IDE 等主流开发工具。