免费的大模型API及资源配额清单
截至2026年4月,按免费总额度降序排列。各平台免费策略动态变化,请以官方最新公告为准。
NVIDIA NIM
重点模型/系列:支持Qwen3.5、GLM-5、MiniMax-M2.5、Kimi-K2.5等近百款模型。
免费额度:调用次数和Token均无上限,完全免费。
有效期/重置规则:无每日总额限制。
优点/特点:支持模型最多,几乎全模型免费;国内网络直连稳定;兼容OpenAI接口格式。
官网/控制台:build.nvidia.com
Cloudflare Workers AI
重点模型/系列:Llama、Mistral等。
免费额度:每日10,000个“神经元”(Neurons)。
有效期/重置规则:每天重置。
优点/特点:以神经元计费,不同模型消耗不同,约可进行100次小规模推理调用或生成约230张图片。
官网/控制台:cloudflare.com
国家超算互联网
重点模型/系列:支持多款主流开源模型,可部署科研智能体。
免费额度:最高3000万Tokens(新用户限时活动)。
有效期/重置规则:限时活动,具体以平台为准。
优点/特点:国家级算力平台,算力资源丰富。超出额度后续购价格极低,低至0.1元/百万Tokens。
官网/控制台:www.scnet.cn
腾讯混元
重点模型/系列:混元系列模型(文生文/文生图等)。
免费额度:新用户可领总计1亿Token资源包(文生文)及1万张生图额度。
有效期/重置规则:资源包有效期为1年。
优点/特点:多模态能力强,与腾讯小程序生态结合紧密,方便AI应用落地。
官网/控制台:cloud.tencent.com
阿里云百炼
重点模型/系列:覆盖Qwen系列、DeepSeek等70+款模型。
免费额度:新用户开通即送7000万免费Tokens(每模型100万)。
有效期/重置规则:有效期为90天。
优点/特点:企业级应用开发平台,支持模型微调与私有化部署;网络延迟低,国内用户友好。
官网/控制台:bailian.console.aliyun.com
智谱AI (BigModel)
重点模型/系列:GLM系列(含GLM-4-Flash永久免费)。
免费额度:新用户注册即送2000万Tokens。
有效期/重置规则:新人包有效期3个月;部分模型(如GLM-4-Flash)永久免费。
优点/特点:国产主流模型,代码生成能力强。免费版提供高达30的并发请求,个人开发者友好。
官网/控制台:bigmodel.cn
硅基流动 (SiliconFlow)
重点模型/系列:聚合DeepSeek、Qwen等,支持20+永久免费小模型。
免费额度:注册实名即送2000万Tokens(价值约16元)。
有效期/重置规则:赠送额度长期有效。
优点/特点:国产聚合平台,国内网络直连速度快,兼容性强。
官网/控制台:siliconflow.cn
Cerebras
重点模型/系列:Llama 3.1-8B、Qwen3-235B-A22B等主流模型。
免费额度:每模型/每天100万Tokens。
有效期/重置规则:每天重置。
优点/特点:采用晶圆级芯片技术,推理速度极快,官方宣称可达约2988 tokens/秒。
官网/控制台:cloud.cerebras.ai
深度求索 (DeepSeek)
重点模型/系列:DeepSeek-V3、DeepSeek-R1等。
免费额度:新注册用户赠送500万Tokens(价值约$8-10)。
有效期/重置规则:注册后30天内有效。
优点/特点:开源模型,代码生成与长上下文能力出色,性价比高。
官网/控制台:platform.deepseek.com
讯飞星火
重点模型/系列:Spark Lite(永久免费)、Spark Pro 3.0/3.5等。
免费额度:个人认证用户可领最高500万Tokens。
有效期/重置规则:Lite版永久免费;其他额度有效期以官方为准。
优点/特点:基于国产算力平台,在语音识别、多语种及多模态能力上表现突出。
官网/控制台:xinghuo.xfyun.cn
字节跳动 (火山引擎)
重点模型/系列:豆包(Doubao)系列模型。
免费额度:每日200万Tokens(部分信息)。
有效期/重置规则:每日重置。
优点/特点:豆包模型性能强劲,与字节跳动生态结合紧密,适合AI应用开发。
官网/控制台:console.volcengine.com
Google AI Studio (Gemini)
重点模型/系列:Gemini 2.5 Flash、Flash-Lite等。
免费额度:每日约1500次请求。
速率限制:每分钟15次请求(RPM)。
优点/特点:可直接调用Google最新旗舰模型,性能处于全球顶尖水平。
官网/控制台:aistudio.google.com
DMXAPI
重点模型/系列:聚合glm系列、doubao系列、MiniMax系列等22+款模型。
免费额度:全量模型永久免费,无额度限制。
有效期/重置规则:永久免费。
优点/特点:聚合平台,提供全场景、无隐藏收费的大模型API,适合个人学习与项目测试。
官网/控制台:dmxapi.com
Ollama Cloud
重点模型/系列:支持Gemma、Qwen、GLM等主流开源模型。
免费额度:推算为每5小时约50万Tokens,每周约100万Tokens。
有效期/重置规则:按5小时和7天周期重置。
优点/特点:无需GPU即可在云端体验本地部署的开源模型,API与本地Ollama兼容。
官网/控制台:ollama.com
百度智能云千帆
重点模型/系列:文心系列(ERNIE)、Llama、ChatGLM等第三方模型。
免费额度:部分模型提供100万Tokens免费额度。
有效期/重置规则:通常为3个月。
优点/特点:平台集成模型丰富,适合进行中文任务开发。
官网/控制台:console.bce.baidu.com
月之暗面 (Kimi)
重点模型/系列:Kimi K2.5模型。
免费额度:个人认证后赠送15元额度。
有效期/重置规则:额度有效期以官方为准。
优点/特点:拥有业界领先的1M超长上下文窗口,适合处理长文本。
官网/控制台:platform.moonshot.cn
Together AI
重点模型/系列:超过200种开源模型(Llama、DeepSeek、Qwen等)。
免费额度:新用户注册通常赠送$5 - $25额度。
有效期/重置规则:额度长期有效。
优点/特点:平台模型丰富,可一键切换,但需注意免费额度非无限调用。
官网/控制台:together.ai
Fireworks AI
重点模型/系列:多种优化后的开源模型。
免费额度:提供试用额度,免费层速率限制为600 RPM。
有效期/重置规则:以平台为准。
优点/特点:推理速度快,拥有高达600 RPM的速率限制,适合对并发有一定要求的测试。
官网/控制台:fireworks.ai
OpenRouter
重点模型/系列:聚合超过11款免费模型,如Gemini、Llama、Qwen等。
免费额度:每免费模型每天200次请求。
速率限制:每模型每分钟20次请求。
优点/特点:全球知名聚合平台,用一个API Key和统一格式即可调用多种模型,简化开发流程。
官网/控制台:openrouter.ai
Groq
重点模型/系列:Llama 3.3 70B、Qwen3、Mixtral等。
免费额度:取决于模型,8B小模型每日约有14,400次请求的免费额度。
速率限制:70B大模型限制为30次/分钟。
优点/特点:使用自研LPU芯片,推理速度极快,响应时间短。
官网/控制台:console.groq.com
魔搭社区 (ModelScope)
重点模型/系列:支持DeepSeek-R1、文生图模型等多种开源模型。
免费额度:每日2000次免费API调用,单模型上限约500次。
有效期/重置规则:每日重置。
优点/特点:阿里达摩院打造,国内网络直连,是体验和测试各种开源AI模型的理想平台。
官网/控制台:modelscope.cn
GitHub Models
重点模型/系列:支持GPT-4.1、GPT-5、Grok、DeepSeek等前沿模型。
免费额度:调用频次限制。
速率限制:15次/分钟,150次/天。
优点/特点:与GitHub生态深度集成,可在熟悉的开发者环境中免费实验最新AI模型,适合原型验证。
MiniMax
重点模型/系列:MiniMax M2.1、M2.7、音乐生成Music 2.6等多模态模型。
免费额度:300次请求/5小时。
有效期/重置规则:每5小时重置。
优点/特点:专注多模态能力,支持文本、语音、图像、音乐生成等,API免费层门槛较低。
官网/控制台:platform.minimaxi.com
GateRouter
重点模型/系列:聚合OpenAI、Claude、Gemini、DeepSeek等25+主流大模型。
免费额度:处于限时免费阶段,提供免费Token额度。
有效期/重置规则:限时活动,以平台为准。
优点/特点:Web3原生AI网关,一个Key调用多模型,提供智能路由功能,可节省约80%推理成本。
官网/控制台:gaterouter.ai
Mistral AI
重点模型/系列:Mistral系列模型。
免费额度:免费计划,速率限制。
速率限制:具体限制未公开,有报告称日常使用未触发过限制。
优点/特点:法国开源模型领导者,注重隐私,适合低频测试。
官网/控制台:console.mistral.ai
Hugging Face
重点模型/系列:平台上数千个开源模型。
免费额度:每月$0.10的计算额度(约10万次小模型调用)。
有效期/重置规则:每月重置。
优点/特点:全球最大开源模型社区,模型种类极其丰富,适合实验各种小众模型。
官网/控制台:huggingface.co
AI Ping
重点模型/系列:整合30家厂商的550个模型,如Kimi-K2、MiniMax-M2、GLM-4.6等。
免费额度:新用户注册即送免费算力额度。
有效期/重置规则:以平台为准。
优点/特点:提供统一API与智能路由,号称“大模型API的大众点评”,方便选型测试。
官网/控制台:aiping.cn
华为云
重点模型/系列:智谱GLM-5.1、GLM-5.0等开源模型。
免费额度:提供免费体验额度。
有效期/重置规则:以平台为准。
优点/特点:国产算力平台,提供一键部署服务,适合企业级模型调用和部署。
官网/控制台:www.huaweicloud.com
Sophnet
重点模型/系列:提供60余款主流模型,包括DeepSeek极速版。
免费额度:通过签到和任务积累Tokens。
有效期/重置规则:通过日常互动获取。
优点/特点:主打DeepSeek极速推理,TPS超过100,是国内推理速度最快的平台之一。
官网/控制台:soph.net
出门问问 (Mobvoi)
重点模型/系列:文本转语音(TTS)、声音克隆、数字人等。
免费额度:新用户可领取免费额度。
有效期/重置规则:以平台为准。
优点/特点:在多模态AI能力上表现突出,尤其在语音和视频生成方面,适合构建创意应用。
官网/控制台:mobvoi.com
Telnyx
重点模型/系列:专注于通信和实时对话式AI的API。
免费额度:免费增值模式,提供免费额度。
有效期/重置规则:以平台为准。
优点/特点:基于现有Telnyx API Key无缝集成,适合需要将AI能力与全球电话、短信服务结合的应用。
官网/控制台:telnyx.com
Inference.net
重点模型/系列:DeepSeek V3、Llama 3.1、Mistral Nemo等。
免费额度:提供免费调用。
有效期/重置规则:以平台为准。
优点/特点:专注于开源模型推理,提供OpenAI兼容接口,强调成本效益。
官网/控制台:inference.net
💡 补充使用贴士
- 国内用户首选:NVIDIA NIM、腾讯混元、阿里云百炼、智谱AI、硅基流动等国内平台网络连接稳定,无需特殊网络环境,是开发和测试的首选。
- 速率限制型 vs 总额包型:
- 速率限制型(如NVIDIA NIM、Google AI Studio):适合需要长期、稳定调用的日常开发和测试。
- 总额包型(如腾讯混元、智谱AI):赠送的Token包适合短期、集中式的大算力任务,如模型评估或项目原型开发。
- 聚合平台的优势:DMXAPI、AI Ping、GateRouter、OpenRouter等平台用一个API Key就能调用多个厂商的模型,且大部分提供免费额度,可以大大简化开发流程和测试成本。
- 信息时效性:各平台的免费政策、额度和速率限制都处于动态变化中,以上信息基于2026年4月前的资料,请以各平台的官方最新公告为准。