• 微信:WANCOME
  • 扫码加微信,提供专业咨询
  • 服务热线
  • 13215191218
    13027920428

  • 微信扫码访问本页
环企首页

免费的大模型API及资源配额清单

截至2026年4月,按免费总额度降序排列。各平台免费策略动态变化,请以官方最新公告为准。

NVIDIA NIM

重点模型/系列:支持Qwen3.5、GLM-5、MiniMax-M2.5、Kimi-K2.5等近百款模型。

免费额度:调用次数和Token均无上限,完全免费。

有效期/重置规则:无每日总额限制。

优点/特点:支持模型最多,几乎全模型免费;国内网络直连稳定;兼容OpenAI接口格式。

官网/控制台:build.nvidia.com

Cloudflare Workers AI

重点模型/系列:Llama、Mistral等。

免费额度:每日10,000个“神经元”(Neurons)。

有效期/重置规则:每天重置。

优点/特点:以神经元计费,不同模型消耗不同,约可进行100次小规模推理调用或生成约230张图片。

官网/控制台:cloudflare.com

国家超算互联网

重点模型/系列:支持多款主流开源模型,可部署科研智能体。

免费额度:最高3000万Tokens(新用户限时活动)。

有效期/重置规则:限时活动,具体以平台为准。

优点/特点:国家级算力平台,算力资源丰富。超出额度后续购价格极低,低至0.1元/百万Tokens。

官网/控制台:www.scnet.cn

腾讯混元

重点模型/系列:混元系列模型(文生文/文生图等)。

免费额度:新用户可领总计1亿Token资源包(文生文)及1万张生图额度。

有效期/重置规则:资源包有效期为1年。

优点/特点:多模态能力强,与腾讯小程序生态结合紧密,方便AI应用落地。

官网/控制台:cloud.tencent.com

阿里云百炼

重点模型/系列:覆盖Qwen系列、DeepSeek等70+款模型。

免费额度:新用户开通即送7000万免费Tokens(每模型100万)。

有效期/重置规则:有效期为90天。

优点/特点:企业级应用开发平台,支持模型微调与私有化部署;网络延迟低,国内用户友好。

官网/控制台:bailian.console.aliyun.com

智谱AI (BigModel)

重点模型/系列:GLM系列(含GLM-4-Flash永久免费)。

免费额度:新用户注册即送2000万Tokens。

有效期/重置规则:新人包有效期3个月;部分模型(如GLM-4-Flash)永久免费。

优点/特点:国产主流模型,代码生成能力强。免费版提供高达30的并发请求,个人开发者友好。

官网/控制台:bigmodel.cn

硅基流动 (SiliconFlow)

重点模型/系列:聚合DeepSeek、Qwen等,支持20+永久免费小模型。

免费额度:注册实名即送2000万Tokens(价值约16元)。

有效期/重置规则:赠送额度长期有效。

优点/特点:国产聚合平台,国内网络直连速度快,兼容性强。

官网/控制台:siliconflow.cn

Cerebras

重点模型/系列:Llama 3.1-8B、Qwen3-235B-A22B等主流模型。

免费额度:每模型/每天100万Tokens。

有效期/重置规则:每天重置。

优点/特点:采用晶圆级芯片技术,推理速度极快,官方宣称可达约2988 tokens/秒。

官网/控制台:cloud.cerebras.ai

深度求索 (DeepSeek)

重点模型/系列:DeepSeek-V3、DeepSeek-R1等。

免费额度:新注册用户赠送500万Tokens(价值约$8-10)。

有效期/重置规则:注册后30天内有效。

优点/特点:开源模型,代码生成与长上下文能力出色,性价比高。

官网/控制台:platform.deepseek.com

讯飞星火

重点模型/系列:Spark Lite(永久免费)、Spark Pro 3.0/3.5等。

免费额度:个人认证用户可领最高500万Tokens。

有效期/重置规则:Lite版永久免费;其他额度有效期以官方为准。

优点/特点:基于国产算力平台,在语音识别、多语种及多模态能力上表现突出。

官网/控制台:xinghuo.xfyun.cn

字节跳动 (火山引擎)

重点模型/系列:豆包(Doubao)系列模型。

免费额度:每日200万Tokens(部分信息)。

有效期/重置规则:每日重置。

优点/特点:豆包模型性能强劲,与字节跳动生态结合紧密,适合AI应用开发。

官网/控制台:console.volcengine.com

Google AI Studio (Gemini)

重点模型/系列:Gemini 2.5 Flash、Flash-Lite等。

免费额度:每日约1500次请求。

速率限制:每分钟15次请求(RPM)。

优点/特点:可直接调用Google最新旗舰模型,性能处于全球顶尖水平。

官网/控制台:aistudio.google.com

DMXAPI

重点模型/系列:聚合glm系列、doubao系列、MiniMax系列等22+款模型。

免费额度:全量模型永久免费,无额度限制。

有效期/重置规则:永久免费。

优点/特点:聚合平台,提供全场景、无隐藏收费的大模型API,适合个人学习与项目测试。

官网/控制台:dmxapi.com

Ollama Cloud

重点模型/系列:支持Gemma、Qwen、GLM等主流开源模型。

免费额度:推算为每5小时约50万Tokens,每周约100万Tokens。

有效期/重置规则:按5小时和7天周期重置。

优点/特点:无需GPU即可在云端体验本地部署的开源模型,API与本地Ollama兼容。

官网/控制台:ollama.com

百度智能云千帆

重点模型/系列:文心系列(ERNIE)、Llama、ChatGLM等第三方模型。

免费额度:部分模型提供100万Tokens免费额度。

有效期/重置规则:通常为3个月。

优点/特点:平台集成模型丰富,适合进行中文任务开发。

官网/控制台:console.bce.baidu.com

月之暗面 (Kimi)

重点模型/系列:Kimi K2.5模型。

免费额度:个人认证后赠送15元额度。

有效期/重置规则:额度有效期以官方为准。

优点/特点:拥有业界领先的1M超长上下文窗口,适合处理长文本。

官网/控制台:platform.moonshot.cn

Together AI

重点模型/系列:超过200种开源模型(Llama、DeepSeek、Qwen等)。

免费额度:新用户注册通常赠送$5 - $25额度。

有效期/重置规则:额度长期有效。

优点/特点:平台模型丰富,可一键切换,但需注意免费额度非无限调用。

官网/控制台:together.ai

Fireworks AI

重点模型/系列:多种优化后的开源模型。

免费额度:提供试用额度,免费层速率限制为600 RPM

有效期/重置规则:以平台为准。

优点/特点:推理速度快,拥有高达600 RPM的速率限制,适合对并发有一定要求的测试。

官网/控制台:fireworks.ai

OpenRouter

重点模型/系列:聚合超过11款免费模型,如Gemini、Llama、Qwen等。

免费额度:每免费模型每天200次请求。

速率限制:每模型每分钟20次请求。

优点/特点:全球知名聚合平台,用一个API Key和统一格式即可调用多种模型,简化开发流程。

官网/控制台:openrouter.ai

Groq

重点模型/系列:Llama 3.3 70B、Qwen3、Mixtral等。

免费额度:取决于模型,8B小模型每日约有14,400次请求的免费额度。

速率限制:70B大模型限制为30次/分钟。

优点/特点:使用自研LPU芯片,推理速度极快,响应时间短。

官网/控制台:console.groq.com

魔搭社区 (ModelScope)

重点模型/系列:支持DeepSeek-R1、文生图模型等多种开源模型。

免费额度:每日2000次免费API调用,单模型上限约500次。

有效期/重置规则:每日重置。

优点/特点:阿里达摩院打造,国内网络直连,是体验和测试各种开源AI模型的理想平台。

官网/控制台:modelscope.cn

GitHub Models

重点模型/系列:支持GPT-4.1、GPT-5、Grok、DeepSeek等前沿模型。

免费额度:调用频次限制。

速率限制:15次/分钟,150次/天。

优点/特点:与GitHub生态深度集成,可在熟悉的开发者环境中免费实验最新AI模型,适合原型验证。

官网/控制台:github.com/marketplace/models

MiniMax

重点模型/系列:MiniMax M2.1、M2.7、音乐生成Music 2.6等多模态模型。

免费额度:300次请求/5小时。

有效期/重置规则:每5小时重置。

优点/特点:专注多模态能力,支持文本、语音、图像、音乐生成等,API免费层门槛较低。

官网/控制台:platform.minimaxi.com

GateRouter

重点模型/系列:聚合OpenAI、Claude、Gemini、DeepSeek等25+主流大模型。

免费额度:处于限时免费阶段,提供免费Token额度。

有效期/重置规则:限时活动,以平台为准。

优点/特点:Web3原生AI网关,一个Key调用多模型,提供智能路由功能,可节省约80%推理成本。

官网/控制台:gaterouter.ai

Mistral AI

重点模型/系列:Mistral系列模型。

免费额度:免费计划,速率限制。

速率限制:具体限制未公开,有报告称日常使用未触发过限制。

优点/特点:法国开源模型领导者,注重隐私,适合低频测试。

官网/控制台:console.mistral.ai

Hugging Face

重点模型/系列:平台上数千个开源模型。

免费额度:每月$0.10的计算额度(约10万次小模型调用)。

有效期/重置规则:每月重置。

优点/特点:全球最大开源模型社区,模型种类极其丰富,适合实验各种小众模型。

官网/控制台:huggingface.co

AI Ping

重点模型/系列:整合30家厂商的550个模型,如Kimi-K2、MiniMax-M2、GLM-4.6等。

免费额度:新用户注册即送免费算力额度。

有效期/重置规则:以平台为准。

优点/特点:提供统一API与智能路由,号称“大模型API的大众点评”,方便选型测试。

官网/控制台:aiping.cn

华为云

重点模型/系列:智谱GLM-5.1、GLM-5.0等开源模型。

免费额度:提供免费体验额度。

有效期/重置规则:以平台为准。

优点/特点:国产算力平台,提供一键部署服务,适合企业级模型调用和部署。

官网/控制台:www.huaweicloud.com

Sophnet

重点模型/系列:提供60余款主流模型,包括DeepSeek极速版。

免费额度:通过签到和任务积累Tokens。

有效期/重置规则:通过日常互动获取。

优点/特点:主打DeepSeek极速推理,TPS超过100,是国内推理速度最快的平台之一。

官网/控制台:soph.net

出门问问 (Mobvoi)

重点模型/系列:文本转语音(TTS)、声音克隆、数字人等。

免费额度:新用户可领取免费额度。

有效期/重置规则:以平台为准。

优点/特点:在多模态AI能力上表现突出,尤其在语音和视频生成方面,适合构建创意应用。

官网/控制台:mobvoi.com

Telnyx

重点模型/系列:专注于通信和实时对话式AI的API。

免费额度:免费增值模式,提供免费额度。

有效期/重置规则:以平台为准。

优点/特点:基于现有Telnyx API Key无缝集成,适合需要将AI能力与全球电话、短信服务结合的应用。

官网/控制台:telnyx.com

Inference.net

重点模型/系列:DeepSeek V3、Llama 3.1、Mistral Nemo等。

免费额度:提供免费调用。

有效期/重置规则:以平台为准。

优点/特点:专注于开源模型推理,提供OpenAI兼容接口,强调成本效益。

官网/控制台:inference.net


💡 补充使用贴士

  • 国内用户首选:NVIDIA NIM、腾讯混元、阿里云百炼、智谱AI、硅基流动等国内平台网络连接稳定,无需特殊网络环境,是开发和测试的首选。
  • 速率限制型 vs 总额包型
    • 速率限制型(如NVIDIA NIM、Google AI Studio):适合需要长期、稳定调用的日常开发和测试。
    • 总额包型(如腾讯混元、智谱AI):赠送的Token包适合短期、集中式的大算力任务,如模型评估或项目原型开发。
  • 聚合平台的优势:DMXAPI、AI Ping、GateRouter、OpenRouter等平台用一个API Key就能调用多个厂商的模型,且大部分提供免费额度,可以大大简化开发流程和测试成本。
  • 信息时效性:各平台的免费政策、额度和速率限制都处于动态变化中,以上信息基于2026年4月前的资料,请以各平台的官方最新公告为准。