在 AIGC 爆发的今天,Token 费用虽然在不断下降,但对于个人开发者、学生党或者仅仅想做个 Demo 测试一下的同学来说,积少成多也是一笔开销。
好在目前市场上不仅有“卷价格”的厂商,还有很多提供免费额度甚至完全免费的大模型 API 接口。AI225导航整理了目前市面上最值得尝试的免费 LLM API 渠道,涵盖国内直连和国外优质资源。持续更新,欢迎收藏。
1. 魔搭社区 (ModelScope)¶
免费额度:每日总计 2000 次 API 调用。
限制:单个模型每日上限 500 次。
需绑定阿里云账号。
具体查看:https://www.modelscope.cn/docs/model-service/API-Inference/intro
2. Google Gemini API¶
官网:https://aistudio.google.com/
免费可用模型及限制如下:
| 模型 | 类别 | RPM | TPM | RPD |
|---|---|---|---|---|
| gemini-2.5-flash | 文本输出模型 | 5 | 250K | 20 |
| gemini-2.5-flash-lite | 文本输出模型 | 10 | 250K | 20 |
| gemini-2.5-flash-tts | 多模态生成模型 | 3 | 10K | 10 |
| gemini-3-flash | 文本输出模型 | 5 | 250K | 20 |
| gemini-robotics-er-1.5-preview | 其他模型 | 10 | 250K | 20 |
| gemma-3-12b | 其他模型 | 30 | 15K | 14.4K |
| gemma-3-1b | 其他模型 | 30 | 15K | 14.4K |
| gemma-3-27b | 其他模型 | 30 | 15K | 14.4K |
| gemma-3-2b | 其他模型 | 30 | 15K | 14.4K |
| gemma-3-4b | 其他模型 | 30 | 15K | 14.4K |
| gemini-2.5-flash-native-audio-dialog | Live API | 无限制 | 1M | 无限制 |
具体查看:https://ai.google.dev/gemini-api/docs/rate-limits
注意:需要使用网络代理工具访问
3. GitHub Models¶
官网:https://github.com/marketplace/models
免费可调用的模型有gpt-4.1、gpt-4o、gpt-4.1-mini、DeepSeek-V3-0324、Llama-3.3-70B-Instruct等。
模型查看:https://github.com/marketplace?type=models,点击进入具体模型查看免费速率限制等级。
速率限制说明:https://docs.github.com/en/github-models/use-github-models/prototyping-with-ai-models#rate-limits
4. OpenRouter¶
知名的模型聚合商之一,接口统一。在其模型列表中,查找名称后缀带 free 的模型。
每日50个请求(所有免费模型总计),付费用户(累计购买至少$10 credits,即使credits已用完):每日限额提升至1000个请求。
5. Groq¶
免费可用模型及限制如下:
| 模型 | RPM | RPD | TPM | TPD | ASH | ASD |
|---|---|---|---|---|---|---|
| allam-2-7b | 30 | 7K | 6K | 500K | - | - |
| canopylabs/orpheus-arabic-saudi | 10 | 100 | 1.2K | 3.6K | - | - |
| canopylabs/orpheus-v1-english | 10 | 100 | 1.2K | 3.6K | - | - |
| groq/compound | 30 | 250 | 70K | - | - | - |
| groq/compound-mini | 30 | 250 | 70K | - | - | - |
| llama-3.1-8b-instant | 30 | 14.4K | 6K | 500K | - | - |
| llama-3.3-70b-versatile | 30 | 1K | 12K | 100K | - | - |
| meta-llama/llama-4-maverick-17b-128e-instruct | 30 | 1K | 6K | 500K | - | - |
| meta-llama/llama-4-scout-17b-16e-instruct | 30 | 1K | 30K | 500K | - | - |
| meta-llama/llama-guard-4-12b | 30 | 14.4K | 15K | 500K | - | - |
| meta-llama/llama-prompt-guard-2-22m | 30 | 14.4K | 15K | 500K | - | - |
| meta-llama/llama-prompt-guard-2-86m | 30 | 14.4K | 15K | 500K | - | - |
| moonshotai/kimi-k2-instruct | 60 | 1K | 10K | 300K | - | - |
| moonshotai/kimi-k2-instruct-0905 | 60 | 1K | 10K | 300K | - | - |
| openai/gpt-oss-120b | 30 | 1K | 8K | 200K | - | - |
| openai/gpt-oss-20b | 30 | 1K | 8K | 200K | - | - |
| openai/gpt-oss-safeguard-20b | 30 | 1K | 8K | 200K | - | - |
| playai-tts | 10 | 100 | 1.2K | 3.6K | - | - |
| playai-tts-arabic | 10 | 100 | 1.2K | 3.6K | - | - |
| qwen/qwen3-32b | 60 | 1K | 6K | 500K | - | - |
| whisper-large-v3 | 20 | 2K | - | - | 7.2K | 28.8K |
| whisper-large-v3-turbo | 20 | 2K | - | - | 7.2K | 28.8K |
具体查看:https://console.groq.com/docs/rate-limits
注意:需要使用网络代理工具访问
6. ChatAnywhere (GitHub 项目)¶
项目地址:https://github.com/chatanywhere/GPT_API_free
使用 GitHub 账号绑定领取免费 Key。免费API Key限制200请求/天/IP&Key调用频率。
免费版支持gpt-5.2, gpt-5.1, gpt-5, gpt-4o,gpt-4.1一天5次;支持deepseek-r1, deepseek-v3, deepseek-v3-2-exp一天30次,支持gpt-4o-mini,gpt-3.5-turbo,gpt-4.1-mini,gpt-4.1-nano, gpt-5-mini,gpt-5-nano一天200次。
7. 智谱 AI (BigModel)¶
官网:https://bigmodel.cn/
免费策略:Flash 系列模型(如 GLM-4.5-Flash)完全免费。
限制: 主要限制并发数(Concurrency)。
具体可查看:https://bigmodel.cn/usercenter/proj-mgmt/rate-limits
8. 硅基流动 (SiliconFlow)¶
免费策略:大部分 10B 参数以下 的中小模型免费。
速率限制:一般为 RPM 1,000 / TPM 50,000。
术语说明¶
- RPM:Requests Per Minute(每分钟请求数)
- TPM:Tokens Per Minute(每分钟Token数)
- RPD:Requests Per Day(每日请求数)
- TPD:Tokens Per Day(每日Token数)
免费额度随时可能调整,建议访问官网或控制台确认最新限额。欢迎反馈补充,持续更新中!