随着大模型竞争越来越激烈,各大厂为了推广自己的大模型,用各种优惠策略来吸引用户。

目前已经收集到的免费大模型 API 有 7 个,有的不限量,限制 qps;有的限量,大家有需要都可以接入试试。

免费大模型列表

免费大模型 免费版本 控制台 文档地址 限制
讯飞星火大模型 spark-lite 链接 链接 QPS:2
百度千帆大模型平台 yi_34b_chat, ERNIE-Speed-8K, ERNIE-Speed-128K, ERNIE-Lite-8K, ERNIE-Lite-8K-0922, ERNIE-Tiny-8K 链接 链接 Lite、Speed-8K:RPM = 300,TPM = 300000
Speed-128K:RPM = 60,TPM = 300000
腾讯混元大模型 hunyuan-lite 链接 链接 限制并发数为 5 路
智谱 glm-4-flash 链接 链接 目前五并发限制
硅基流动 Qwen2-7B-Instruct,Qwen2-1.5B-Instruct,Qwen1.5-7B-Chat,glm-4-9b-chat,chatglm3-6b,Yi-1.5-9B-Chat-16K,Yi-1.5-6B-Chat 链接 链接 RPM 限制为 100,QPS 限制为 3,更多可以进行申请。
官网:https://cloud.siliconflow.cn/i/8rG8Fw2d
【国外】Cloudflare Workers AI 所有模型 链接 链接 免费可以每天使用 1 万次,一个月可以 30 万次;测试版本本的模型无限制
Llama Family "Atom-13B-Chat","Atom-7B-Chat","Atom-1B-Chat","Llama3-Chinese-8B-Instruct" 链接 链接 1.每天 8-22 点:接口限速每分钟 20 次并发
2.每天 22-次日 8 点:接口限速每分钟 50 次并发
groq gemma-7b-it、mixtral-8x7b-32768、llama3-70b-8192、llama3-8b-8192 链接 链接 rpm 为 30,rpd 为 14400,TOKENS PER MINUTE 也有限制
Google Gemini gemini-1.5-pro、gemini-1.5-flash、gemini-1.0-pro、gemini-pro-vision 链接 链接 15RPM(每分钟请求数);100 万 TPM(每分钟令牌);1500 RPD(每天请求数)
阿里灵积 dashscope "chatglm3-6b","baichuan-7b-v1","yi-6b-chat","yi-34b-chat","aquilachat-7b","deepseek-7b-chat","internlm-7b-chat","qwen2-1.5b-instruct","qwen2-0.5b-instruct","qwen1.5-1.8b-chat","qwen1.5-0.5b-chat","qwen-1.8b-chat" 链接 链接 限时免费。
以下条件任何一个超出都会触发限流:
流量 ≤ 120 QPM,每分钟处理不超过 120 个完整的请求;
Token 消耗 ≤ 200,000 TPM,每分钟消耗的 Token 数目不超过 200,000。
文心智能体 文心大模型 3.5 链接 链接 目前免费
nvidia 所有模型 链接 链接 商业邮箱:获得 5000 个 API 积分
个人邮箱:获得 1000 个 API 积分
Github Models 所有模型 链接 链接 需要申请,申请地址:https://github.com/marketplace/models/waitlist/join

如果你也有遇到免费的 ChatGpt API,欢迎评论区留言,好东西一起分享!