随着大模型竞争越来越激烈,各大厂为了推广自己的大模型,用各种优惠策略来吸引用户。
目前已经收集到的免费大模型 API 有 7 个,有的不限量,限制 qps;有的限量,大家有需要都可以接入试试。
免费大模型列表
免费大模型 | 免费版本 | 控制台 | 文档地址 | 限制 |
---|---|---|---|---|
讯飞星火大模型 | spark-lite | 链接 | 链接 | QPS:2 |
百度千帆大模型平台 | yi_34b_chat, ERNIE-Speed-8K, ERNIE-Speed-128K, ERNIE-Lite-8K, ERNIE-Lite-8K-0922, ERNIE-Tiny-8K | 链接 | 链接 | Lite、Speed-8K:RPM = 300,TPM = 300000 Speed-128K:RPM = 60,TPM = 300000 |
腾讯混元大模型 | hunyuan-lite | 链接 | 链接 | 限制并发数为 5 路 |
智谱 | glm-4-flash | 链接 | 链接 | 目前五并发限制 |
硅基流动 | Qwen2-7B-Instruct,Qwen2-1.5B-Instruct,Qwen1.5-7B-Chat,glm-4-9b-chat,chatglm3-6b,Yi-1.5-9B-Chat-16K,Yi-1.5-6B-Chat | 链接 | 链接 | RPM 限制为 100,QPS 限制为 3,更多可以进行申请。 官网:https://cloud.siliconflow.cn/i/8rG8Fw2d |
【国外】Cloudflare Workers AI | 所有模型 | 链接 | 链接 | 免费可以每天使用 1 万次,一个月可以 30 万次;测试版本本的模型无限制 |
Llama Family | "Atom-13B-Chat","Atom-7B-Chat","Atom-1B-Chat","Llama3-Chinese-8B-Instruct" | 链接 | 链接 | 1.每天 8-22 点:接口限速每分钟 20 次并发 2.每天 22-次日 8 点:接口限速每分钟 50 次并发 |
groq | gemma-7b-it、mixtral-8x7b-32768、llama3-70b-8192、llama3-8b-8192 | 链接 | 链接 | rpm 为 30,rpd 为 14400,TOKENS PER MINUTE 也有限制 |
Google Gemini | gemini-1.5-pro、gemini-1.5-flash、gemini-1.0-pro、gemini-pro-vision | 链接 | 链接 | 15RPM(每分钟请求数);100 万 TPM(每分钟令牌);1500 RPD(每天请求数) |
阿里灵积 dashscope | "chatglm3-6b","baichuan-7b-v1","yi-6b-chat","yi-34b-chat","aquilachat-7b","deepseek-7b-chat","internlm-7b-chat","qwen2-1.5b-instruct","qwen2-0.5b-instruct","qwen1.5-1.8b-chat","qwen1.5-0.5b-chat","qwen-1.8b-chat" | 链接 | 链接 | 限时免费。 以下条件任何一个超出都会触发限流: 流量 ≤ 120 QPM,每分钟处理不超过 120 个完整的请求; Token 消耗 ≤ 200,000 TPM,每分钟消耗的 Token 数目不超过 200,000。 |
文心智能体 | 文心大模型 3.5 | 链接 | 链接 | 目前免费 |
nvidia | 所有模型 | 链接 | 链接 | 商业邮箱:获得 5000 个 API 积分 个人邮箱:获得 1000 个 API 积分 |
Github Models | 所有模型 | 链接 | 链接 | 需要申请,申请地址:https://github.com/marketplace/models/waitlist/join |
如果你也有遇到免费的 ChatGpt API,欢迎评论区留言,好东西一起分享!