2024年5月,各大模型厂商打起了“价格战”,意图拉拢更多开发者参与应用开发和模型落地探索。本仓库用于收集各大云服务厂商的大语言模型服务价格,方便用户对比。价格单位按照输入/输出每百万词元(Token)需要花费的人民币价格进行计算,美元到人民币汇率按最近一年的平均汇率7.2计算。
本仓库只是一个速查表,更详细的信息请参考各个厂商的官方价格文档。例如闲时价格、预付费价格、Batch调用价格等。
由于最近一年不同厂商的免费试用权益变动较多,获得免费权益的门槛变动也多,有效期也短,因此本仓库不收集免费试用权益包信息。
统计模型和平台范围:
- 只选取应用较为广泛,使用的应用数和人数较多,较为典型和具有代表性的模型和平台。以及服务价格较为便宜的平台。
- 由于本速查表主要面向翻译和中英双语应用,对于闭源且不支持中文(例如LLaMa系列)或中文支持较差的模型(例如Gemma-7B、mixtral系列)不会被纳入统计。
- 如果某开源模型在其官方平台已经十分便宜,那第三方平台的价格不会被纳入统计。
- 主要面向企业用户,个人用户难以申请使用的平台和模型不会被纳入统计。
- 在官方出了新模型且新模型性能提升较大,且价格相较旧模型更便宜或者持平的情况下,不再额外统计旧模型。(例如只统计LLaMa3不统计LLaMa2)
- 官方宣布即将被弃用的模型,或者描述为Older/Legacy的模型不会被纳入统计。
- 由于模型太小和/或性能不佳,连一篇完整新闻文章都翻译不下来的模型(例如qwen1.5-0.5b-chat)不会被纳入统计。
统计数据范围:
- 模型提供平台及定价页面
- API调用格式是否兼容OpenAI格式
- 审查情况(要求翻译BBC政治新闻检查是否存在截断和拒绝回复的情况),不统计对暴力、色情、种族主义等内容的审查。
- 价格
API是否兼容OpenAI格式:OpenAI的天然兼容;Azure的有自定义格式,不兼容
审查情况:无审查
价格:
最后更新日期:2024-07-23
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
gpt-4o-mini | 1.08 | 4.32 | 128 | |
gpt-4o-2024-08-06 | 18 | 72 | 128 | |
gpt-4o | 36 | 108 | 128 | |
gpt-4-turbo | 72 | 216 | 128 | |
gpt-4 | 216 | 432 | 8 | |
gpt-4-32k | 432 | 864 | 32 | |
gpt-3.5-turbo | 3.6 | 10.8 | 16 |
API是否兼容OpenAI格式:否,自定义格式
审查情况:无审查
价格:
最后更新日期:2024-06-21
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
claude-3.5-sonnet | 21.6 | 108 | 200 | |
claude-3-opus | 108 | 540 | 200 | |
claude-3-sonnet | 21.6 | 108 | 200 | |
claude-3-haiku | 1.8 | 9 | 200 |
模型提供平台: 谷歌 / openrouter
API是否兼容OpenAI格式:否,自定义格式
审查情况:无审查
谷歌官方平台随用随付方案价格(注:以下价格为输入输出在128K以内的情况,超过128K翻倍):
最后更新日期:2024-05-23
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
gemini-1.5-pro | 25.2 | 75.6 | 1000 | |
gemini-1.5-flash | 2.52 | 7.56 | 2800 | |
gemini-1.0-pro | 3.6 | 10.8 | 32 |
openrouter平台价格(有批发价):
最后更新日期:2024-05-23
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
gemini-1.5-pro | 18 | 54 | 2800 | |
gemini-1.5-flash | 1.8 | 5.4 | 2800 | |
gemini-1.0-pro | 0.9 | 2.7 | 32 | 上下文窗口大小众说纷纭,建议以实际使用情况为准 |
模型提供平台: 智谱AI
API是否兼容OpenAI格式:兼容,参见文档。
审查情况:平台对API输出有审查,参见审查文档。
价格:
最后更新日期:2024-06-05
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
GLM-4-0520 | 100 | 100 | 128 | 当前智谱AI最先进的模型,指令遵从能力大幅提升,发布于20240605 |
GLM-4-Air | 1 | 1 | 128 | 性价比最高的版本,综合性能接近GLM-4,速度快,价格实惠。 |
GLM-4-Long | 1 | 1 | 1000 | 超长输入 |
GLM-4-Airx | 10 | 10 | 128 | GLM-4-Air 的高性能版本,效果不变,推理速度达到其2.6倍。 |
GLM-4-Flash | 0 | 0 | 128 | 适用简单任务,速度最快,免费(但有速率限制,最小并发数为5) |
注:由于ChatGLM开源版本商用API较少,计费通常也比GLM-4-Air贵,性能也和GLM-4-Air差不多,所以不统计。
模型提供平台: deepseek官方开放平台 API是否兼容OpenAI格式:是
审查情况:平台对API输出有审查
价格:
最后更新日期:2024-05-23
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
deepseek-chat(基于DeepSeek-V2) | 1 | 2 | 128 |
模型提供平台: 零一万物大模型开放平台
API是否兼容OpenAI格式:是
审查情况:平台对API输入和输出有审查
价格:
最后更新日期:2024-05-23
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
yi-large | 20 | 20 | 16 | |
yi-large-turbo | 12 | 12 | 16 | |
yi-medium-200k | 12 | 12 | 200 | |
yi-medium | 2.5 | 2.5 | 16 | |
yi-spark | 1 | 1 | 16 |
模型提供平台: 阿里云 / together.ai / openrouter / siliconflow
API是否兼容OpenAI格式:是,参见阿里云文档;together.ai文档;openrouter文档;siliconflow文档
审查情况:开源模型本身不存在审查;together.ai等境外平台对输入输出无审查;阿里云平台存在审查,见文档
阿里云平台价格:
最后更新日期:2024-05-23
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
qwen2-72b-instruct | 5 | 10 | 32 | |
qwen2-57b-a14b-instruct | 3.5 | 7 | 32 | |
qwen2-7b-instruct | 1 | 2 | 32 | |
qwen1.5-110b-chat | 7 | 14 | 32 | |
qwen1.5-72b-chat | 5 | 10 | 32 | |
qwen1.5-32b-chat | 3.5 | 7 | 32 | |
qwen1.5-14b-chat | 2 | 4 | 8 | |
qwen1.5-7b-chat | 1 | 2 | 8 |
together.ai平台价格(输入输出一致,适合翻译等输出文本较多的任务):
最后更新日期:2024-06-09
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
qwen1.5-110b-chat | 12.96 | 12.96 | 32 | |
qwen2-72b-instruct | 6.48 | 6.48 | 32 | |
qwen1.5-72b-chat | 6.48 | 6.48 | 32 | |
qwen1.5-32b-chat | 5.76 | 5.76 | 32 | |
qwen1.5-14b-chat | 2.16 | 2.16 | 32 | |
qwen1.5-7b-chat | 1.44 | 1.44 | 32 |
使用openrouter调用会路由至together.ai,价格一致,但是由于有批发价,目前暂时提供9折优惠。
siliconflow平台价格:
最后更新日期:2024-06-09
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
Qwen2-72B-Instruct | 4.13 | 4.13 | 32 | |
Qwen2-57B-A14B-Instruct | 1.26 | 1.26 | 32 | |
Qwen2-7B-Instruct | 0.35 | 0.35 | 32 | |
Qwen1.5-110B | 4.13 | 4.13 | 32 | |
Qwen1.5-32B | 1.26 | 1.26 | 32 | |
Qwen1.5-14B | 0.7 | 0.7 | 32 | |
Qwen1.5-7B | 0.35 | 0.35 | 32 |
模型提供平台: 阿里云
API是否兼容OpenAI格式:是,参见文档
审查情况:无审查
价格:
最后更新日期:2024-05-23
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
qwen-long | 0.5 | 2 | 10000 | |
qwen-turbo | 2 | 6 | 8 | |
qwen-plus | 4 | 12 | 32 | |
qwen-max | 40 | 120 | 8 | |
qwen-max-longcontext | 120 | 120 | 32 |
模型提供平台: 百川智能开放平台
API是否兼容OpenAI格式:是,参见官方调用文档
审查情况:未知,未测试
价格:
最后更新日期:2024-05-23
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
Baichuan4 | 100 | 100 | 未见公开报道 | |
Baichuan3-Turbo | 12 | 12 | 未见公开报道 | |
Baichuan3-Turbo-128k | 24 | 24 | 128 | |
Baichuan2-Turbo | 8 | 8 | 未见公开报道 | |
Baichuan2-Turbo-192k | 16 | 16 | 192 | |
Baichuan2-53B | 20 | 20 | 4 |
模型提供平台: 字节跳动火山引擎
API是否兼容OpenAI格式:否,自定义格式
审查情况:存在,见官方文档错误码,搜索“敏感”
价格:
最后更新日期:2024-05-23
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
Doubao-lite-32k | 0.3 | 0.6 | 32 | |
Doubao-lite-128k | 0.8 | 1 | 128 | |
Doubao-pro-32k | 0.8 | 2 | 32 | |
Doubao-pro-128k | 5 | 9 | 128 |
模型提供平台: 百度千帆大模型平台
API是否兼容OpenAI格式:否,自定义格式
审查情况:对输出存在审查。
价格:
最后更新日期:2024-05-23
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
ERNIE 4.0系列 | 120 | 120 | 8 | |
ERNIE 3.5系列 | 12 | 12 | 最大128 | |
ERNIE-3.5-128k | 12 | 12 | 128 | |
ERNIE Speed系列 | 0 | 0 | 最大128 | |
ERNIE Lite系列 | 0 | 0 | 最大128 | |
ERNIE Tiny系列 | 0 | 0 | 8 |
模型提供平台: 腾讯云
API是否兼容OpenAI格式:否,自定义格式,而且签名方法很难用
审查情况:未知,未测试
价格:
最后更新日期:2024-05-23
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
hunyuan-pro | 30 | 100 | 32 | |
hunyuan-standard-32k | 4.5 | 5 | 32 | |
hunyuan-standard-256k | 15 | 60 | 256 | |
hunyuan-lite | 0 | 0 | 256 |
模型提供平台: cohere官方平台 / openrouter / Azure
API是否兼容OpenAI格式:官方平台和Azure不兼容,为自定义格式;第三方平台例如openrouter兼容。
审查情况:无审查
(三个平台统一)价格:
最后更新日期:2024-05-23
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
command-r-plus | 21.6 | 108 | 128 | |
command-r | 3.6 | 10.8 | 128 |
模型提供平台: moonshot开放平台
API是否兼容OpenAI格式:是,参见文档
审查情况:未测试,未知
价格:
最后更新日期:2024-05-24
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
moonshot-v1-8k | 12 | 12 | 8k |
API是否兼容OpenAI格式:
审查情况:
价格:
最后更新日期:YYYY-MM-DD
模型 | 输入价格(元/M Tokens) | 输出价格(元/M Tokens) | 上下文窗口大小(K) | 备注 |
---|---|---|---|---|
由于看不懂讯飞星火的定价策略和接口调用,故没有收录。 minimaxi也没有收录,因为看不出来有什么优势。