大语言模型服务价格汇总

2024年5月，各大模型厂商打起了“价格战”，意图拉拢更多开发者参与应用开发和模型落地探索。本仓库用于收集各大云服务厂商的大语言模型服务价格，方便用户对比。价格单位按照输入/输出每百万词元（Token）需要花费的人民币价格进行计算，美元到人民币汇率按最近一年的平均汇率7.2计算。

本仓库只是一个速查表，更详细的信息请参考各个厂商的官方价格文档。例如闲时价格、预付费价格、Batch调用价格等。

由于最近一年不同厂商的免费试用权益变动较多，获得免费权益的门槛变动也多，有效期也短，因此本仓库不收集免费试用权益包信息。

统计模型和平台范围：

只选取应用较为广泛，使用的应用数和人数较多，较为典型和具有代表性的模型和平台。以及服务价格较为便宜的平台。
由于本速查表主要面向翻译和中英双语应用，对于闭源且不支持中文（例如LLaMa系列）或中文支持较差的模型（例如Gemma-7B、mixtral系列）不会被纳入统计。
如果某开源模型在其官方平台已经十分便宜，那第三方平台的价格不会被纳入统计。
主要面向企业用户，个人用户难以申请使用的平台和模型不会被纳入统计。
在官方出了新模型且新模型性能提升较大，且价格相较旧模型更便宜或者持平的情况下，不再额外统计旧模型。（例如只统计LLaMa3不统计LLaMa2）
官方宣布即将被弃用的模型，或者描述为Older/Legacy的模型不会被纳入统计。
由于模型太小和/或性能不佳，连一篇完整新闻文章都翻译不下来的模型（例如qwen1.5-0.5b-chat）不会被纳入统计。

统计数据范围：

模型提供平台及定价页面
API调用格式是否兼容OpenAI格式
审查情况（要求翻译BBC政治新闻检查是否存在截断和拒绝回复的情况），不统计对暴力、色情、种族主义等内容的审查。
价格

GPT系列

模型提供平台：OpenAI / Azure（定价基本一致）

API是否兼容OpenAI格式：OpenAI的天然兼容；Azure的有自定义格式，不兼容

审查情况：无审查

价格：

最后更新日期：2024-07-23

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）
gpt-4o-mini	1.08	4.32	128
gpt-4o-2024-08-06	18	72	128
gpt-4o	36	108	128
gpt-4-turbo	72	216	128
gpt-4	216	432	8
gpt-4-32k	432	864	32
gpt-3.5-turbo	3.6	10.8	16

Claude系列

模型提供平台： Anthropic / AWS 价格类似

API是否兼容OpenAI格式：否，自定义格式

审查情况：无审查

价格：

最后更新日期：2024-06-21

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）
claude-3.5-sonnet	21.6	108	200
claude-3-opus	108	540	200
claude-3-sonnet	21.6	108	200
claude-3-haiku	1.8	9	200

Gemini系列

模型提供平台：谷歌 / openrouter

API是否兼容OpenAI格式：否，自定义格式

审查情况：无审查

谷歌官方平台随用随付方案价格（注：以下价格为输入输出在128K以内的情况，超过128K翻倍）：

最后更新日期：2024-05-23

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）
gemini-1.5-pro	25.2	75.6	1000
gemini-1.5-flash	2.52	7.56	2800
gemini-1.0-pro	3.6	10.8	32

openrouter平台价格（有批发价）：

最后更新日期：2024-05-23

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）	备注
gemini-1.5-pro	18	54	2800
gemini-1.5-flash	1.8	5.4	2800
gemini-1.0-pro	0.9	2.7	32	上下文窗口大小众说纷纭，建议以实际使用情况为准

GLM闭源系列

模型提供平台：智谱AI

API是否兼容OpenAI格式：兼容，参见文档。

审查情况：平台对API输出有审查，参见审查文档。

价格：

最后更新日期：2024-06-05

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）	备注
GLM-4-0520	100	100	128	当前智谱AI最先进的模型，指令遵从能力大幅提升，发布于20240605
GLM-4-Air	1	1	128	性价比最高的版本，综合性能接近GLM-4，速度快，价格实惠。
GLM-4-Long	1	1	1000	超长输入
GLM-4-Airx	10	10	128	GLM-4-Air 的高性能版本，效果不变，推理速度达到其2.6倍。
GLM-4-Flash	0	0	128	适用简单任务，速度最快，免费（但有速率限制，最小并发数为5）

注：由于ChatGLM开源版本商用API较少，计费通常也比GLM-4-Air贵，性能也和GLM-4-Air差不多，所以不统计。

Deepseek系列

模型提供平台： deepseek官方开放平台 API是否兼容OpenAI格式：是

审查情况：平台对API输出有审查

价格：

最后更新日期：2024-05-23

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）	备注
deepseek-chat（基于DeepSeek-V2）	1	2	128

零一万物Yi系列

模型提供平台：零一万物大模型开放平台

API是否兼容OpenAI格式：是

审查情况：平台对API输入和输出有审查

价格：

最后更新日期：2024-05-23

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）
yi-large	20	20	16
yi-large-turbo	12	12	16
yi-medium-200k	12	12	200
yi-medium	2.5	2.5	16
yi-spark	1	1	16

通义千问开源系列

模型提供平台：阿里云 / together.ai / openrouter / siliconflow

API是否兼容OpenAI格式：是，参见阿里云文档；together.ai文档；openrouter文档；siliconflow文档

审查情况：开源模型本身不存在审查；together.ai等境外平台对输入输出无审查；阿里云平台存在审查，见文档

阿里云平台价格：

最后更新日期：2024-05-23

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）
qwen2-72b-instruct	5	10	32
qwen2-57b-a14b-instruct	3.5	7	32
qwen2-7b-instruct	1	2	32
qwen1.5-110b-chat	7	14	32
qwen1.5-72b-chat	5	10	32
qwen1.5-32b-chat	3.5	7	32
qwen1.5-14b-chat	2	4	8
qwen1.5-7b-chat	1	2	8

together.ai平台价格（输入输出一致，适合翻译等输出文本较多的任务）：

最后更新日期：2024-06-09

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）
qwen1.5-110b-chat	12.96	12.96	32
qwen2-72b-instruct	6.48	6.48	32
qwen1.5-72b-chat	6.48	6.48	32
qwen1.5-32b-chat	5.76	5.76	32
qwen1.5-14b-chat	2.16	2.16	32
qwen1.5-7b-chat	1.44	1.44	32

使用openrouter调用会路由至together.ai，价格一致，但是由于有批发价，目前暂时提供9折优惠。

siliconflow平台价格：

最后更新日期：2024-06-09

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）
Qwen2-72B-Instruct	4.13	4.13	32
Qwen2-57B-A14B-Instruct	1.26	1.26	32
Qwen2-7B-Instruct	0.35	0.35	32
Qwen1.5-110B	4.13	4.13	32
Qwen1.5-32B	1.26	1.26	32
Qwen1.5-14B	0.7	0.7	32
Qwen1.5-7B	0.35	0.35	32

通义千问闭源系列

模型提供平台：阿里云

API是否兼容OpenAI格式：是，参见文档

审查情况：无审查

价格：

最后更新日期：2024-05-23

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）
qwen-long	0.5	2	10000
qwen-turbo	2	6	8
qwen-plus	4	12	32
qwen-max	40	120	8
qwen-max-longcontext	120	120	32

百川系列

模型提供平台：百川智能开放平台

API是否兼容OpenAI格式：是，参见官方调用文档

审查情况：未知，未测试

价格：

最后更新日期：2024-05-23

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）
Baichuan4	100	100	未见公开报道
Baichuan3-Turbo	12	12	未见公开报道
Baichuan3-Turbo-128k	24	24	128
Baichuan2-Turbo	8	8	未见公开报道
Baichuan2-Turbo-192k	16	16	192
Baichuan2-53B	20	20	4

豆包系列

模型提供平台：字节跳动火山引擎

API是否兼容OpenAI格式：否，自定义格式

审查情况：存在，见官方文档错误码，搜索“敏感”

价格：

最后更新日期：2024-05-23

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）
Doubao-lite-32k	0.3	0.6	32
Doubao-lite-128k	0.8	1	128
Doubao-pro-32k	0.8	2	32
Doubao-pro-128k	5	9	128

文心Ernie系列

模型提供平台：百度千帆大模型平台

API是否兼容OpenAI格式：否，自定义格式

审查情况：对输出存在审查。

价格：

最后更新日期：2024-05-23

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）
ERNIE 4.0系列	120	120	8
ERNIE 3.5系列	12	12	最大128
ERNIE-3.5-128k	12	12	128
ERNIE Speed系列	0	0	最大128
ERNIE Lite系列	0	0	最大128
ERNIE Tiny系列	0	0	8

腾讯混元系列

模型提供平台：腾讯云

API是否兼容OpenAI格式：否，自定义格式，而且签名方法很难用

审查情况：未知，未测试

价格：

最后更新日期：2024-05-23

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）
hunyuan-pro	30	100	32
hunyuan-standard-32k	4.5	5	32
hunyuan-standard-256k	15	60	256
hunyuan-lite	0	0	256

cohere/command系列

模型提供平台： cohere官方平台 / openrouter / Azure

API是否兼容OpenAI格式：官方平台和Azure不兼容，为自定义格式；第三方平台例如openrouter兼容。

审查情况：无审查

（三个平台统一）价格：

最后更新日期：2024-05-23

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）	备注
command-r-plus	21.6	108	128
command-r	3.6	10.8	128

月之暗面系列

模型提供平台： moonshot开放平台

API是否兼容OpenAI格式：是，参见文档

审查情况：未测试，未知

价格：

最后更新日期：2024-05-24

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）	备注
moonshot-v1-8k	12	12	8k

模板

模型提供平台： / /

API是否兼容OpenAI格式：

审查情况：

价格：

最后更新日期：YYYY-MM-DD

模型	输入价格（元/M Tokens）	输出价格（元/M Tokens）	上下文窗口大小（K）	备注

其他

由于看不懂讯飞星火的定价策略和接口调用，故没有收录。 minimaxi也没有收录，因为看不出来有什么优势。

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
.gitignore		.gitignore
README.md		README.md
翻译BBC新闻测试提示词.md		翻译BBC新闻测试提示词.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

大语言模型服务价格汇总

GPT系列

Claude系列

Gemini系列

GLM闭源系列

Deepseek系列

零一万物Yi系列

通义千问开源系列

通义千问闭源系列

百川系列

豆包系列

文心Ernie系列

腾讯混元系列

cohere/command系列

月之暗面系列

模板

其他

About

Releases

Packages

syaoranwe/LLM-Price

Folders and files

Latest commit

History

Repository files navigation

大语言模型服务价格汇总

GPT系列

Claude系列

Gemini系列

GLM闭源系列

Deepseek系列

零一万物Yi系列

通义千问开源系列

通义千问闭源系列

百川系列

豆包系列

文心Ernie系列

腾讯混元系列

cohere/command系列

月之暗面系列

模板

其他

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages