LLM的API价格

03 Jul 2025 1727字 6分
CC BY 4.0 （除特别声明或转载文章外）

下面是截止2025.7.3的一些主流LLM的API价格

厂商	模型名称	输入价格（标准）	输出价格（标准）	缓存/分段价格详情	上下文长度	特性说明
Google	Gemini 2.5 Pro (≤200K)	$1.25/百万Tokens	$10.00/百万Tokens	缓存：$0.31/百万Tokens（context caching）	1M tokens	复杂推理、长提示处理
Google	Gemini 2.5 Pro (>200K)	$2.50/百万Tokens	$15.00/百万Tokens	缓存：$0.625/百万Tokens	1M tokens	长提示处理
Google	Gemini 2.5 Flash (文本)	$0.30/百万Tokens	$2.50/百万Tokens	缓存：$0.075/百万Tokens	1M tokens	轻量快速
Google	Gemini 2.5 Flash (音频)	$1.00/百万Tokens	$2.50/百万Tokens	缓存：$0.25/百万Tokens	1M tokens	音频专用
Anthropic	Claude Opus 4	$15.00/百万Tokens	$75.00/百万Tokens	写入 5 min: $18.75/M 1 h: $30/M 命中: $1.5/M	200K tokens	旗舰模型
Anthropic	Claude Sonnet 4	$3.00/百万Tokens	$15.00/百万Tokens	写入 5 min: $3.75/M 1 h: $6/M 命中: $0.3/M	200K tokens	平衡型
Anthropic	Claude Sonnet 3.7 / 3.5	$3.00/百万Tokens	$15.00/百万Tokens	同 Sonnet 4	200K tokens	旧版
Anthropic	Claude Haiku 3.5	$0.80/百万Tokens	$4.00/百万Tokens	写入 5 min: $1/M 1 h: $1.6/M 命中: $0.08/M	200K tokens	性价比最高
Anthropic	Claude Opus 3	$15.00/百万Tokens	$75.00/百万Tokens	同 Opus 4	200K tokens	旧旗舰
Anthropic	Claude Haiku 3	$0.25/百万Tokens	$1.25/百万Tokens	写入 5 min: $0.3/M 1 h: $0.5/M 命中: $0.03/M	200K tokens	旧版轻量
OpenAI	GPT-4o	$5.00/百万Tokens	$20.00/百万Tokens	缓存：$2.50/百万Tokens	128K tokens	多模态旗舰
OpenAI	GPT-4o mini	$0.60/百万Tokens	$2.40/百万Tokens	缓存：$0.30/百万Tokens	128K tokens	轻量版
OpenAI	o3	$2.00/百万Tokens	$8.00/百万Tokens	缓存：$0.50/百万Tokens	128K tokens	强化推理
OpenAI	o4-mini	$1.10/百万Tokens	$4.40/百万Tokens	缓存：$0.275/百万Tokens	128K tokens	经济型推理
DeepSeek	DeepSeek-Chat	¥0.50/百万Tokens（命中） / ¥2.00（未命中）	¥8.00/百万Tokens	优惠时段：命中 ¥0.25，未命中 ¥1.00	64K tokens	通用场景
DeepSeek	DeepSeek-Reasoner	¥1.00/百万Tokens（命中） / ¥4.00（未命中）	¥16.00/百万Tokens	优惠时段：命中 ¥0.25，未命中 ¥1.00	64K tokens	代码推理
通义千问	Qwen-Max	¥2.40/百万Tokens（输入）	¥9.60/百万Tokens（输出）	—	128K tokens	最强能力
通义千问	Qwen-Plus	¥0.80/百万Tokens（输入）	¥2.00/百万Tokens（输出）	—	128K tokens	均衡型
通义千问	Qwen-Turbo	¥0.30/百万Tokens（输入）	¥0.60/百万Tokens（输出）	—	1M tokens	极速响应
通义千问	Qwen-Long	¥0.50/百万Tokens（输入）	¥2.00/百万Tokens（输出）	支持 10 M token 上下文	超长文本	超长文本

阿里和DS都可以开发票，其它的不清楚

~~可能会有错误，仅供参考~~