LLM的API价格

下面是截止2025.7.3的一些主流LLM的API价格

厂商 模型名称 输入价格(标准) 输出价格(标准) 缓存/分段价格详情 上下文长度 特性说明
Google Gemini 2.5 Pro (≤200K) $1.25/百万Tokens $10.00/百万Tokens 缓存:$0.31/百万Tokens(context caching) 1M tokens 复杂推理、长提示处理
Google Gemini 2.5 Pro (>200K) $2.50/百万Tokens $15.00/百万Tokens 缓存:$0.625/百万Tokens 1M tokens 长提示处理
Google Gemini 2.5 Flash (文本) $0.30/百万Tokens $2.50/百万Tokens 缓存:$0.075/百万Tokens 1M tokens 轻量快速
Google Gemini 2.5 Flash (音频) $1.00/百万Tokens $2.50/百万Tokens 缓存:$0.25/百万Tokens 1M tokens 音频专用
Anthropic Claude Opus 4 $15.00/百万Tokens $75.00/百万Tokens 写入 5 min: $18.75/M
1 h: $30/M
命中: $1.5/M
200K tokens 旗舰模型
Anthropic Claude Sonnet 4 $3.00/百万Tokens $15.00/百万Tokens 写入 5 min: $3.75/M
1 h: $6/M
命中: $0.3/M
200K tokens 平衡型
Anthropic Claude Sonnet 3.7 / 3.5 $3.00/百万Tokens $15.00/百万Tokens 同 Sonnet 4 200K tokens 旧版
Anthropic Claude Haiku 3.5 $0.80/百万Tokens $4.00/百万Tokens 写入 5 min: $1/M
1 h: $1.6/M
命中: $0.08/M
200K tokens 性价比最高
Anthropic Claude Opus 3 $15.00/百万Tokens $75.00/百万Tokens 同 Opus 4 200K tokens 旧旗舰
Anthropic Claude Haiku 3 $0.25/百万Tokens $1.25/百万Tokens 写入 5 min: $0.3/M
1 h: $0.5/M
命中: $0.03/M
200K tokens 旧版轻量
OpenAI GPT-4o $5.00/百万Tokens $20.00/百万Tokens 缓存:$2.50/百万Tokens 128K tokens 多模态旗舰
OpenAI GPT-4o mini $0.60/百万Tokens $2.40/百万Tokens 缓存:$0.30/百万Tokens 128K tokens 轻量版
OpenAI o3 $2.00/百万Tokens $8.00/百万Tokens 缓存:$0.50/百万Tokens 128K tokens 强化推理
OpenAI o4-mini $1.10/百万Tokens $4.40/百万Tokens 缓存:$0.275/百万Tokens 128K tokens 经济型推理
DeepSeek DeepSeek-Chat ¥0.50/百万Tokens(命中) / ¥2.00(未命中) ¥8.00/百万Tokens 优惠时段:命中 ¥0.25,未命中 ¥1.00 64K tokens 通用场景
DeepSeek DeepSeek-Reasoner ¥1.00/百万Tokens(命中) / ¥4.00(未命中) ¥16.00/百万Tokens 优惠时段:命中 ¥0.25,未命中 ¥1.00 64K tokens 代码推理
通义千问 Qwen-Max ¥2.40/百万Tokens(输入) ¥9.60/百万Tokens(输出) 128K tokens 最强能力
通义千问 Qwen-Plus ¥0.80/百万Tokens(输入) ¥2.00/百万Tokens(输出) 128K tokens 均衡型
通义千问 Qwen-Turbo ¥0.30/百万Tokens(输入) ¥0.60/百万Tokens(输出) 1M tokens 极速响应
通义千问 Qwen-Long ¥0.50/百万Tokens(输入) ¥2.00/百万Tokens(输出) 支持 10 M token 上下文 超长文本 超长文本

阿里和DS都可以开发票,其它的不清楚

可能会有错误,仅供参考