CC BY 4.0 (除特别声明或转载文章外)
下面是截止2025.7.3的一些主流LLM的API价格
厂商 | 模型名称 | 输入价格(标准) | 输出价格(标准) | 缓存/分段价格详情 | 上下文长度 | 特性说明 |
---|---|---|---|---|---|---|
Gemini 2.5 Pro (≤200K) | $1.25/百万Tokens | $10.00/百万Tokens | 缓存:$0.31/百万Tokens(context caching) | 1M tokens | 复杂推理、长提示处理 | |
Gemini 2.5 Pro (>200K) | $2.50/百万Tokens | $15.00/百万Tokens | 缓存:$0.625/百万Tokens | 1M tokens | 长提示处理 | |
Gemini 2.5 Flash (文本) | $0.30/百万Tokens | $2.50/百万Tokens | 缓存:$0.075/百万Tokens | 1M tokens | 轻量快速 | |
Gemini 2.5 Flash (音频) | $1.00/百万Tokens | $2.50/百万Tokens | 缓存:$0.25/百万Tokens | 1M tokens | 音频专用 | |
Anthropic | Claude Opus 4 | $15.00/百万Tokens | $75.00/百万Tokens | 写入 5 min: $18.75/M 1 h: $30/M 命中: $1.5/M |
200K tokens | 旗舰模型 |
Anthropic | Claude Sonnet 4 | $3.00/百万Tokens | $15.00/百万Tokens | 写入 5 min: $3.75/M 1 h: $6/M 命中: $0.3/M |
200K tokens | 平衡型 |
Anthropic | Claude Sonnet 3.7 / 3.5 | $3.00/百万Tokens | $15.00/百万Tokens | 同 Sonnet 4 | 200K tokens | 旧版 |
Anthropic | Claude Haiku 3.5 | $0.80/百万Tokens | $4.00/百万Tokens | 写入 5 min: $1/M 1 h: $1.6/M 命中: $0.08/M |
200K tokens | 性价比最高 |
Anthropic | Claude Opus 3 | $15.00/百万Tokens | $75.00/百万Tokens | 同 Opus 4 | 200K tokens | 旧旗舰 |
Anthropic | Claude Haiku 3 | $0.25/百万Tokens | $1.25/百万Tokens | 写入 5 min: $0.3/M 1 h: $0.5/M 命中: $0.03/M |
200K tokens | 旧版轻量 |
OpenAI | GPT-4o | $5.00/百万Tokens | $20.00/百万Tokens | 缓存:$2.50/百万Tokens | 128K tokens | 多模态旗舰 |
OpenAI | GPT-4o mini | $0.60/百万Tokens | $2.40/百万Tokens | 缓存:$0.30/百万Tokens | 128K tokens | 轻量版 |
OpenAI | o3 | $2.00/百万Tokens | $8.00/百万Tokens | 缓存:$0.50/百万Tokens | 128K tokens | 强化推理 |
OpenAI | o4-mini | $1.10/百万Tokens | $4.40/百万Tokens | 缓存:$0.275/百万Tokens | 128K tokens | 经济型推理 |
DeepSeek | DeepSeek-Chat | ¥0.50/百万Tokens(命中) / ¥2.00(未命中) | ¥8.00/百万Tokens | 优惠时段:命中 ¥0.25,未命中 ¥1.00 | 64K tokens | 通用场景 |
DeepSeek | DeepSeek-Reasoner | ¥1.00/百万Tokens(命中) / ¥4.00(未命中) | ¥16.00/百万Tokens | 优惠时段:命中 ¥0.25,未命中 ¥1.00 | 64K tokens | 代码推理 |
通义千问 | Qwen-Max | ¥2.40/百万Tokens(输入) | ¥9.60/百万Tokens(输出) | — | 128K tokens | 最强能力 |
通义千问 | Qwen-Plus | ¥0.80/百万Tokens(输入) | ¥2.00/百万Tokens(输出) | — | 128K tokens | 均衡型 |
通义千问 | Qwen-Turbo | ¥0.30/百万Tokens(输入) | ¥0.60/百万Tokens(输出) | — | 1M tokens | 极速响应 |
通义千问 | Qwen-Long | ¥0.50/百万Tokens(输入) | ¥2.00/百万Tokens(输出) | 支持 10 M token 上下文 | 超长文本 | 超长文本 |
阿里和DS都可以开发票,其它的不清楚
可能会有错误,仅供参考