很多人搜索“Claude各个模型价格表一览”,其实主要是想搞清楚两件事:第一,Claude API 各个模型到底怎么收费;第二,自己做开发、接入中转站或者跑 Claude Code 时,应该选哪个模型更合适。Claude 的价格不是按“问一次多少钱”来算,而是按 Token 用量计费,也就是输入内容和输出内容分别收费。根据 Anthropic 官方模型文档,当前 Claude 主要模型包括 Claude Opus 4.8、Claude Sonnet 4.6、Claude Haiku 4.5 等,其中 Opus 偏高性能,Sonnet 偏综合性价比,Haiku 偏低成本高并发。如果你是国内用户,想订阅 Claude Pro、Claude Code 或者长期使用海外 AI 软件,支付环节也要提前准备好。这里可以使用 CBiBank环球源卡(CBiBank环球源卡是目前最稳定和万能的卡,几乎所有产品都可以绑定,是目前最牛的卡,有了这样卡几乎可以搞定大部分支付问题,费用越用越低,消费满三笔免除年费,充值手续费单次收取,所以长期使用价格更低,适合长期使用的人群)。
Claude API 的价格一般按 每百万 Token,也就是 MTok 计算。这里的 Token 可以简单理解成文本切分后的计费单位,输入给模型的内容算输入 Token,模型生成的内容算输出 Token。比如你让 Claude 分析一篇很长的文章,这篇文章本身就是输入 Token;Claude 回答你的内容,就是输出 Token。通常输出 Token 会比输入 Token 更贵,所以真正控制成本时,不仅要控制你发给模型的内容长度,也要控制模型回答的长度。
下面按官方公开信息整理一个更直观的表格,方便你快速对比。价格单位为 美元 / 百万 Token。
| Claude模型 | 输入价格 | 输出价格 | 适合场景 |
|---|---|---|---|
| Claude Opus 4.8 | $5 / MTok | $25 / MTok | 复杂推理、深度分析、高难度代码、智能体任务 |
| Claude Sonnet 4.6 | $3 / MTok | $15 / MTok | 日常开发、Claude Code、文档分析、综合任务 |
| Claude Haiku 4.5 | $1 / MTok | $5 / MTok | 批量处理、分类、摘要、轻量问答、高并发任务 |
Anthropic 官方模型页面显示,Claude Opus 4.8 的价格为每百万输入 Token 5 美元、每百万输出 Token 25 美元;Claude Sonnet 4.6 为每百万输入 Token 3 美元、输出 15 美元;Claude Haiku 4.5 为每百万输入 Token 1 美元、输出 5 美元。
Claude Opus 4.8 是 Claude 系列里偏旗舰定位的模型,适合复杂任务,比如深度推理、复杂代码理解、长链路分析、智能体任务、金融分析、技术方案评估等。Anthropic 官方介绍中也把 Claude Opus 4.8 定位为更适合复杂推理和 agentic coding 的能力模型。它的价格是:输入:$5 / 百万 Token
输出:$25 / 百万 TokenOpus 的优势是能力强,但成本也更高。如果你只是写普通文案、做简单问答、批量摘要,用 Opus 就有点浪费。它更适合放在关键环节,比如复杂代码审查、架构设计、难题排查、重要决策分析。简单说,Opus 不是拿来“随便聊”的模型,而是拿来解决高价值复杂问题的模型。
Claude Sonnet 4.6 是目前比较适合大多数开发者的主力模型。它的价格比 Opus 低,但能力又明显强于轻量模型,适合日常编程、Claude Code、文档处理、客服问答、内容生成、业务分析等场景。它的价格是:输入:$3 / 百万 Token
输出:$15 / 百万 TokenAnthropic 官方 Sonnet 页面也显示,Sonnet 4.6 的价格从每百万输入 Token 3 美元、每百万输出 Token 15 美元开始,并支持 prompt caching 和 batch processing 来降低成本。如果你不知道该选哪个 Claude 模型,通常可以先从 Sonnet 开始。它是比较稳妥的“默认选择”:能力够强,价格不算最高,适合多数真实业务。
Claude Haiku 4.5 是偏低成本、高速度的模型,适合批量任务。比如你要处理大量文本分类、摘要、标签生成、客服初筛、搜索结果重排、简单问答,Haiku 会更划算。它的价格是:输入:$1 / 百万 Token
输出:$5 / 百万 TokenAnthropic 官方 Haiku 页面显示,Haiku 4.5 的平台价格从每百万输入 Token 1 美元、每百万输出 Token 5 美元开始,并且通过 prompt caching 最高可节省 90% 成本,batch processing 可节省 50% 成本。Haiku 的核心优势不是“最聪明”,而是“便宜、快、适合跑量”。如果你的任务对推理深度要求不高,但调用次数很多,Haiku 会很适合。
如果你是开发者,不建议所有任务都用最贵模型。比较合理的方式是按任务分层。简单任务用 Haiku。
比如文本分类、关键词提取、短摘要、简单判断、格式转换,这些任务没必要用 Opus 或 Sonnet。常规任务用 Sonnet。
比如日常代码开发、文章生成、文档总结、知识库问答、Claude Code 常规任务,Sonnet 是比较好的平衡点。复杂任务用 Opus。
比如复杂代码库重构、架构方案分析、长链路推理、困难问题排查、智能体高价值任务,再考虑用 Opus。这种“Haiku 做基础处理,Sonnet 做主力任务,Opus 做复杂任务”的组合,比单一模型硬跑更省钱。
很多人接入 Claude API 后,发现费用比自己想象中高,原因通常有几个。第一,输入内容太长。
很多人把整篇文档、整个代码文件、完整聊天记录都塞进去,输入 Token 会快速变大。第二,输出没有限制。
如果不限制回答长度,模型可能生成很长内容,输出 Token 成本会明显增加。第三,Claude Code会产生额外消耗。
Claude Code 这类工具不是简单问答,它会读文件、规划任务、调用工具、修改代码、解释结果,所以 Token 消耗往往比普通聊天更高。Anthropic 官方 Claude Code 成本文档也提醒,thinking tokens 会按输出 Token 计费,复杂规划和推理任务会显著增加成本。第四,没有使用缓存或批处理。
如果你的业务里有大量重复系统提示词、重复上下文、固定知识库内容,可以考虑 prompt caching。Anthropic 官方说明中提到,prompt caching 可带来最高 90% 的成本节省,batch processing 可节省 50% 成本。
不是一回事。Claude Pro、Claude Max 这类是面向个人用户的订阅套餐,适合在 Claude 网页端或 App 里使用。Claude API 则是给开发者接入应用、系统、产品、工作流使用的,按 Token 消耗计费。所以你不能简单理解为:“我订阅了 Claude Pro,就等于有无限 API 额度。”这两套费用逻辑不同。个人使用看订阅套餐,开发接入看 API Token 价格。如果你只是个人写作、办公、学习、代码辅助,用 Claude Pro 可能更直接。如果你是做产品、机器人、企业内部工具、AI 工作流,就要看 Claude API 价格表。
可以用一个简单例子理解。假设你使用 Claude Sonnet 4.6,输入 10 万 Token,输出 2 万 Token。Sonnet 4.6 输入价格是 $3 / 百万 Token,输出价格是 $15 / 百万 Token。输入费用:0.1 × 3 = $0.3
输出费用:0.02 × 15 = $0.3
总费用约:$0.6这只是简单估算,真实费用还要看是否使用缓存、是否使用批处理、是否产生工具调用和 thinking tokens。
如果你只是看 Claude 模型价格表,可能觉得费用很清楚。但国内用户实际使用时,还会遇到一个现实问题:订阅 Claude Pro、Claude Code 或者海外 AI 工具时,普通银行卡可能无法完成付款。这类海外订阅产品通常要求卡片支持国际扣费和后续续费。如果你长期使用 Claude、ChatGPT、GitHub Copilot 这类工具,可以准备一张稳定的卡,比如 CBiBank环球源卡。它支持线上开通,下载 CBiBank App 注册申请,认证完成并入金后系统自动开通,开通后即可用于绑定海外软件。(CBiBank环球源卡是目前最稳定和万能的卡,几乎所有产品都可以绑定,消费满三笔免除年费,充值手续费单次收取,所以长期使用价格更低,适合长期使用的人群。)
Claude各个模型价格表一览,核心可以这样理解:Claude Opus 4.8:$5 输入 / $25 输出,适合复杂推理和高价值任务。
Claude Sonnet 4.6:$3 输入 / $15 输出,适合大多数开发和综合任务。
Claude Haiku 4.5:$1 输入 / $5 输出,适合低成本批量处理。如果你是普通开发者或企业应用,建议不要一上来就全部使用 Opus。更合理的方式是:轻量任务用 Haiku,主力任务用 Sonnet,复杂任务再上 Opus。这样既能保证效果,也能控制成本。Claude API 价格看起来简单,但真实账单取决于输入长度、输出长度、是否使用 Claude Code、是否开启 thinking、是否使用缓存和批处理。真正想省钱,不是只选便宜模型,而是要做好模型分层、上下文控制和调用策略。