Skip to content

第二十三章:成本实况——Claude Code 到底花多少钱

所有人都想问、却没有人诚实回答的问题:Claude Code 实际上要花多少钱?

产品页面展示套餐价格,博客文章介绍功能特性,但没有人公布真实用量数字。本章就来做这件事。这里的每一个数据都来自作者本人七周的真实使用数据——一位同时推进多个项目、高强度使用 Claude Code 的开发者。


理解定价模式

在看数据之前,先了解一下各种选项:

Pro 计划($20/月 ≈ ¥145/月) 对 Claude 模型的限速访问。适合偶尔使用 Claude Code 的开发者——每周几个小时。触及速率限制后需要等待。没有超额费用,没有意外惊喜。

Max 5 计划($100/月 ≈ ¥725/月) 比 Pro 更高的速率限制。面向全天候使用 Claude Code 但不运行大量并行任务的开发者。

Max 20 计划($200/月 ≈ ¥1,450/月) 最高的订阅层级。专为将 Claude Code 作为主要开发工具的开发者设计——高强度使用、多项目并发、并行 agent。下面的用量数据就来自这个计划。

API 直接计费($0 基础费 + 按 token 计费) 无订阅费,纯按量付费。每个 token 都要花钱。适合 CI/CD 流水线、自动化工作流,或使用频率低且不规律、订阅会造成浪费的场景。务必做好预算——无上限的用量可能非常昂贵。

Team/Enterprise(按席位计费) Team Standard 起价 $25/用户/月(按年计费),但 Claude Code 不包含在 Standard 席位中——需要 Team Premium 席位,价格更高。Enterprise 价格面议。两个层级都包含管理控制、审计日志和额外的安全功能。最新 Team Premium 价格请查看 claude.ai/pricing。一旦团队统一使用 Claude Code 且需要治理功能,就值得升级。


真实用量数据:Max 20 计划七周实录

以下是七周高强度使用 Claude Code 的真实数据,以 API 等价成本表示(即如果按 token 单独计费而非订阅的话,相同用量会花多少钱):

周次日期API 等价成本
W12026年2月9日–15日$147
W22026年2月16日–22日$243
W32026年2月23日–3月1日$621
W42026年3月2日–8日$705
W52026年3月9日–15日$1,065
W62026年3月16日–22日$211
W72026年3月23日–25日(不完整)$419
合计7周$3,412

按月统计:

  • 2026年2月: $991(≈ ¥7,185)
  • 2026年3月(25天): $2,421(≈ ¥17,550)
  • 合计: $3,412(≈ ¥24,735)

这期间的订阅成本:$400(≈ ¥2,900)(两个月 × $200/月)。

杠杆比例:8.5倍。每花一美元,消耗了价值 8.5 美元的 API 等价计算量。

解读规律

每周的用量差异显著,值得深入理解:

W1–W2($147、$243): 磨合期。配置工作流、养成习惯、会话较短。

W3–W4($621、$705): 全速运转。多个项目并发,并行 agent 运行,处理复杂任务的长时间会话。

W5 峰值($1,065): 最贵的一周。高强度开发:多个并行 agent 同时运行,大量使用 Opus 模型处理复杂推理任务,会话运行数小时且没有 compact。如果按 API 计费,这一周的成本超过 $1,000,而订阅计划下不会产生额外费用。

W6 骤降($211): 最可能的解释是触及了速率限制。在 W5 极度高强度使用后,用量被节流。这是订阅计划的典型模式——有上限,触及后吞吐量下降。

W7(3天 $419): 月末冲刺,恢复并再次高强度推进。

核心洞察:用量是爆发式的,而非线性的。 有些周很轻松,有些周非常密集。按 token 计费的模式会让密集那几周的成本高得令人望而却步。订阅计划吸收了这种波动。


Max 计划的杠杆计算

这个数学值得明确展示,因为数字相当惊人。

按 API 费率(2026年初的近似值):

  • Claude Sonnet 4.6:约 $3/百万输入 token,约 $15/百万输出 token
  • Claude Opus 4.6:约 $5/百万输入 token,约 $25/百万输出 token

高强度开发周——大文件反复读取、长时间代码生成会话、开启深度思考、多个并行 agent——可以消耗数千万 token。W5 的 $1,065 API 等价成本对于这种用量来说并不夸张。

Max 20 计划按月固定收费 $200(≈ ¥1,450)。这意味着:

月份API 等价用量计划成本杠杆
2月$991(≈ ¥7,185)$200(≈ ¥1,450)5.0x
3月(25天)$2,421(≈ ¥17,550)$200(≈ ¥1,450)12.1x

3月份,每花一美元就换回了十二美元的计算量。对于原本按 API 计费的开发者,Max 20 计划的盈亏平衡点大约在每月 $200 的 API 等价用量。超过这个数字,你获得的价值就越来越高。

结论直接明了:对于重度用户,Max 20 相对 API 计费而言定价明显偏低。 Anthropic 实际上在通过订阅计划补贴重度使用。随着计划迭代,这种情况未必会一直持续,但这是今天的现实。


什么最烧 Token

并非所有任务消耗的 token 量都相同。以下是根据真实经验总结的,消耗 token 速率最高的几种模式,由高到低排列:

1. 读取大文件 读取一个 2000 行的文件,每次访问都会向上下文注入数千个 token。如果 Claude 在一次会话中多次读取同一个大文件——调试跨文件问题时这很常见——这些 token 就会不断累积。读一个 500 行的文件三次,和读一次 1500 行的文件花费相同。

2. 使用 Opus 模型 Opus 每个 token 的成本约为 Sonnet 的 1.7 倍(输入:$5 vs $3,输出:$25 vs $15,每百万 token)。与旧版相比差距已显著缩小(Opus 4.1 曾是 Sonnet 的 5 倍)。但经过多次会话后,即使 1.7 倍的差距也会累积——而且 Opus 会话因更深度的推理往往会运行更久、消耗更多 token。能力差距是真实存在的,但把 Sonnet 完全能处理好的任务反射性地交给 Opus,仍然是不必要的成本来源。

3. 不做 /compact 的长时间会话 Claude Code 的上下文随着每次交互增长。每条新消息都包含完整的对话历史。一小时前开始的会话,经历了 50 轮交换后,每条新消息都要把前 50 轮的全部内容作为上下文发送。这很昂贵,而且通常不必要——早期的大部分上下文往往已经不再相关。

4. 并行子 agent 每个子 agent 从零开始,拥有自己的上下文。如果你派出 5 个并行 agent,你就在为 5 个独立的上下文窗口付费。这通常是合理的权衡——并行的价值值得这个成本——但重要的是要明白,并行 agent 是将 token 消耗成倍增加,而非共享。

不会大量消耗 token 的场景:

  • 简短、聚焦的问题与回答
  • Haiku 模型任务(日志 agent、查询、简单转换)
  • 提示词缓存命中——频繁复用的内容(如 CLAUDE.md)会被缓存,成本约为正常输入 token 价格的 10%
  • 保持专注且干净退出的短时间会话

真正有效的节省成本策略

这些技巧能在不显著降低效果的情况下降低成本:

对简单任务使用 /effort low 当你需要快速查找、简单重构或基本问题解答时,告诉 Claude 任务难度级别较低。这会传达深度推理不是必要的信号,并限制不必要的计算。

主动使用 /compact 不要等到上下文变得很大才操作。在从一个子任务切换到下一个时使用 /compact——完成调试会话之后,实现某个功能之后,开始新事项之前。用精简的摘要来延续上下文,远比携带完整对话历史便宜得多。

# 切换任务时
/compact

# 带特定关注点的 compact
/compact focus on the API schema changes we made

将 Sonnet 作为默认模型 Sonnet 能以高质量处理绝大多数真实开发任务——功能实现、bug 修复、代码审查、重构、测试编写。把 Opus 留给真正需要深度推理的任务:复杂架构决策、微妙的多系统调试、研究综合。一个简单的经验法则:如果你能写出清晰的任务描述,Sonnet 可能就够用了。

对执行简单工作的子 agent 使用 Haiku 并非每个 agent 都需要完整的 Sonnet 能力。如果你有一个 agent 在做日志记录、简单查找、格式化任务,或按照明确规则处理结构化数据,Haiku 既快又便宜,完全胜任。

bash
# 以编程方式派生 agent 时指定模型
claude --model haiku -p "Append this log entry to the journal file: ..."

在自动化中使用 --bare 模式 在脚本或 CI 流水线中非交互式地运行 Claude Code 时,--bare 模式会跳过交互式 UI 的加载开销。启动更快,浪费的 token 更少。

bash
claude --bare -p "Run the test suite and report failures"

写一个专注的 CLAUDE.md CLAUDE.md 的每一行都会在每次会话开始时加载到上下文中。一个包含过时备注、冗余说明和组织脚手架的 500 行 CLAUDE.md,比一个专注的 150 行版本每次会话要贵得多。定期审查你的 CLAUDE.md,删除不再有实际用处的内容。

.claudeignore 排除大型目录 如果你的项目包含 Claude 永远不需要读取的目录——构建输出、依赖目录、大型数据文件、生成的资产——明确排除它们。Claude 看不到它不知道的内容,但如果它探索项目结构,可能会意外读取大型目录。

# .claudeignore
node_modules/
dist/
build/
data/raw/
*.parquet
*.csv

应该选哪个计划?

一个实用的决策框架:

Pro($20/月 ≈ ¥145/月) 你偶尔借助 Claude Code——提问、审查代码、起草文档。每周不超过 5 小时。速率限制令人烦恼但不会阻碍工作。在你摸清自己用量之前,这是合适的起点。

Max 5($100/月 ≈ ¥725/月) 你全天候使用 Claude Code,但主要是专注型任务。每周 5–20 小时。你频繁触及 Pro 限制,想要消除这种烦恼。不运行并行 agent 或重型自动化工作流。

Max 20($200/月 ≈ ¥1,450/月) Claude Code 是你的主要开发工具。每周 20 小时以上,多个活跃项目,并行 agent 工作流,会话运行数小时。这是杠杆计算开始变得引人注目的层级。根据上面的数据,与 API 计费相比,盈亏平衡点大约在每月 $200 的 API 等价用量——而重度用户通常在当月第一周就会超过这个值。

API 直接计费(按量计费) 你在构建一个以编程方式调用 Claude Code 的产品。你有 CI/CD 流水线。你的用量是阵发性的、可预测的,不值得订阅。或者你想要对每个 token 有成本可见性和控制权。务必做好预算——在 Anthropic 控制台设置硬性限制。

Team/Enterprise(按席位计费) 团队中有多人定期使用 Claude Code。你需要管理控制、用量可见性或合规功能。请注意,使用 Claude Code 需要 Team Premium 席位——$25/用户/月的 Standard 层级不包含 Claude Code 访问权限。最新 Team Premium 价格请查看 claude.ai/pricing


监控你的用量

不要靠猜——要靠测量。这些工具为你提供可见性:

会话内成本追踪:

/cost

显示当前会话的 token 用量和成本。随时运行,了解当前状况。

套餐用量和限制:

/usage

显示你相对于套餐限制的当前用量。有助于了解距离速率限制上限还有多远。

用 ccusage 查看历史数据:

bash
# 当月每日明细
npx ccusage@latest daily

# 按模型拆分的周视图
npx ccusage@latest weekly --breakdown

# 会话级详情
npx ccusage@latest sessions

ccusage 读取你本地的 Claude Code 日志并生成用量报告。它不需要 API key——完全基于本地数据工作。安装一次,将其纳入每周回顾。

需要关注的数字: 每周 API 等价成本。如果你在 Max 20 上看到每周 $200 以上(≈ ¥1,450)的 API 等价成本,说明你获得了极好的杠杆。如果每周只有 $50,你可能在正确的计划上,或者可以考虑降到 Max 5。数据会告诉你答案。


诚实的总结

如果按 token 付费且高强度使用,Claude Code 很贵。对于运行并行 agent、多项目并发、长达数小时的会话的严肃开发者,按 API 费率的真实成本是每月数百到数千美元。

Max 20 订阅计划按数字来看,对重度用户而言是异常划算的——至少在 2026 年初是这样。在 $200/月(≈ ¥1,450/月)固定费用上实现 8 倍以上的杠杆,意味着你可以毫无顾虑地使用 Claude Code,而不用因担心成本而自我节制。这改变了工作心态:当任务值得时,你会选择更强大的模型;当并行 agent 有帮助时,你会去运行;你会让会话运行到它需要的时间。

这种杠杆能否随着 Anthropic 调整定价而持续,尚属未知。趁现在把握住它。


额外定价细节

除了核心订阅计划之外,有几个功能有各自的定价机制,会影响总成本:

长上下文定价 Claude Opus 4.6 和 Sonnet 4.6 以标准费率包含完整的 1M token 上下文窗口——无需额外付费。较旧的模型(Sonnet 4.5/4)在上下文超过 200K tokens 时收取 2 倍费率。

快速模式(Beta) Opus 4.6 提供快速模式,以 6 倍标准 token 价格实现约 6 倍更快的输出。适用于速度比成本更重要的场景——快速原型开发、时间敏感的调试。

提示缓存(Prompt Caching) Claude Code 自动缓存频繁重用的内容(CLAUDE.md、系统提示词)。缓存经济学:

  • 5 分钟缓存:写入成本为基础输入价格的 1.25 倍;读取成本为基础的 10%
  • 1 小时缓存:写入成本为基础输入价格的 2 倍;读取成本为基础的 10%

对于订阅用户,缓存自动生效,减少有效 token 消耗。对于 API 用户,它能显著降低重复工作流的成本。

代码执行(沙箱) 当 Claude 在沙箱环境中运行代码时:与网页搜索或网页获取一起使用时免费。否则,每月 1,550 个免费容器小时,之后每容器 $0.05/小时。

网页搜索(仅 API) API 上每 1,000 次搜索 $10。网页获取(web fetch)免费。订阅用户无需为网页搜索单独付费。

注意: 定价细节截至 2026 年初。最新费率请查看 platform.claude.com/docs/en/about-claude/pricing


下一步:附录 — Agent 参考、MCP 服务器注册表、性能基准和迁移指南。

Released under CC BY-SA 4.0.