第二十三章：成本实况——Claude Code 到底花多少钱

所有人都想问、却没有人诚实回答的问题：Claude Code 实际上要花多少钱？

产品页面展示套餐价格，博客文章介绍功能特性，但没有人公布真实用量数字。本章就来做这件事。这里的每一个数据都来自作者本人七周的真实使用数据——一位同时推进多个项目、高强度使用 Claude Code 的开发者。

理解定价模式

在看数据之前，先了解一下各种选项：

Pro 计划（$20/月 ≈ ¥145/月） 对 Claude 模型的限速访问。适合偶尔使用 Claude Code 的开发者——每周几个小时。触及速率限制后需要等待。没有超额费用，没有意外惊喜。

Max 5 计划（$100/月 ≈ ¥725/月） 比 Pro 更高的速率限制。面向全天候使用 Claude Code 但不运行大量并行任务的开发者。

Max 20 计划（$200/月 ≈ ¥1,450/月） 最高的订阅层级。专为将 Claude Code 作为主要开发工具的开发者设计——高强度使用、多项目并发、并行 agent。下面的用量数据就来自这个计划。

API 直接计费（$0 基础费 + 按 token 计费） 无订阅费，纯按量付费。每个 token 都要花钱。适合 CI/CD 流水线、自动化工作流，或使用频率低且不规律、订阅会造成浪费的场景。务必做好预算——无上限的用量可能非常昂贵。

Team/Enterprise（按席位计费） Team Standard 起价 $25/用户/月（按年计费），但 Claude Code 不包含在 Standard 席位中——需要 Team Premium 席位，价格更高。Enterprise 价格面议。两个层级都包含管理控制、审计日志和额外的安全功能。最新 Team Premium 价格请查看 claude.ai/pricing。一旦团队统一使用 Claude Code 且需要治理功能，就值得升级。

真实用量数据：Max 20 计划七周实录

以下是七周高强度使用 Claude Code 的真实数据，以 API 等价成本表示（即如果按 token 单独计费而非订阅的话，相同用量会花多少钱）：

周次	日期	API 等价成本
W1	2026年2月9日–15日	$147
W2	2026年2月16日–22日	$243
W3	2026年2月23日–3月1日	$621
W4	2026年3月2日–8日	$705
W5	2026年3月9日–15日	$1,065
W6	2026年3月16日–22日	$211
W7	2026年3月23日–25日（不完整）	$419
合计	7周	$3,412

按月统计：

2026年2月： $991（≈ ¥7,185）
2026年3月（25天）： $2,421（≈ ¥17,550）
合计： $3,412（≈ ¥24,735）

这期间的订阅成本：$400（≈ ¥2,900）（两个月 × $200/月）。

杠杆比例：8.5倍。每花一美元，消耗了价值 8.5 美元的 API 等价计算量。

解读规律

每周的用量差异显著，值得深入理解：

W1–W2（$147、$243）： 磨合期。配置工作流、养成习惯、会话较短。

W3–W4（$621、$705）： 全速运转。多个项目并发，并行 agent 运行，处理复杂任务的长时间会话。

W5 峰值（$1,065）： 最贵的一周。高强度开发：多个并行 agent 同时运行，大量使用 Opus 模型处理复杂推理任务，会话运行数小时且没有 compact。如果按 API 计费，这一周的成本超过 $1,000，而订阅计划下不会产生额外费用。

W6 骤降（$211）： 最可能的解释是触及了速率限制。在 W5 极度高强度使用后，用量被节流。这是订阅计划的典型模式——有上限，触及后吞吐量下降。

W7（3天 $419）： 月末冲刺，恢复并再次高强度推进。

核心洞察：用量是爆发式的，而非线性的。 有些周很轻松，有些周非常密集。按 token 计费的模式会让密集那几周的成本高得令人望而却步。订阅计划吸收了这种波动。

Max 计划的杠杆计算

这个数学值得明确展示，因为数字相当惊人。

按 API 费率（2026年初的近似值）：

Claude Sonnet 4.6：约 $3/百万输入 token，约 $15/百万输出 token
Claude Opus 4.6：约 $5/百万输入 token，约 $25/百万输出 token

高强度开发周——大文件反复读取、长时间代码生成会话、开启深度思考、多个并行 agent——可以消耗数千万 token。W5 的 $1,065 API 等价成本对于这种用量来说并不夸张。

Max 20 计划按月固定收费 $200（≈ ¥1,450）。这意味着：

月份	API 等价用量	计划成本	杠杆
2月	$991（≈ ¥7,185）	$200（≈ ¥1,450）	5.0x
3月（25天）	$2,421（≈ ¥17,550）	$200（≈ ¥1,450）	12.1x

3月份，每花一美元就换回了十二美元的计算量。对于原本按 API 计费的开发者，Max 20 计划的盈亏平衡点大约在每月 $200 的 API 等价用量。超过这个数字，你获得的价值就越来越高。

结论直接明了：对于重度用户，Max 20 相对 API 计费而言定价明显偏低。 Anthropic 实际上在通过订阅计划补贴重度使用。随着计划迭代，这种情况未必会一直持续，但这是今天的现实。

什么最烧 Token

并非所有任务消耗的 token 量都相同。以下是根据真实经验总结的，消耗 token 速率最高的几种模式，由高到低排列：

1. 读取大文件 读取一个 2000 行的文件，每次访问都会向上下文注入数千个 token。如果 Claude 在一次会话中多次读取同一个大文件——调试跨文件问题时这很常见——这些 token 就会不断累积。读一个 500 行的文件三次，和读一次 1500 行的文件花费相同。

2. 使用 Opus 模型 Opus 每个 token 的成本约为 Sonnet 的 1.7 倍（输入：$5 vs $3，输出：$25 vs $15，每百万 token）。与旧版相比差距已显著缩小（Opus 4.1 曾是 Sonnet 的 5 倍）。但经过多次会话后，即使 1.7 倍的差距也会累积——而且 Opus 会话因更深度的推理往往会运行更久、消耗更多 token。能力差距是真实存在的，但把 Sonnet 完全能处理好的任务反射性地交给 Opus，仍然是不必要的成本来源。

3. 不做 /compact 的长时间会话 Claude Code 的上下文随着每次交互增长。每条新消息都包含完整的对话历史。一小时前开始的会话，经历了 50 轮交换后，每条新消息都要把前 50 轮的全部内容作为上下文发送。这很昂贵，而且通常不必要——早期的大部分上下文往往已经不再相关。

4. 并行子 agent 每个子 agent 从零开始，拥有自己的上下文。如果你派出 5 个并行 agent，你就在为 5 个独立的上下文窗口付费。这通常是合理的权衡——并行的价值值得这个成本——但重要的是要明白，并行 agent 是将 token 消耗成倍增加，而非共享。

不会大量消耗 token 的场景：

简短、聚焦的问题与回答
Haiku 模型任务（日志 agent、查询、简单转换）
提示词缓存命中——频繁复用的内容（如 CLAUDE.md）会被缓存，成本约为正常输入 token 价格的 10%
保持专注且干净退出的短时间会话

真正有效的节省成本策略

这些技巧能在不显著降低效果的情况下降低成本：

对简单任务使用 /effort low 当你需要快速查找、简单重构或基本问题解答时，告诉 Claude 任务难度级别较低。这会传达深度推理不是必要的信号，并限制不必要的计算。

主动使用 /compact 不要等到上下文变得很大才操作。在从一个子任务切换到下一个时使用 /compact——完成调试会话之后，实现某个功能之后，开始新事项之前。用精简的摘要来延续上下文，远比携带完整对话历史便宜得多。

# 切换任务时
/compact

# 带特定关注点的 compact
/compact focus on the API schema changes we made

将 Sonnet 作为默认模型 Sonnet 能以高质量处理绝大多数真实开发任务——功能实现、bug 修复、代码审查、重构、测试编写。把 Opus 留给真正需要深度推理的任务：复杂架构决策、微妙的多系统调试、研究综合。一个简单的经验法则：如果你能写出清晰的任务描述，Sonnet 可能就够用了。

对执行简单工作的子 agent 使用 Haiku 并非每个 agent 都需要完整的 Sonnet 能力。如果你有一个 agent 在做日志记录、简单查找、格式化任务，或按照明确规则处理结构化数据，Haiku 既快又便宜，完全胜任。

bash

# 以编程方式派生 agent 时指定模型
claude --model haiku -p "Append this log entry to the journal file: ..."

在自动化中使用 --bare 模式 在脚本或 CI 流水线中非交互式地运行 Claude Code 时，--bare 模式会跳过交互式 UI 的加载开销。启动更快，浪费的 token 更少。

bash

claude --bare -p "Run the test suite and report failures"

写一个专注的 CLAUDE.md CLAUDE.md 的每一行都会在每次会话开始时加载到上下文中。一个包含过时备注、冗余说明和组织脚手架的 500 行 CLAUDE.md，比一个专注的 150 行版本每次会话要贵得多。定期审查你的 CLAUDE.md，删除不再有实际用处的内容。

用 .claudeignore 排除大型目录 如果你的项目包含 Claude 永远不需要读取的目录——构建输出、依赖目录、大型数据文件、生成的资产——明确排除它们。Claude 看不到它不知道的内容，但如果它探索项目结构，可能会意外读取大型目录。

# .claudeignore
node_modules/
dist/
build/
data/raw/
*.parquet
*.csv

应该选哪个计划？

一个实用的决策框架：

Pro（$20/月 ≈ ¥145/月） 你偶尔借助 Claude Code——提问、审查代码、起草文档。每周不超过 5 小时。速率限制令人烦恼但不会阻碍工作。在你摸清自己用量之前，这是合适的起点。

Max 5（$100/月 ≈ ¥725/月） 你全天候使用 Claude Code，但主要是专注型任务。每周 5–20 小时。你频繁触及 Pro 限制，想要消除这种烦恼。不运行并行 agent 或重型自动化工作流。

Max 20（$200/月 ≈ ¥1,450/月） Claude Code 是你的主要开发工具。每周 20 小时以上，多个活跃项目，并行 agent 工作流，会话运行数小时。这是杠杆计算开始变得引人注目的层级。根据上面的数据，与 API 计费相比，盈亏平衡点大约在每月 $200 的 API 等价用量——而重度用户通常在当月第一周就会超过这个值。

API 直接计费（按量计费） 你在构建一个以编程方式调用 Claude Code 的产品。你有 CI/CD 流水线。你的用量是阵发性的、可预测的，不值得订阅。或者你想要对每个 token 有成本可见性和控制权。务必做好预算——在 Anthropic 控制台设置硬性限制。

Team/Enterprise（按席位计费） 团队中有多人定期使用 Claude Code。你需要管理控制、用量可见性或合规功能。请注意，使用 Claude Code 需要 Team Premium 席位——$25/用户/月的 Standard 层级不包含 Claude Code 访问权限。最新 Team Premium 价格请查看 claude.ai/pricing。

监控你的用量

不要靠猜——要靠测量。这些工具为你提供可见性：

会话内成本追踪：

/cost

显示当前会话的 token 用量和成本。随时运行，了解当前状况。

套餐用量和限制：

/usage

显示你相对于套餐限制的当前用量。有助于了解距离速率限制上限还有多远。

用 ccusage 查看历史数据：

bash

# 当月每日明细
npx ccusage@latest daily

# 按模型拆分的周视图
npx ccusage@latest weekly --breakdown

# 会话级详情
npx ccusage@latest sessions

ccusage 读取你本地的 Claude Code 日志并生成用量报告。它不需要 API key——完全基于本地数据工作。安装一次，将其纳入每周回顾。

需要关注的数字： 每周 API 等价成本。如果你在 Max 20 上看到每周 $200 以上（≈ ¥1,450）的 API 等价成本，说明你获得了极好的杠杆。如果每周只有 $50，你可能在正确的计划上，或者可以考虑降到 Max 5。数据会告诉你答案。

诚实的总结

如果按 token 付费且高强度使用，Claude Code 很贵。对于运行并行 agent、多项目并发、长达数小时的会话的严肃开发者，按 API 费率的真实成本是每月数百到数千美元。

Max 20 订阅计划按数字来看，对重度用户而言是异常划算的——至少在 2026 年初是这样。在 $200/月（≈ ¥1,450/月）固定费用上实现 8 倍以上的杠杆，意味着你可以毫无顾虑地使用 Claude Code，而不用因担心成本而自我节制。这改变了工作心态：当任务值得时，你会选择更强大的模型；当并行 agent 有帮助时，你会去运行；你会让会话运行到它需要的时间。

这种杠杆能否随着 Anthropic 调整定价而持续，尚属未知。趁现在把握住它。

额外定价细节

除了核心订阅计划之外，有几个功能有各自的定价机制，会影响总成本：

长上下文定价 Claude Opus 4.6 和 Sonnet 4.6 以标准费率包含完整的 1M token 上下文窗口——无需额外付费。较旧的模型（Sonnet 4.5/4）在上下文超过 200K tokens 时收取 2 倍费率。

快速模式（Beta） Opus 4.6 提供快速模式，以 6 倍标准 token 价格实现约 6 倍更快的输出。适用于速度比成本更重要的场景——快速原型开发、时间敏感的调试。

提示缓存（Prompt Caching） Claude Code 自动缓存频繁重用的内容（CLAUDE.md、系统提示词）。缓存经济学：

5 分钟缓存：写入成本为基础输入价格的 1.25 倍；读取成本为基础的 10%
1 小时缓存：写入成本为基础输入价格的 2 倍；读取成本为基础的 10%

对于订阅用户，缓存自动生效，减少有效 token 消耗。对于 API 用户，它能显著降低重复工作流的成本。

代码执行（沙箱） 当 Claude 在沙箱环境中运行代码时：与网页搜索或网页获取一起使用时免费。否则，每月 1,550 个免费容器小时，之后每容器 $0.05/小时。

网页搜索（仅 API） API 上每 1,000 次搜索 $10。网页获取（web fetch）免费。订阅用户无需为网页搜索单独付费。

注意： 定价细节截至 2026 年初。最新费率请查看 platform.claude.com/docs/en/about-claude/pricing。

下一步：附录 — Agent 参考、MCP 服务器注册表、性能基准和迁移指南。

第二十三章：成本实况——Claude Code 到底花多少钱 ​

理解定价模式 ​

真实用量数据：Max 20 计划七周实录 ​

解读规律 ​

Max 计划的杠杆计算 ​

什么最烧 Token ​

真正有效的节省成本策略 ​

应该选哪个计划？ ​

监控你的用量 ​

诚实的总结 ​

额外定价细节 ​

第二十三章：成本实况——Claude Code 到底花多少钱

理解定价模式

真实用量数据：Max 20 计划七周实录

解读规律

Max 计划的杠杆计算

什么最烧 Token

真正有效的节省成本策略

应该选哪个计划？

监控你的用量

诚实的总结

额外定价细节