计费说明
什么是 Token?
Token 是模型处理文本的基本单位。粗略理解:
- 1 个英文单词约等于 1 到 2 tokens
- 1 个中文字符约等于 1.5 到 2 tokens
如何计费?
Claude 模型的 Token 消耗分为四类:
| Token 类型 | 说明 |
|---|---|
| 输入 tokens | 你发送给模型的内容(提示词、代码、上下文等) |
| 输出 tokens | 模型生成的回复内容 |
| 缓存写入 tokens | 首次被缓存的输入内容(比标准输入贵,但后续复用可大幅节省) |
| 缓存读取 tokens | 从缓存命中的输入内容(价格远低于标准输入) |
完整计费公式:
费用 = 输入tokens × 输入价格
+ 输出tokens × 输出价格
+ 缓存写入tokens × 缓存写入价格
+ 缓存读取tokens × 缓存读取价格
关于缓存 在 Claude Code 等工具中,系统会自动管理上下文缓存。当你在同一个会话中持续对话时,大量输入内容会被缓存,后续请求的缓存读取 tokens 价格远低于普通输入,能显著降低费用。这也是为什么推荐在对应工具中使用对应分组——更容易命中缓存。
