← 返回博客列表

如何精准计算大模型API成本?Token 完全指南(2026版)

发布于 2026/6/6
Token计算成本控制API教程

什么是 Token?

Token 是大模型处理的最小文本单位:

如何统计 Token 数?

方法一:Tiktoken(OpenAI)

pip install tiktoken
import tiktoken
enc = tiktoken.encoding_for_model("gpt-4o")
tokens = enc.encode("你好,世界!")
print(len(tokens))  # 7

方法二:TokenCost 计算器

在 TokenCost 首页直接输入 Prompt,自动统计各模型的 Token 消耗和费用预估。

成本计算公式

总成本 = (输入Token / 1,000,000) × 输入单价
       + (输出Token / 1,000,000) × 输出单价

# 示例: GPT-4o, 输入1000 Token, 输出500 Token
= (1000/1M)×¥18.13 + (500/1M)×¥72.50
= ¥0.054/次
= ¥16,200/月 (每天1万次)

降低 Token 成本的 5 个技巧

  1. 精简 Prompt:删除不必要的描述
  2. 用系统 Prompt 缓存:可省 50-95%
  3. 选择合适的模型:简单任务用 Flash/mini
  4. 控制输出长度:用 max_tokens 限制
  5. 批量处理:Batch API 享 50% 折扣