Swape.AISwape.AI Docs

计费与定价

了解计费方式、查看定价信息并管理账户余额

OpenModel 采用按 Token 计费的模型。每次请求根据处理的 Token 数量收费,输入 Token 和输出 Token 分别按不同费率计算。

计费机制

按 Token 定价

每个模型有各自的输入 Token 和输出 Token 价格。费率由上游提供商定价和平台管理员配置的调整系数共同决定。

  • 输入 Token — 你的提示词、系统消息和上下文中包含的 Token
  • 输出 Token — 模型在响应中生成的 Token
  • 缓存读取 Token — 从 Prompt 缓存中读取的输入 Token(如适用,按较低费率计费)
  • 缓存写入 Token — 写入 Prompt 缓存的输入 Token(如适用,按单独费率计费)
  • 缓存写入 Token(1 小时 TTL) — 部分供应商(如 Anthropic)提供短时效的 Prompt 缓存(1 小时 TTL),其费率与标准缓存写入不同
  • 推理 Token — 对于支持链式推理的模型(如通过 Responses 协议),推理输出 Token 可能按独立于普通输出 Token 的费率计费

输入和输出 Token 的费率不同,通常输出 Token 的费用更高。当模型支持缓存或推理功能时,相关 Token 会单独计费。

价格显示

价格以 美元/百万 Token($/M tokens) 为单位显示。例如:

模型输入价格输出价格
gpt-4o$2.50/M$10.00/M
claude-sonnet-4-20250514$3.00/M$15.00/M
gemini-2.0-flash$0.10/M$0.40/M

实际价格可能有所不同,请在控制台或 API 中查看最新定价。

内部精度

在内部,OpenModel 使用 微美元(1 USD = 1,000,000 微美元)跟踪所有金额,以避免浮点数舍入误差。这对用户是透明的 — 控制台中所有金额均以美元显示。

阶梯定价

部分模型采用 阶梯定价,即每 Token 费率会根据请求中的 Token 数量发生变化。阶梯定价有两种模式:

阈值阶梯 — 当 Token 总量超过某个阈值时,所有 Token 按统一的新费率计算。例如,Anthropic 和 OpenAI 模型可能有 above_128k 阶梯,在输入总量超过 128,000 Token 时按不同费率计费。常见阈值还包括 above_200kabove_256k

范围阶梯 — 单次请求中不同范围的 Token 按不同费率计算(类似累进税率)。DashScope 模型采用此方式,使用多段定价。每个区间有各自的每 Token 费率。

阶梯定价由管理员按模型配置,并自动反映在费用计算中。你可以在控制台查看各模型的定价阶梯。

价格倍率

管理员可以为每个模型配置 价格倍率 来调整实际费率。此功能允许:

  • 折扣定价 — 倍率低于 1.0 可降低费用(如 0.8 = 八折)
  • 免费模型 — 倍率为 0 时该模型免费使用
  • 溢价定价 — 倍率高于 1.0 可提高费用

倍率应用于所有 Token 类型(输入、输出、缓存、推理)。请在控制台查看当前实际定价。

无最低消费

单次请求没有最低消费额。你只需为实际处理的 Token 付费。一个使用 50 个输入 Token 并收到 10 个输出 Token 的短请求,仅按这些 Token 计费。

计费去重

OpenModel 内置了去重机制以防止重复计费。如果请求在内部被重试(例如由于通道故障转移),你只会为成功的响应被计费一次。

查看定价

在控制台中

访问 控制台模型 页面,查看所有可用模型及其当前定价,包括输入和输出费率。

通过 API

通过模型端点以编程方式获取定价信息。此端点是公开的,无需认证:

curl "https://api.openmodel.ai/web/v1/models"

余额管理

查看余额

当前余额显示在控制台仪表盘中。你也可以通过 API 查询:

curl https://api.openmodel.ai/web/v1/self \
  -H "Authorization: Bearer $ACCESS_TOKEN"

响应中的 balance 字段以微美元为单位。请注意,你的 可用余额balance - frozen_balance — 冻结部分代表待处理退款申请所占用的金额。

余额不足

当余额不足以处理请求时,API 会返回 INSUFFICIENT_BALANCE 错误。HTTP 状态码取决于端点类型:

  • Web API/web/v1/*)— 返回 HTTP 400(Bad Request)
  • 代理端点/v1/responses/v1/messages/v1beta/models/*)— 返回 HTTP 402(Payment Required)

请在控制台充值后重试。

注册赠金

新用户可能会获得 注册赠金 — 注册时自动赠送的免费余额。赠金金额由平台管理员配置,可能因平台设置而异。

  • 注册赠金有 有效期限。如果在到期前未使用完毕,剩余金额将被自动回收。
  • 赠金到期或用完后,你需要充值才能继续使用 API。

请在控制台仪表盘查看当前余额和有效期信息。

充值

为账户充值:

  1. 登录 控制台
  2. 进入 充值 页面
  3. 选择充值金额
  4. 通过 Stripe Checkout 完成支付

支付通过 Stripe 安全处理。支付成功后余额立即更新。

退款

如果你需要退款:

  1. 进入控制台的 退款 页面
  2. 提交退款申请,填写金额和原因
  3. 申请的金额将在审核期间被冻结
  4. 管理员审核后批准或拒绝申请
  5. 批准后,金额将从余额中扣除并退还

你可以随时取消待审核的退款申请,被冻结的金额将立即释放。

消费追踪

控制台提供多种工具帮助你监控消费情况:

仪表盘

主仪表盘显示:

  • 当前余额 — 剩余资金
  • 总消费 — 累计花费
  • 请求数量 — 总 API 请求次数
  • Token 用量 — 累计输入和输出 Token 数
  • 消费趋势 — 按时间维度的消费变化(按小时或按天)
  • 模型统计 — 按模型分类的使用明细

用量页面

用量页面提供按 API Key 分类的使用统计,支持日期范围筛选。这有助于你了解哪些 API Key 消耗了最多资源。

消费日志

日志页面展示每条 API 请求的详细记录,包括:

  • 请求时间
  • 使用的模型
  • 输入和输出 Token 数量
  • 本次请求的费用
  • 使用的 API Key

你可以按模型、API Key 和日期范围筛选日志。

费用估算

在发送请求之前,你可以通过以下方式估算 Token 数量来预估费用:

  • 英文文本:大约每 4 个字符 1 个 Token,或每个单词约 0.75 个 Token
  • 代码:Token 密度因语言而异,但通常与英文文本相近
  • 中日韩文字:每个字符通常需要 1-2 个 Token

若需更精确的计数,使用 Token 计数端点:

curl https://api.openmodel.ai/v1/messages/count_tokens \
  -H "x-api-key: $OPENMODEL_API_KEY" \
  -H "Content-Type: application/json" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "claude-sonnet-4-20250514",
    "messages": [
      {"role": "user", "content": "你的提示词内容"}
    ]
  }'

最佳实践

  • 定期监控消费 — 经常查看控制台仪表盘,追踪使用趋势。
  • 选择合适的模型 — 为你的使用场景选择性价比最高的模型。简单任务使用小模型可以显著降低成本。
  • 优化提示词 — 更短、结构更好的提示词能减少输入 Token 费用。
  • 设置 API Key 配额 — 在控制台中配置单个 Key 的使用限额,防止意外超支。
  • 为不同项目使用独立的 API Key,以便分别追踪成本。
  • 缓存响应 — 如果你频繁发送相似的请求,尽可能缓存并复用响应。

On this page