计费与定价

OpenModel 采用按 Token 计费的模型。每次请求根据处理的 Token 数量收费，输入 Token 和输出 Token 分别按不同费率计算。

计费机制

按 Token 定价

每个模型有各自的输入 Token 和输出 Token 价格。费率由上游提供商定价和平台管理员配置的调整系数共同决定。

输入 Token — 你的提示词、系统消息和上下文中包含的 Token
输出 Token — 模型在响应中生成的 Token
缓存读取 Token — 从 Prompt 缓存中读取的输入 Token（如适用，按较低费率计费）
缓存写入 Token — 写入 Prompt 缓存的输入 Token（如适用，按单独费率计费）
缓存写入 Token（1 小时 TTL） — 部分供应商（如 Anthropic）提供短时效的 Prompt 缓存（1 小时 TTL），其费率与标准缓存写入不同
推理 Token — 对于支持链式推理的模型（如通过 Responses 协议），推理输出 Token 可能按独立于普通输出 Token 的费率计费

输入和输出 Token 的费率不同，通常输出 Token 的费用更高。当模型支持缓存或推理功能时，相关 Token 会单独计费。

价格显示

价格以 美元/百万 Token（$/M tokens） 为单位显示。例如：

模型	输入价格	输出价格
gpt-4o	$2.50/M	$10.00/M
claude-sonnet-4-20250514	$3.00/M	$15.00/M
gemini-2.0-flash	$0.10/M	$0.40/M

实际价格可能有所不同，请在控制台或 API 中查看最新定价。

内部精度

在内部，OpenModel 使用 微美元（1 USD = 1,000,000 微美元）跟踪所有金额，以避免浮点数舍入误差。这对用户是透明的 — 控制台中所有金额均以美元显示。

阶梯定价

部分模型采用 阶梯定价，即每 Token 费率会根据请求中的 Token 数量发生变化。阶梯定价有两种模式：

阈值阶梯 — 当 Token 总量超过某个阈值时，所有 Token 按统一的新费率计算。例如，Anthropic 和 OpenAI 模型可能有 above_128k 阶梯，在输入总量超过 128,000 Token 时按不同费率计费。常见阈值还包括 above_200k 和 above_256k。

范围阶梯 — 单次请求中不同范围的 Token 按不同费率计算（类似累进税率）。DashScope 模型采用此方式，使用多段定价。每个区间有各自的每 Token 费率。

阶梯定价由管理员按模型配置，并自动反映在费用计算中。你可以在控制台查看各模型的定价阶梯。

价格倍率

管理员可以为每个模型配置 价格倍率 来调整实际费率。此功能允许：

折扣定价 — 倍率低于 1.0 可降低费用（如 0.8 = 八折）
免费模型 — 倍率为 0 时该模型免费使用
溢价定价 — 倍率高于 1.0 可提高费用

倍率应用于所有 Token 类型（输入、输出、缓存、推理）。请在控制台查看当前实际定价。

无最低消费

单次请求没有最低消费额。你只需为实际处理的 Token 付费。一个使用 50 个输入 Token 并收到 10 个输出 Token 的短请求，仅按这些 Token 计费。

计费去重

OpenModel 内置了去重机制以防止重复计费。如果请求在内部被重试（例如由于通道故障转移），你只会为成功的响应被计费一次。

查看定价

在控制台中

访问控制台的模型页面，查看所有可用模型及其当前定价，包括输入和输出费率。

通过 API

通过模型端点以编程方式获取定价信息。此端点是公开的，无需认证：

curl "https://api.openmodel.ai/web/v1/models"

余额管理

查看余额

当前余额显示在控制台仪表盘中。你也可以通过 API 查询：

curl https://api.openmodel.ai/web/v1/self \
  -H "Authorization: Bearer $ACCESS_TOKEN"

响应中的 balance 字段以微美元为单位。请注意，你的 可用余额 为 balance - frozen_balance — 冻结部分代表待处理退款申请所占用的金额。

余额不足

当余额不足以处理请求时，API 会返回 INSUFFICIENT_BALANCE 错误。HTTP 状态码取决于端点类型：

Web API（ /web/v1/*）— 返回 HTTP 400（Bad Request）
代理端点（ /v1/responses、 /v1/messages、 /v1beta/models/*）— 返回 HTTP 402（Payment Required）

请在控制台充值后重试。

注册赠金

新用户可能会获得 注册赠金 — 注册时自动赠送的免费余额。赠金金额由平台管理员配置，可能因平台设置而异。

注册赠金有 有效期限。如果在到期前未使用完毕，剩余金额将被自动回收。
赠金到期或用完后，你需要充值才能继续使用 API。

请在控制台仪表盘查看当前余额和有效期信息。

充值

为账户充值：

登录控制台
进入充值页面
选择充值金额
通过 Stripe Checkout 完成支付

支付通过 Stripe 安全处理。支付成功后余额立即更新。

退款

如果你需要退款：

进入控制台的退款页面
提交退款申请，填写金额和原因
申请的金额将在审核期间被冻结
管理员审核后批准或拒绝申请
批准后，金额将从余额中扣除并退还

你可以随时取消待审核的退款申请，被冻结的金额将立即释放。

消费追踪

控制台提供多种工具帮助你监控消费情况：

仪表盘

主仪表盘显示：

当前余额 — 剩余资金
总消费 — 累计花费
请求数量 — 总 API 请求次数
Token 用量 — 累计输入和输出 Token 数
消费趋势 — 按时间维度的消费变化（按小时或按天）
模型统计 — 按模型分类的使用明细

用量页面

用量页面提供按 API Key 分类的使用统计，支持日期范围筛选。这有助于你了解哪些 API Key 消耗了最多资源。

消费日志

日志页面展示每条 API 请求的详细记录，包括：

请求时间
使用的模型
输入和输出 Token 数量
本次请求的费用
使用的 API Key

你可以按模型、API Key 和日期范围筛选日志。

费用估算

在发送请求之前，你可以通过以下方式估算 Token 数量来预估费用：

英文文本：大约每 4 个字符 1 个 Token，或每个单词约 0.75 个 Token
代码：Token 密度因语言而异，但通常与英文文本相近
中日韩文字：每个字符通常需要 1-2 个 Token

若需更精确的计数，使用 Token 计数端点：

curl https://api.openmodel.ai/v1/messages/count_tokens \
  -H "x-api-key: $OPENMODEL_API_KEY" \
  -H "Content-Type: application/json" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "model": "claude-sonnet-4-20250514",
    "messages": [
      {"role": "user", "content": "你的提示词内容"}
    ]
  }'

最佳实践

定期监控消费 — 经常查看控制台仪表盘，追踪使用趋势。
选择合适的模型 — 为你的使用场景选择性价比最高的模型。简单任务使用小模型可以显著降低成本。
优化提示词 — 更短、结构更好的提示词能减少输入 Token 费用。
设置 API Key 配额 — 在控制台中配置单个 Key 的使用限额，防止意外超支。
为不同项目使用独立的 API Key，以便分别追踪成本。
缓存响应 — 如果你频繁发送相似的请求，尽可能缓存并复用响应。

On this page