计费与定价
了解计费方式、查看定价信息并管理账户余额
OpenModel 采用按 Token 计费的模型。每次请求根据处理的 Token 数量收费,输入 Token 和输出 Token 分别按不同费率计算。
计费机制
按 Token 定价
每个模型有各自的输入 Token 和输出 Token 价格。费率由上游提供商定价和平台管理员配置的调整系数共同决定。
- 输入 Token — 你的提示词、系统消息和上下文中包含的 Token
- 输出 Token — 模型在响应中生成的 Token
- 缓存读取 Token — 从 Prompt 缓存中读取的输入 Token(如适用,按较低费率计费)
- 缓存写入 Token — 写入 Prompt 缓存的输入 Token(如适用,按单独费率计费)
- 缓存写入 Token(1 小时 TTL) — 部分供应商(如 Anthropic)提供短时效的 Prompt 缓存(1 小时 TTL),其费率与标准缓存写入不同
- 推理 Token — 对于支持链式推理的模型(如通过 Responses 协议),推理输出 Token 可能按独立于普通输出 Token 的费率计费
输入和输出 Token 的费率不同,通常输出 Token 的费用更高。当模型支持缓存或推理功能时,相关 Token 会单独计费。
价格显示
价格以 美元/百万 Token($/M tokens) 为单位显示。例如:
| 模型 | 输入价格 | 输出价格 |
|---|---|---|
| gpt-4o | $2.50/M | $10.00/M |
| claude-sonnet-4-20250514 | $3.00/M | $15.00/M |
| gemini-2.0-flash | $0.10/M | $0.40/M |
实际价格可能有所不同,请在控制台或 API 中查看最新定价。
内部精度
在内部,OpenModel 使用 微美元(1 USD = 1,000,000 微美元)跟踪所有金额,以避免浮点数舍入误差。这对用户是透明的 — 控制台中所有金额均以美元显示。
阶梯定价
部分模型采用 阶梯定价,即每 Token 费率会根据请求中的 Token 数量发生变化。阶梯定价有两种模式:
阈值阶梯 — 当 Token 总量超过某个阈值时,所有 Token 按统一的新费率计算。例如,Anthropic 和 OpenAI 模型可能有 above_128k 阶梯,在输入总量超过 128,000 Token 时按不同费率计费。常见阈值还包括 above_200k 和 above_256k。
范围阶梯 — 单次请求中不同范围的 Token 按不同费率计算(类似累进税率)。DashScope 模型采用此方式,使用多段定价。每个区间有各自的每 Token 费率。
阶梯定价由管理员按模型配置,并自动反映在费用计算中。你可以在控制台查看各模型的定价阶梯。
价格倍率
管理员可以为每个模型配置 价格倍率 来调整实际费率。此功能允许:
- 折扣定价 — 倍率低于 1.0 可降低费用(如 0.8 = 八折)
- 免费模型 — 倍率为 0 时该模型免费使用
- 溢价定价 — 倍率高于 1.0 可提高费用
倍率应用于所有 Token 类型(输入、输出、缓存、推理)。请在控制台查看当前实际定价。
无最低消费
单次请求没有最低消费额。你只需为实际处理的 Token 付费。一个使用 50 个输入 Token 并收到 10 个输出 Token 的短请求,仅按这些 Token 计费。
计费去重
OpenModel 内置了去重机制以防止重复计费。如果请求在内部被重试(例如由于通道故障转移),你只会为成功的响应被计费一次。
查看定价
在控制台中
访问 控制台 的 模型 页面,查看所有可用模型及其当前定价,包括输入和输出费率。
通过 API
通过模型端点以编程方式获取定价信息。此端点是公开的,无需认证:
curl "https://api.openmodel.ai/web/v1/models"余额管理
查看余额
当前余额显示在控制台仪表盘中。你也可以通过 API 查询:
curl https://api.openmodel.ai/web/v1/self \
-H "Authorization: Bearer $ACCESS_TOKEN"响应中的 balance 字段以微美元为单位。请注意,你的 可用余额 为 balance - frozen_balance — 冻结部分代表待处理退款申请所占用的金额。
余额不足
当余额不足以处理请求时,API 会返回 INSUFFICIENT_BALANCE 错误。HTTP 状态码取决于端点类型:
- Web API(
/web/v1/*)— 返回 HTTP 400(Bad Request) - 代理端点(
/v1/responses、/v1/messages、/v1beta/models/*)— 返回 HTTP 402(Payment Required)
请在控制台充值后重试。
注册赠金
新用户可能会获得 注册赠金 — 注册时自动赠送的免费余额。赠金金额由平台管理员配置,可能因平台设置而异。
- 注册赠金有 有效期限。如果在到期前未使用完毕,剩余金额将被自动回收。
- 赠金到期或用完后,你需要充值才能继续使用 API。
请在控制台仪表盘查看当前余额和有效期信息。
充值
为账户充值:
- 登录 控制台
- 进入 充值 页面
- 选择充值金额
- 通过 Stripe Checkout 完成支付
支付通过 Stripe 安全处理。支付成功后余额立即更新。
退款
如果你需要退款:
- 进入控制台的 退款 页面
- 提交退款申请,填写金额和原因
- 申请的金额将在审核期间被冻结
- 管理员审核后批准或拒绝申请
- 批准后,金额将从余额中扣除并退还
你可以随时取消待审核的退款申请,被冻结的金额将立即释放。
消费追踪
控制台提供多种工具帮助你监控消费情况:
仪表盘
主仪表盘显示:
- 当前余额 — 剩余资金
- 总消费 — 累计花费
- 请求数量 — 总 API 请求次数
- Token 用量 — 累计输入和输出 Token 数
- 消费趋势 — 按时间维度的消费变化(按小时或按天)
- 模型统计 — 按模型分类的使用明细
用量页面
用量页面提供按 API Key 分类的使用统计,支持日期范围筛选。这有助于你了解哪些 API Key 消耗了最多资源。
消费日志
日志页面展示每条 API 请求的详细记录,包括:
- 请求时间
- 使用的模型
- 输入和输出 Token 数量
- 本次请求的费用
- 使用的 API Key
你可以按模型、API Key 和日期范围筛选日志。
费用估算
在发送请求之前,你可以通过以下方式估算 Token 数量来预估费用:
- 英文文本:大约每 4 个字符 1 个 Token,或每个单词约 0.75 个 Token
- 代码:Token 密度因语言而异,但通常与英文文本相近
- 中日韩文字:每个字符通常需要 1-2 个 Token
若需更精确的计数,使用 Token 计数端点:
curl https://api.openmodel.ai/v1/messages/count_tokens \
-H "x-api-key: $OPENMODEL_API_KEY" \
-H "Content-Type: application/json" \
-H "anthropic-version: 2023-06-01" \
-d '{
"model": "claude-sonnet-4-20250514",
"messages": [
{"role": "user", "content": "你的提示词内容"}
]
}'最佳实践
- 定期监控消费 — 经常查看控制台仪表盘,追踪使用趋势。
- 选择合适的模型 — 为你的使用场景选择性价比最高的模型。简单任务使用小模型可以显著降低成本。
- 优化提示词 — 更短、结构更好的提示词能减少输入 Token 费用。
- 设置 API Key 配额 — 在控制台中配置单个 Key 的使用限额,防止意外超支。
- 为不同项目使用独立的 API Key,以便分别追踪成本。
- 缓存响应 — 如果你频繁发送相似的请求,尽可能缓存并复用响应。