Skip to content

模型管理

New API 支持统一管理多个 AI 模型,你可以灵活配置模型的可用性和计费方式。

模型列表

系统会自动从已配置的渠道中收集可用模型。你也可以手动添加模型。

模型配置

基础设置

  • 模型名称:显示名称
  • 模型 ID:API 调用时使用的标识
  • 所属渠道:关联的上游渠道
  • 状态:启用/禁用

计费设置

  • 计费方式:按 Token / 按次数 / 固定价格
  • 输入价格:每 1K Token 的价格
  • 输出价格:每 1K Token 的价格
  • 倍率:相对于基准价格的倍数

倍率说明

倍率用于快速调整模型价格:

实际价格 = 基准价格 × 倍率

例如:

  • GPT-4 基准价格 $0.03/1K,倍率 1.0 = $0.03/1K
  • GPT-4 基准价格 $0.03/1K,倍率 1.5 = $0.045/1K

模型映射

你可以设置模型映射,将用户请求的模型名称映射到实际的渠道模型:

gpt-4 → claude-3-opus
gpt-3.5-turbo → gemini-pro

这在以下场景很有用:

  • 用户习惯使用 OpenAI 的模型名称
  • 需要无缝切换到更便宜的替代模型
  • A/B 测试不同模型

模型分组

可以将模型分组管理:

  • 默认组:所有用户可用
  • VIP 组:仅 VIP 用户可用
  • 测试组:仅内部测试使用

调用限制

可以为每个模型设置:

  • 每分钟最大请求数
  • 每日最大 Token 数
  • 并发请求数限制

查看模型使用情况

在「模型统计」页面可以查看:

  • 各模型的调用次数
  • Token 消耗量
  • 费用统计
  • 响应时间分布

基于 MIT 许可发布