总览
内部额度、请求和风控状态
交付边界
私有化部署模式API 调用测试
OpenAI 兼容最近流水
扣费与额度调整国内模型白名单
仅 CN 区域启用国外模型白名单
默认禁止,安全中心允许后展示可用模型第三方中转服务模型白名单
默认禁止,安全中心允许后展示通过第三方 Base URL 出口的模型模型详情 / 新增
新增 Kimi、DeepSeek、Qwen 等国内模型版本厂商基础表维护
资源池与渠道关系
先建资源池,再把一个或多个渠道绑定到资源池资源池
管理上游供应商账号或 coding plan 的总额度、预警阈值和自动摘除规则。
渠道
管理某一条真实调用出口,包括 Base URL、上游 Key、绑定模型、权重、限流和断路器。
绑定关系
一个资源池可以绑定多个渠道;一个渠道最多绑定一个资源池。渠道消耗会回写到所属资源池。
路由规则
员工只选择模型工作区;网关只在同一模型兼容身份下选择可用渠道,不会跨模型或跨版本自动切换。
现有资源池(供应商账号 / 套餐额度)
上游官方 coding plan / 账户额度 / 阈值切换资源池详情 / 新增
资源池不直接承接请求,渠道绑定后才会产生消耗现有渠道(调用出口)
Base URL、上游 Key、权重、限流、断路器和资源池绑定渠道详情 / 新增
渠道才是真正请求出口;可绑定上方某个资源池更换已有渠道的上游 Key(轮换)
用于 Key 到期、泄露处置或套餐迁移,可立即替换或预约平滑切换
使用建议:新建渠道时填上方“当前上游 API Key”;已有渠道后续更换供应商 Key 时用这里。有多把备用 Key 时先加入备用 Key 队列。系统自动选择规则:优先选择日 token 消耗占比低的 Key;占比相同随机选择;没有日 token 上限时,优先选择剩余金额高的 Key。
企业会员
余额与状态编辑企业
企业组织架构
选中企业后维护子公司、分公司、部门和子部门四级结构规则
支持二级、三级或四级,最多到四级层级定义
第 1 级:企业 / 公司 第 2 级:子公司、分公司或直属一级部门 第 3 级:部门 第 4 级:子部门、小组或项目组
创建方式
选择“直属当前企业”:创建企业直属组织,成为第 2 级 选择第 2 级组织:创建它下面的第 3 级 选择第 3 级组织:创建它下面的第 4 级 第 4 级下面不能再创建下级
常见示例
某某科技有限公司 / 华东分公司 / AI 平台部 / 网关小组 某某科技有限公司 / 研发中心 / 平台部 某某科技有限公司 / 财务部
应用 / 智能体数据大屏
最近 7 天请求、成本、缓存节省和告警巡检与告警
余额、异常 IP、失败率、超限和安全风险应用 / 智能体列表
业务系统、Agent、RPA 等非员工调用主体新建应用 / 智能体
创建后自动生成该应用唯一 API Key应用级额度审批
应用额度申请、审批和余额补充应用级安全策略
覆盖企业默认策略,仅作用于当前选中应用后台定时任务
应用巡检任务和最近执行记录API Key
员工唯一调用凭证,列表中可暂停或恢复Key 详情
查看拥有者、组织和额度限制兑换码
明文只返回一次生成 / 兑换
网关额度充值入口筛选条件
按 Key、模型、渠道和时间过滤请求记录
已显示 0 条余额流水
最近 100 条筛选器
按 Key、模型、渠道和时间过滤使用明细
按日期分组Token 节省策略
第一阶段:缓存复用、相似命中、默认输出预算和统计口径节省机制说明
第一阶段已真正接入网关请求链路精确缓存
完全相同的低温请求命中后不再请求上游模型,直接从网关缓存返回。
相似缓存
当前阶段使用轻量文本相似索引,后续可升级为 embedding + Redis Stack / Qdrant / Milvus。
输出预算
员工未传 max_tokens 时,网关按策略设置默认最大输出 Tokens,减少长回答浪费。
长会话摘要 / 提示词压缩
本阶段先配置和统计预留,后续接入本地摘要器或 LLMLingua 类压缩器。
按模型节省
缓存命中、节省网关额度和节省 Tokens按部门节省
用于判断哪些部门最受益最近节省记录
精确命中、相似命中、缓存写入和绕过原因公司按日期消耗
最近 30 天每日消耗网关额度公司按模型消耗
按全公司成功请求聚合
0
消耗网关额度
部门消耗
额度、Tokens、申请中额度员工消耗
员工调用与额度申请模型成本
按国内模型聚合按天趋势
最近 30 天额度申请
最近 20 条额度申请记录员工管理
员工导入、手动维护和唯一 API Key批量导入
按部门路径批量创建或更新员工账号
支持中文表头:账号、姓名、工号、岗位、部门路径、额度控制方式、初始额度、标准申请限额、日限额、月度限额、密码;额度控制方式支持 inherit / approval / unlimited。账号建议使用员工 11 位手机号,作为唯一登录 ID。额度审核员属于系统操作账号,后续在权限管理中维护,不在员工管理中创建。
员工列表
点击编辑可载入到上方表单,停用员工会同步停用其唯一 API Key安全审核工作台
待审核 0 条企业 DLP 策略
请求出网前执行,响应返回前复检模型出境策略
默认禁止国外模型和第三方中转服务;只有企业明确允许后,管理员才能创建、授权和调用。风险等级说明
默认策略可按企业合规要求调整L1 低风险
正常业务问题,可按组织维度使用网关缓存。
L2 个人信息
手机号、邮箱、内网 IP 等,默认脱敏后放行,缓存范围降为部门。
L3 重要业务信息
身份证、银行卡、合同、报价、客户名单等,默认进入安全复核,不请求上游。
L4 绝密/凭证
API Key、Bearer Token、数据库连接串、源码密码等,默认直接阻断。
最近安全事件
已显示 0 条DLP 规则管理
识别员工请求和模型响应中的敏感内容
当前:请选择一条 DLP 规则
新增规则用于识别新的敏感内容类型;编辑后会立即影响后续员工 API 请求。
脱敏规则管理
敏感字段请求上游或返回员工前的处理方式
当前:请选择一条脱敏规则
脱敏规则只负责替换方式,是否放行仍由企业 DLP 策略决定。
接口文档
本地 MVPBase URL
http://127.0.0.1:8787
认证
Authorization: Bearer tk_test_demo_1234567890abcdef
获取模型
GET /v1/models
聊天补全
{
"model": "cn-deepseek-pro",
"messages": [
{"role": "user", "content": "请总结这段内容"}
],
"stream": false
}
安全约束
模型必须存在于国内模型白名单。`gpt-*`、`claude-*`、`gemini-*`、`grok` 等国外模型请求会被拦截并写入日志。