简介
什么是 TierFlow?
TierFlow 基于统一的 API 接口,根据请求内容自动选择最优模型,在不降低输出质量的前提下大幅降低调用成本。
下面是一个最简单的接入示例:
python
from openai import OpenAI
client = OpenAI(
api_key="your-tierflow-key",
base_url="https://api.tierflow.dev/v1"
)
response = client.chat.completions.create(
model="auto",
messages=[{"role": "user", "content": "你好"}]
)上面的代码展示了 TierFlow 的两个核心特性:
- 统一接口:兼容 OpenAI SDK,已有代码只需替换
base_url即可接入。 - 智能路由:
model="auto"让 TierFlow 根据请求内容自动匹配最优模型。
已经熟悉这些概念?可以直接跳到 快速开始。
核心问题
当前使用大模型 API 的开发者面临几个普遍痛点:
- 成本高昂:旗舰模型单价高,但大量请求其实不需要这个级别的能力。
- 选择困难:模型越来越多,每个模型擅长的领域不同,难以针对每个任务手动选择。
- 供应商锁定:每个厂商 API 格式不同,切换成本高,一旦绑定就很难迁移。
- 可用性风险:单一供应商出现故障或限流时,业务直接中断。
TierFlow 的设计目标就是一次性解决这些问题。
智能路由平台
"TierFlow 是一个路由引擎,也是一个模型生态。"
根据不同的需求场景,你可以这样使用 TierFlow:
- 作为 OpenAI API 的直接替代,零改造降低成本
- 作为多模型网关,统一管理所有供应商的密钥和配额
- 作为智能调度层,根据任务复杂度自动分配模型等级
- 作为高可用方案,故障时自动切换到备用供应商
无论哪种用法,核心逻辑都是一致的:分析请求 → 匹配模型 → 路由调用。这就是 TierFlow 被称为"智能路由平台"的原因——它是一个可以适应你不同需求的统一入口。
路由决策
TierFlow 的路由引擎基于多维指标进行决策:
- 任务复杂度:分析请求内容,判断需要旗舰模型还是轻量模型即可胜任。
- 延迟感知:实时监测各模型 API 的响应时间,避开高延迟节点。
- 成本优化:在满足质量要求的前提下,优先选择性价比更高的模型。
- 故障转移:某个供应商出问题时,自动切到同级别备用模型,业务无感知。
适用场景
TierFlow 适用于任何需要调用大模型 API 的场景:
- SaaS 产品:用户量大、请求种类多,大量简单查询不需要旗舰模型。
- AI Agent:多步骤任务链中,不同步骤复杂度不同,可分别路由到不同等级。
- 内容生成:翻译、摘要等标准任务用轻量模型,创意写作用旗舰模型。
- 企业工具:控制 API 预算的同时保证关键任务的输出质量。
还有其他问题?
请查看 快速开始 中的常见问题。
选择你的学习路径
不同的开发者有不同的偏好,选择适合你的方式: