Skip to content

简介

什么是 TierFlow?

TierFlow 基于统一的 API 接口,根据请求内容自动选择最优模型,在不降低输出质量的前提下大幅降低调用成本。

下面是一个最简单的接入示例:

python
from openai import OpenAI

client = OpenAI(
    api_key="your-tierflow-key",
    base_url="https://api.tierflow.dev/v1"
)

response = client.chat.completions.create(
    model="auto",
    messages=[{"role": "user", "content": "你好"}]
)

上面的代码展示了 TierFlow 的两个核心特性:

  • 统一接口:兼容 OpenAI SDK,已有代码只需替换 base_url 即可接入。
  • 智能路由model="auto" 让 TierFlow 根据请求内容自动匹配最优模型。

已经熟悉这些概念?可以直接跳到 快速开始

核心问题

当前使用大模型 API 的开发者面临几个普遍痛点:

  • 成本高昂:旗舰模型单价高,但大量请求其实不需要这个级别的能力。
  • 选择困难:模型越来越多,每个模型擅长的领域不同,难以针对每个任务手动选择。
  • 供应商锁定:每个厂商 API 格式不同,切换成本高,一旦绑定就很难迁移。
  • 可用性风险:单一供应商出现故障或限流时,业务直接中断。

TierFlow 的设计目标就是一次性解决这些问题。

智能路由平台

"TierFlow 是一个路由引擎,也是一个模型生态。"

根据不同的需求场景,你可以这样使用 TierFlow:

  • 作为 OpenAI API 的直接替代,零改造降低成本
  • 作为多模型网关,统一管理所有供应商的密钥和配额
  • 作为智能调度层,根据任务复杂度自动分配模型等级
  • 作为高可用方案,故障时自动切换到备用供应商

无论哪种用法,核心逻辑都是一致的:分析请求 → 匹配模型 → 路由调用。这就是 TierFlow 被称为"智能路由平台"的原因——它是一个可以适应你不同需求的统一入口。

路由决策

TierFlow 的路由引擎基于多维指标进行决策:

  • 任务复杂度:分析请求内容,判断需要旗舰模型还是轻量模型即可胜任。
  • 延迟感知:实时监测各模型 API 的响应时间,避开高延迟节点。
  • 成本优化:在满足质量要求的前提下,优先选择性价比更高的模型。
  • 故障转移:某个供应商出问题时,自动切到同级别备用模型,业务无感知。

适用场景

TierFlow 适用于任何需要调用大模型 API 的场景:

  • SaaS 产品:用户量大、请求种类多,大量简单查询不需要旗舰模型。
  • AI Agent:多步骤任务链中,不同步骤复杂度不同,可分别路由到不同等级。
  • 内容生成:翻译、摘要等标准任务用轻量模型,创意写作用旗舰模型。
  • 企业工具:控制 API 预算的同时保证关键任务的输出质量。

还有其他问题?

请查看 快速开始 中的常见问题。

选择你的学习路径

不同的开发者有不同的偏好,选择适合你的方式:

  • 快速开始 — 5 分钟完成接入,适合想立即动手的开发者。
  • 路由策略详解 — 深入了解路由引擎的工作原理。
  • API 参考 — 查看完整的接口文档和参数说明。