简介

什么是 TierFlow？

TierFlow 基于统一的 API 接口，根据请求内容自动选择最优模型，在不降低输出质量的前提下大幅降低调用成本。

下面是一个最简单的接入示例：

python

from openai import OpenAI

client = OpenAI(
    api_key="your-tierflow-key",
    base_url="https://api.tierflow.dev/v1"
)

response = client.chat.completions.create(
    model="auto",
    messages=[{"role": "user", "content": "你好"}]
)

上面的代码展示了 TierFlow 的两个核心特性：

统一接口：兼容 OpenAI SDK，已有代码只需替换 base_url 即可接入。
智能路由：model="auto" 让 TierFlow 根据请求内容自动匹配最优模型。

已经熟悉这些概念？可以直接跳到快速开始。

核心问题

当前使用大模型 API 的开发者面临几个普遍痛点：

成本高昂：旗舰模型单价高，但大量请求其实不需要这个级别的能力。
选择困难：模型越来越多，每个模型擅长的领域不同，难以针对每个任务手动选择。
供应商锁定：每个厂商 API 格式不同，切换成本高，一旦绑定就很难迁移。
可用性风险：单一供应商出现故障或限流时，业务直接中断。

TierFlow 的设计目标就是一次性解决这些问题。

智能路由平台

"TierFlow 是一个路由引擎，也是一个模型生态。"

根据不同的需求场景，你可以这样使用 TierFlow：

作为 OpenAI API 的直接替代，零改造降低成本
作为多模型网关，统一管理所有供应商的密钥和配额
作为智能调度层，根据任务复杂度自动分配模型等级
作为高可用方案，故障时自动切换到备用供应商

无论哪种用法，核心逻辑都是一致的：分析请求 → 匹配模型 → 路由调用。这就是 TierFlow 被称为"智能路由平台"的原因——它是一个可以适应你不同需求的统一入口。

路由决策

TierFlow 的路由引擎基于多维指标进行决策：

任务复杂度：分析请求内容，判断需要旗舰模型还是轻量模型即可胜任。
延迟感知：实时监测各模型 API 的响应时间，避开高延迟节点。
成本优化：在满足质量要求的前提下，优先选择性价比更高的模型。
故障转移：某个供应商出问题时，自动切到同级别备用模型，业务无感知。

适用场景

TierFlow 适用于任何需要调用大模型 API 的场景：

SaaS 产品：用户量大、请求种类多，大量简单查询不需要旗舰模型。
AI Agent：多步骤任务链中，不同步骤复杂度不同，可分别路由到不同等级。
内容生成：翻译、摘要等标准任务用轻量模型，创意写作用旗舰模型。
企业工具：控制 API 预算的同时保证关键任务的输出质量。

还有其他问题？

请查看快速开始中的常见问题。

选择你的学习路径

不同的开发者有不同的偏好，选择适合你的方式：

快速开始 — 5 分钟完成接入，适合想立即动手的开发者。
路由策略详解 — 深入了解路由引擎的工作原理。
API 参考 — 查看完整的接口文档和参数说明。

简介 ​

什么是 TierFlow？ ​

核心问题 ​

智能路由平台 ​

路由决策 ​

适用场景 ​

还有其他问题？ ​

选择你的学习路径 ​