Skip to content

快速开始

线上体验

想在不安装任何东西的情况下快速体验 TierFlow?直接使用 cURL 发送一个请求:

bash
curl https://api.tierflow.dev/v1/chat/completions \
  -H "Authorization: Bearer your-tierflow-key" \
  -H "Content-Type: application/json" \
  -d '{"model": "auto", "messages": [{"role": "user", "content": "你好"}]}'

接入 TierFlow

前提条件

  • 熟悉命令行操作
  • Python 3.8+ 或 Node.js 18+
  • 一个 TierFlow API Key

获取 API Key

前往 TierFlow 控制台,在「API 密钥」页面创建新的密钥:

TIERFLOW_API_KEY=tf-sk-xxxxxxxxxxxxxxxxxxxxxxxx

安装 SDK

bash
pip install openai
bash
npm install openai

TierFlow 兼容 OpenAI SDK,无需安装额外依赖。

替换 Base URL

只需修改 base_urlapi_key,其他代码无需任何改动。

python
from openai import OpenAI

client = OpenAI(
    api_key="tf-sk-xxxxxxxxxxxxxxxxxxxxxxxx",
    base_url="https://api.tierflow.dev/v1"
)

response = client.chat.completions.create(
    model="auto",
    messages=[{"role": "user", "content": "用一句话解释什么是向量数据库"}]
)

print(response.choices[0].message.content)
javascript
import OpenAI from "openai";

const client = new OpenAI({
    apiKey: "tf-sk-xxxxxxxxxxxxxxxxxxxxxxxx",
    baseURL: "https://api.tierflow.dev/v1"
});

const response = await client.chat.completions.create({
    model: "auto",
    messages: [{ role: "user", content: "用一句话解释什么是向量数据库" }]
});

console.log(response.choices[0].message.content);
bash
curl https://api.tierflow.dev/v1/chat/completions \
  -H "Authorization: Bearer tf-sk-xxxxxxxxxxxxxxxxxxxxxxxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "auto",
    "messages": [{"role": "user", "content": "用一句话解释什么是向量数据库"}]
  }'

就这么简单。你的请求已经通过 TierFlow 智能路由了。

路由模式

model 字段支持多种路由策略,这里先使用 auto(自动路由)即可:

模式model 值说明
自动路由auto根据任务复杂度自动选择最优模型(推荐)

更多路由策略(成本优先、质量优先、指定模型等)请参阅 路由策略详解

python
response = client.chat.completions.create(
    model="auto",
    messages=[{"role": "user", "content": "你好"}]
)

查看路由结果

每次响应中包含路由元信息,告诉你实际使用了哪个模型:

json
{
  "model": "gpt-4o-mini",
  "tierflow": {
    "requested_model": "auto",
    "routed_model": "gpt-4o-mini",
    "route_reason": "simple_query",
    "estimated_cost": "$0.000042",
    "saved_vs_flagship": "82%"
  }
}

流式输出

与 OpenAI API 用法完全一致,使用 stream=True 即可:

python
stream = client.chat.completions.create(
    model="auto",
    messages=[{"role": "user", "content": "写一篇关于AI的短文"}],
    stream=True
)

for chunk in stream:
    print(chunk.choices[0].delta.content or "", end="")

常见问题

会影响响应质量吗?

不会。路由引擎会评估每个请求的复杂度,只在模型能力足以胜任时才进行降级路由。你可以在控制台设置质量下限阈值。

支持哪些模型?

已接入 OpenAI、Anthropic、Google、DeepSeek、阿里云等主流供应商。完整列表见 模型列表

如何设置预算上限?

在控制台「预算管理」中设置每日/每月上限,超过限额后 API 返回 429 状态码。

下一步

如果你还没有阅读 简介,建议先了解 TierFlow 的设计理念。