在 Cascade 中,你可以轻松在所选的不同 AI 模型之间切换。 根据你选择的 AI 模型,每次输入的提示会消耗不同数量的提示额度 在文本输入框下方,你会看到一个模型选择下拉菜单,其中包含以下 AI 模型:

SWE-1

SWE-1 是我们自研的前沿 AI 模型家族,专为软件工程任务打造。 根据我们的内部评测,其性能接近顶尖实验室推出的前沿 AI 模型。
  • SWE-1:具备强大的推理能力、工具使用能力,并针对 Cascade 做了优化。在成本显著更低的情况下,达到接近 Claude 3.5 的表现。
  • SWE-1-mini:为 Windsurf Tab 提供被动建议,并针对实时低延迟进行了优化。

自带密钥(BYOK)

此功能仅向免费版和付费版的个人用户开放。
对于部分 AI 模型,我们支持用户自带 API 密钥。在模型下拉菜单中,个人用户会看到标有 BYOK 的模型。 请注意,这与API 定价不同。 要输入你的 API 密钥,请前往订阅设置中的此页面并添加你的密钥。 如果你尚未配置 API 密钥,尝试使用 BYOK 模型时会返回错误。 目前,我们仅对以下模型支持 BYOK:
  • Claude 4 Sonnet
  • Claude 4 Sonnet (Thinking)
  • Claude 4 Opus
  • Claude 4 Opus (Thinking)

API 定价

不同于固定费率定价(每次用户提示使用固定数量的积分),API 定价按处理的每个 token 收取固定数量的积分(即与计算量成正比)。每个已处理 token 所需的积分数量会根据所选 AI 模型而变化。 API 定价和固定费率定价都会消耗同一积分池。采用 API 定价的 AI 模型会在模型选择器中明确标注。 我们收取模型的 API 价格外加 20% 的加成。每 1 积分对应 $0.04。
我们使用与模型提供商相同的分词器(例如 Claude 模型使用 Anthropic 的分词器,GPT 模型使用 OpenAI 的分词器等),以确保 token 计数与定价的准确一致。查看 OpenAI 的分词器演示
API 定价会对处理的所有 token 收费,包括你的提示、自动检索的上下文、工具调用、历史对话等。由于模型提供商对输入与输出 token、是否使用缓存的计费不同,即使总体 token 数量相同,随着这些 token 类型分布的变化,消耗的积分也会不同。“thinking” 模型的推理 token 按输出 token 计费。Windsurf 会在对话过长时通过对话摘要来平衡上下文长度与提示缓存读取成本;生成的摘要将按非缓存输入 token 计费。小数积分使用量将向上取整到 0.01 积分。 请注意,API 定价与 BYOK(自带密钥)是分开的。在 BYOK 模式下,所有使用都会通过你自己的 API key 进行,因此 Windsurf 不会消耗任何积分。 以下是通过 API 定价在不同套餐中可用的模型价格:
Model具有 API 定价的套餐输入 Token(积分 / 百万 Token)1缓存读取 Token(积分 / 百万 Token)2输出 Token(积分 / 百万 Token)
Claude Sonnet 4- Pro
- Teams
- Enterprise(签约)
- Enterprise(自助)
909450
Claude Sonnet 4 (Thinking)- Pro
- Teams
- Enterprise(签约)
- Enterprise(自助)
909450
1 对于 Anthropic 模型,提示缓存写入相较于未缓存输入会额外增加 25% 的成本。绝大多数进入 Windsurf 的输入 token 会写入提示缓存以用于后续步骤。输出 token 写入提示缓存不额外收费。详见 Anthropic 的 API 定价。
2 提示缓存具有由模型提供商决定的有限 TTL(存活时间)(例如在 Anthropic 上约为 5 分钟)。即使在 TTL 内,也无法保证提示缓存一定命中。提示缓存未命中将按输入 token 计费。

示例对话

为展示 API 定价在实际中的运作方式,我们通过一个直接使用 Claude Sonnet 4 的 Cascade 示例对话来说明。
角色消息Tokens备注每条消息费用
User重构 @my_function20k输入(缓存写入)。注:包含完整共享时间线、编辑器上下文与系统提示。2.25 Credits
Windsurf我先分析一下 my_function,再制定重构方案。1k输出 tokens。0.45 Credits
tool_callAnalyze my_function23k输入(缓存读取)+ 输入(缓存写入)。0.42 Credits
Windsurf这是重构 my_function 的计划 […] 需要我继续实施吗?2k输出 tokens。0.90 Credits
User好的,继续。46k输入(缓存读取)+ 输入(缓存写入)。0.52 Credits
tool_callEdit foo.py50k输入(缓存读取)+ 输出 tokens。2.22 Credits
tool_callAdd bar.py56k输入(缓存读取)+ 输出 tokens。3.15 Credits
Windsurf我已完成对 my_function 的重构。以下是更改摘要:[…]2k输出 tokens。0.90 Credits
合计200k10.81 Credits