在 Cascade 中,你可以轻松切换到不同的 AI 模型。 根据你选择的 AI 模型,每条输入将消耗不同数量的提示额度 在文本输入框下方,你会看到一个 AI 模型选择下拉菜单,其中包含以下 AI 模型:

SWE-1

SWE-1 是我们自研的前沿 AI 模型家族,专为软件工程任务打造。 根据我们的内部评测,其性能已接近基础研究机构的前沿模型。
  • SWE-1: 具备强大的推理能力、可调⽤工具,并针对 Cascade 进行了优化。以更低成本提供接近 Claude 3.5 的表现。
  • SWE-1-mini: 为 Windsurf Tab 中的被动建议提供支持,并针对实时低延迟进行了优化。

自带密钥(BYOK)

此功能仅面向免费和付费的个人用户开放。
对于部分 AI 模型,我们支持用户自带 API 密钥。在模型下拉菜单中,个人用户会看到标注为 BYOK 的模型。 请注意,这与 API 计费 不同。 要输入你的 API 密钥,请前往订阅设置中的 此页面 并添加密钥。 如果尚未配置 API 密钥,尝试使用 BYOK 模型时会返回错误。 目前,我们仅对以下模型支持 BYOK:
  • Claude 4 Sonnet
  • Claude 4 Sonnet (Thinking)
  • Claude 4 Opus
  • Claude 4 Opus (Thinking)

API 定价

与按次统一定价(每次用户提示消耗固定积分)不同,API 定价按每个处理的 token 收取固定积分(即与计算量成正比)。每个已处理 token 消耗的积分数量会根据所选 AI 模型而变化。 API 定价与按次统一定价共用同一积分池。在模型选择器中,采用 API 定价的模型会有清晰标注。 我们按模型的 API 价格加 20% 的加成收取费用。每个积分对应 $0.04。
我们使用与模型提供商相同的分词器(例如 Claude 模型使用 Anthropic 的分词器、GPT 模型使用 OpenAI 的分词器等),以确保 token 计数与定价的准确与一致。参见 OpenAI 的分词器演示
API 定价会对从你的提示、自动检索的上下文、工具调用、过往对话等处理的所有 token 收费。由于模型提供商对输入与输出 token、是否缓存、是否命中等的计费不同,在相同总 token 数下,因这些 token 类型分布不同而消耗的积分也可能不同。“thinking” 模型的推理 token 按输出 token 计费。Windsurf 会在对话过长时进行摘要,以在上下文长度与提示缓存读取成本之间取得平衡;生成的摘要将按非缓存输入 token 计费。积分的小数用量将四舍五入到最接近的百分位(0.01 积分)。 请注意,API 定价与 BYOK(自带密钥)相互独立。使用 BYOK 时,所有用量都会通过你自己的 API key 结算,因此 Windsurf 不会扣除任何积分。 以下是各个套餐中可通过 API 定价使用的模型价格:
ModelPlans with API PricingInput Tokens (Credits / Million Tokens)1Cache Read Tokens (Credits / Million Tokens)2Output Tokens (Credits / Million Tokens)
Claude Sonnet 4- Pro
- Teams
- Enterprise (contracted)
- Enterprise (self-serve)
909450
Claude Sonnet 4 (Thinking)- Pro
- Teams
- Enterprise (contracted)
- Enterprise (self-serve)
909450
1 对于 Anthropic 模型,提示缓存写入相较未缓存输入额外增加 25% 成本。进入 Windsurf 的大多数输入 token 会写入提示缓存以供后续步骤使用。输出 token 写入提示缓存不增加额外成本。详见 Anthropic 的 API 定价。
2 提示缓存的 TTL(存活时间)由模型提供商决定(例如在 Anthropic 上约为 5 分钟)。即使在 TTL 内,也不保证一定命中缓存。提示缓存未命中将按输入 token 计费。

示例对话

为展示 API 定价在实际中的运作方式,我们以一个直接在 Cascade 中调用 Claude Sonnet 4 的示例对话来说明。
角色消息Token 数备注每条消息费用
用户重构 @my_function20k输入(缓存写入)。注:包括完整共享时间线、编辑器上下文和系统提示。2.25 Credits
Windsurf我先分析一下 my_function,制订一个重构计划。1k输出 token。0.45 Credits
tool_callAnalyze my_function23k输入(缓存读取)+ 输入(缓存写入)。0.42 Credits
Windsurf这是重构 my_function 的计划[…] 需要我继续开始实施吗?2k输出 token。0.90 Credits
用户好的,继续。46k输入(缓存读取)+ 输入(缓存写入)。0.52 Credits
tool_callEdit foo.py50k输入(缓存读取)+ 输出 token。2.22 Credits
tool_callAdd bar.py56k输入(缓存读取)+ 输出 token。3.15 Credits
Windsurf我已完成对 my_function 的重构。以下是更改摘要:[…]2k输出 token。0.90 Credits
合计200k10.81 Credits