Cascade では、選択した AI モデルを簡単に切り替えられます。 選んだ AI モデルに応じて、各入力プロンプトで消費されるプロンプトクレジットの数は異なります。 テキスト入力欄の下に、次の AI モデルを選べるモデル選択ドロップダウンメニューが表示されます:

SWE-1

SWE-1 は、ソフトウェアエンジニアリングのタスクに特化して構築された、自社開発の最先端 AI モデル ファミリーです。 社内評価によれば、基盤ラボの最先端モデルに迫る性能を示しています。
  • SWE-1: 高度な推論能力、ツール連携に対応し、Cascade に最適化。低コストで Claude 3.5 相当の性能を提供。
  • SWE-1-mini: Windsurf Tab のパッシブサジェストを支えるモデルで、リアルタイムのレイテンシ最適化済み。

独自キーの持ち込み(BYOK)

これは無料および有料の個人ユーザーのみが利用できます。
一部のAIモデルでは、ユーザー自身のAPIキーを持ち込んで利用できます。モデルのドロップダウンメニューには、個人ユーザー向けにBYOKと表示されたモデルが含まれます。 これはAPI Pricingとは異なる点にご注意ください。 APIキーを入力するには、サブスクリプション設定のこちらのページに移動し、キーを追加してください。 APIキーを設定していない場合、BYOKモデルを使用しようとするとエラーになります。 現在、BYOKをサポートしているモデルは次のとおりです:
  • Claude 4 Sonnet
  • Claude 4 Sonnet (Thinking)
  • Claude 4 Opus
  • Claude 4 Opus (Thinking)

API 料金

固定料金制では各ユーザーのプロンプトごとに一定数のクレジットが消費されますが、API 料金では処理されたトークンごとに一定数のクレジットが課金されます(計算量に比例)。処理されたトークンあたりのクレジット数は、選択した AI モデルによって変動します。 API 料金と固定料金は同じクレジットプールから消費されます。API 料金のモデルはモデルセレクター上で明確に表示されています。 当社はモデルの API 価格に 20% のマージンを加えて請求します。1 クレジットは $0.04 に相当します。
正確かつ一貫したトークンカウントと料金設定のため、モデル提供元と同じトークナイザー(Claude モデルには Anthropic、GPT モデルには OpenAI など)を使用しています。詳しくは OpenAI のトークナイザーのデモをご覧ください
API 料金は、プロンプト、自動取得されたコンテキスト、ツール呼び出し、過去の会話履歴などで処理されたすべてのトークンに課金されます。モデル提供元によっては、入力トークンと出力トークン、キャッシュ有無で単価が異なるため、同じ総トークン数でもこれらの種別の分布により消費クレジット数は変動します。「thinking」モデルの推論トークンは出力トークンとして課金されます。Windsurf は会話が長くなりすぎた場合、要約してコンテキスト長とプロンプトキャッシュ読み出しのコストをバランスします。生成された要約は非キャッシュの入力トークンとして課金されます。クレジットの端数は 0.01 クレジット単位に切り上げられます。 API 料金は BYOK(bring-your-own-key)とは別である点にご留意ください。BYOK ではすべての利用がお客様自身の API キー経由となるため、Windsurf はクレジットを請求しません。 以下に、各プランで API 料金の対象となるモデルの料金を示します。
ModelPlans with API PricingInput Tokens (Credits / Million Tokens)1Cache Read Tokens (Credits / Million Tokens)2Output Tokens (Credits / Million Tokens)
Claude Sonnet 4- Pro
- Teams
- Enterprise (contracted)
- Enterprise (self-serve)
909450
Claude Sonnet 4 (Thinking)- Pro
- Teams
- Enterprise (contracted)
- Enterprise (self-serve)
909450
1 Anthropic のモデルでは、プロンプトキャッシュへの書き込みは非キャッシュ入力に比べて 25% の追加コストがかかります。Windsurf への入力トークンの多くは、後続ステップのためにプロンプトキャッシュへ書き込まれます。出力トークンは追加コストなしでプロンプトキャッシュへ書き込まれます。詳細は Anthropic の API 料金をご参照ください。
2 プロンプトキャッシュには、モデル提供元によって定められた有限の TTL(time-to-live)があり(例:Anthropic では約 5 分)、TTL 内であってもキャッシュヒットは保証されません。プロンプトキャッシュのミスは入力トークンとして課金されます。

会話例

API の料金が実際にどう適用されるかを示すために、Claude Sonnet 4 を直接使って Cascade との会話例を見ていきます。
役割メッセージトークン注記メッセージあたりのコスト
UserRefactor @my_function20k入力(キャッシュ書き込み)。注:共有タイムライン全体、エディターコンテキスト、システムプロンプトを含む。2.25 Credits
Windsurfまず my_function を分析して、リファクタリングの計画を立てます。1k出力トークン。0.45 Credits
tool_callAnalyze my_function23k入力(キャッシュ読み取り)+入力(キャッシュ書き込み)。0.42 Credits
Windsurfmy_function をリファクタリングする計画は次のとおりです […] 実装を続けますか?2k出力トークン。0.90 Credits
Userはい、続けてください。46k入力(キャッシュ読み取り)+入力(キャッシュ書き込み)。0.52 Credits
tool_callEdit foo.py50k入力(キャッシュ読み取り)+出力トークン。2.22 Credits
tool_callAdd bar.py56k入力(キャッシュ読み取り)+出力トークン。3.15 Credits
Windsurfmy_function のリファクタリングが完了しました。変更点の概要は次のとおりです:[…]2k出力トークン。0.90 Credits
合計200k10.81 Credits