Cascade では、目的に応じて異なる AI モデルを簡単に切り替えられます。 選択した AI モデルに応じて、各入力プロンプトで消費されるプロンプトクレジットの数が異なります。 テキスト入力欄の下に、次の AI モデルを選べるモデル選択用のドロップダウンメニューが表示されます。

SWE-1

SWE-1 は、ソフトウェアエンジニアリング向けに特化して開発した社内製のフロンティアな AI モデル群です。 社内の評価では、基盤ラボの最先端 AI モデルに迫る性能を示しています。
  • SWE-1: 高度な推論能力、ツール連携に対応し、Cascade に最適化。コストの一部で Claude 3.5 相当の性能を発揮。
  • SWE-1-mini: Windsurf の Tab における受動的な提案を支え、リアルタイムの低レイテンシに最適化。

独自キーの持ち込み(BYOK)

無料プランおよび有料の個人ユーザーのみ利用可能です。
一部のAI モデルでは、ユーザー自身のAPIキーを使用できます。モデルのドロップダウンメニューでは、個人ユーザーには BYOK とラベル付けされたモデルが表示されます。 これは API Pricing とは異なる点に注意してください。 APIキーを入力するには、サブスクリプション設定の このページ にアクセスし、キーを追加してください。 APIキーを設定していない場合、BYOKモデルを使用しようとするとエラーになります。 現在、BYOKに対応しているAI モデルは次のとおりです:
  • Claude 4 Sonnet
  • Claude 4 Sonnet (Thinking)
  • Claude 4 Opus
  • Claude 4 Opus (Thinking)

API 料金

各ユーザーのプロンプトごとに一定のクレジット数を消費する定額料金とは異なり、API 料金では処理されたトークン数に応じて(すなわち計算量に比例して)一定のクレジット数を請求します。トークンあたりのクレジット数は、選択した AI モデルによって異なります。 API 料金と定額料金は同じクレジットプールを消費します。API 料金の対象となる AI モデルはモデルセレクターで明確に表示されています。 請求額はモデルの API 価格に 20% のマージンを加えたものです。1 クレジットは $0.04 に相当します。
正確かつ一貫したトークン計数と料金を担保するため、モデル提供元と同じトークナイザー(Claude モデルには Anthropic、GPT モデルには OpenAI など)を使用しています。詳しくは OpenAI のトークナイザーデモ をご覧ください。
API 料金では、あなたのプロンプト、自動取得されたコンテキスト、ツール呼び出し、過去の会話履歴などで処理されたすべてのトークンが課金対象です。モデル提供元の料金は、入力/出力やキャッシュあり/なしで異なるため、同じ総トークン数でもそれらの内訳によって消費クレジット数が変動します。「thinking」モデルの推論トークンは出力トークンとして課金されます。Windsurf は会話が長くなりすぎた場合、要約によってコンテキスト長とプロンプトキャッシュ読み込みコストのバランスを取ります。生成された要約は未キャッシュの入力トークンとして課金されます。クレジットの端数は 0.01 クレジット単位で切り上げられます。 API 料金は BYOK(bring-your-own-key)とは別枠である点にご注意ください。BYOK を利用する場合、すべての使用はご自身の API キー経由となるため、Windsurf はクレジットを請求しません。 以下は、各種プランで API 料金により利用可能なモデルの料金です:
ModelPlans with API PricingInput Tokens (Credits / Million Tokens)1Cache Read Tokens (Credits / Million Tokens)2Output Tokens (Credits / Million Tokens)
Claude Sonnet 4- Pro
- Teams
- Enterprise (contracted)
- Enterprise (self-serve)
909450
Claude Sonnet 4 (Thinking)- Pro
- Teams
- Enterprise (contracted)
- Enterprise (self-serve)
909450
1 Anthropic のモデルでは、プロンプトキャッシュへの書き込みは未キャッシュ入力と比べて 25% 追加のコストがかかります。Windsurf への入力トークンの多くは後続ステップのためにプロンプトキャッシュへ書き込まれます。出力トークンは追加コストなしでプロンプトキャッシュへ書き込まれます。詳細は Anthropic の API 料金をご覧ください。
2 プロンプトキャッシュには、モデル提供元により決定される限定的な TTL(time-to-live)が存在します(例: Anthropic では約 5 分)。TTL 内であっても、プロンプトキャッシュが必ずヒットするわけではありません。キャッシュミスは入力トークンとして課金されます。

会話例

API の料金が実際にどのように適用されるかを示すため、Claude Sonnet 4 を直接使って Cascade とやり取りする会話例を見ていきます。
RoleMessageTokensNoteCost per message
UserRefactor @my_function20k入力(キャッシュ書き込み)。注:共有タイムライン全体、エディターのコンテキスト、システムプロンプトを含む。2.25 Credits
Windsurfまず my_function を分析して、リファクタリングの計画を立てます。1k出力トークン。0.45 Credits
tool_callAnalyze my_function23k入力(キャッシュ読み取り)+入力(キャッシュ書き込み)。0.42 Credits
Windsurfmy_function をリファクタリングするための計画は次のとおりです[…] 実装に進めますか?2k出力トークン。0.90 Credits
Userはい、続けてください。46k入力(キャッシュ読み取り)+入力(キャッシュ書き込み)。0.52 Credits
tool_callEdit foo.py50k入力(キャッシュ読み取り)+出力トークン。2.22 Credits
tool_callAdd bar.py56k入力(キャッシュ読み取り)+出力トークン。3.15 Credits
Windsurfmy_function のリファクタリングが完了しました。変更点の概要は次のとおりです[…]2k出力トークン。0.90 Credits
Total200k10.81 Credits