Dans Cascade, vous pouvez facilement passer d’un modèle d’IA à un autre, selon vos besoins.
Selon le modèle d’IA sélectionné, chacun de vos prompts consommera un nombre différent de crédits de prompt.
Sous le champ de saisie, vous trouverez un menu déroulant de sélection du modèle qui contient les modèles suivants :
SWE-1 est notre famille de modèles d’IA propriétaires de pointe, conçus spécifiquement pour les tâches d’ingénierie logicielle.
D’après nos évaluations internes, ses performances se rapprochent de celles des modèles de pointe des grands laboratoires.
SWE-1
: Raisonnement avancé, compatible avec les outils et optimisé pour Cascade. Performances de niveau Claude 3.5 pour une fraction du coût.
SWE-1-mini
: Alimente les suggestions passives dans Windsurf Tab, optimisé pour une latence en temps réel.
Apportez votre propre clé (BYOK)
Cette option n’est disponible que pour les utilisateurs individuels, gratuits et payants.
Pour certains modèles d’IA, nous autorisons les utilisateurs à utiliser leurs propres clés API. Dans le menu déroulant des modèles, les utilisateurs individuels verront des modèles marqués BYOK
.
Notez que cela est différent de la section Tarification de l’API.
Pour saisir votre clé API, rendez-vous sur cette page dans les paramètres d’abonnement et ajoutez votre clé.
Si vous n’avez pas configuré votre clé API, une erreur s’affichera si vous essayez d’utiliser un modèle BYOK.
Actuellement, nous ne prenons en charge BYOK que pour les modèles suivants :
Claude 4 Sonnet
Claude 4 Sonnet (Thinking)
Claude 4 Opus
Claude 4 Opus (Thinking)
Contrairement à une tarification forfaitaire, où un nombre fixe de crédits est utilisé pour chaque requête utilisateur, la tarification de l’API facture un nombre fixe de crédits par jeton traité (c’est-à-dire proportionnel aux ressources de calcul). Le nombre de crédits par jeton traité varie selon le modèle d’IA sélectionné.
La tarification de l’API et la tarification forfaitaire utilisent le même pool de crédits. Les modèles avec tarification API sont clairement signalés dans le sélecteur de modèle.
Nous facturons le prix API du modèle, plus une marge de 20 %. Chaque crédit correspond à 0,04 $.
Nous utilisons les mêmes outils de tokenisation que les fournisseurs de modèles (celui d’Anthropic pour les modèles Claude, celui d’OpenAI pour les modèles GPT, etc.) afin de garantir un comptage des jetons et une tarification précis et cohérents. Voir la démo du tokenizer d’
OpenAI
La tarification de l’API s’applique à tous les jetons traités à partir de vos requêtes, du contexte récupéré automatiquement, des appels d’outils, de l’historique de conversation, etc. Étant donné que les coûts de traitement des jetons chez les fournisseurs de modèles diffèrent entre jetons d’entrée et de sortie, mis en cache ou non, le nombre de crédits consommés pour un même volume total de jetons peut varier selon la répartition entre ces types. Les jetons de raisonnement des modèles « thinking » sont facturés comme des jetons de sortie. Windsurf équilibre la longueur du contexte et les coûts des lectures du cache d’invite en résumant la conversation lorsqu’elle devient trop longue ; le résumé ainsi obtenu est facturé comme des jetons d’entrée non mis en cache. L’utilisation fractionnaire de crédits est arrondie au centième de crédit supérieur.
Notez que la tarification de l’API est distincte de BYOK (bring your own key). Avec BYOK, toute l’utilisation passe par votre propre clé API, donc Windsurf ne facture aucun crédit.
Voici la tarification des modèles disponibles via la tarification API dans différents plans :
Model | Plans with API Pricing | Input Tokens (Credits / Million Tokens)1 | Cache Read Tokens (Credits / Million Tokens)2 | Output Tokens (Credits / Million Tokens) |
---|
Claude Sonnet 4 | - Pro - Teams - Enterprise (contracted) - Enterprise (self-serve) | 90 | 9 | 450 |
Claude Sonnet 4 (Thinking) | - Pro - Teams - Enterprise (contracted) - Enterprise (self-serve) | 90 | 9 | 450 |
1 Pour les modèles Anthropic, les écritures dans le cache d’invite coûtent 25 % de plus que les entrées non mises en cache. La plupart des jetons d’entrée dans Windsurf sont écrits dans le cache d’invite pour les étapes suivantes. Les jetons de sortie sont écrits dans le cache d’invite sans coût supplémentaire. Voir la tarification de l’API d’Anthropic pour plus de détails.
2 Le cache d’invite a un TTL (time-to-live) limité, déterminé par le fournisseur du modèle (p. ex. environ 5 minutes chez Anthropic). Même durant le TTL, le cache d’invite n’est pas garanti de faire mouche. Les échecs de cache d’invite sont facturés comme des jetons d’entrée.
Pour montrer comment fonctionne la tarification de l’API en pratique, parcourons un exemple de conversation avec Cascade en utilisant directement Claude Sonnet 4.
Rôle | Message | Jetons | Note | Coût par message |
---|
Utilisateur | Refactoriser @my_function | 20k | Entrée (écriture dans le cache). Remarque : inclut la chronologie partagée complète, le contexte de l’éditeur et l’invite système. | 2,25 crédits |
Windsurf | Je vais d’abord analyser my_function pour élaborer un plan de refactorisation. | 1k | Jetons de sortie. | 0,45 crédit |
tool_call | Analyze my_function | 23k | Entrée (lecture du cache) + entrée (écriture dans le cache). | 0,42 crédit |
Windsurf | Voici un plan pour refactoriser my_function […] souhaitez-vous que je poursuive avec la mise en œuvre ? | 2k | Jetons de sortie. | 0,90 crédit |
Utilisateur | Oui, continue. | 46k | Entrée (lecture du cache) + entrée (écriture dans le cache). | 0,52 crédit |
tool_call | Edit foo.py | 50k | Entrée (lecture du cache) + jetons de sortie. | 2,22 crédits |
tool_call | Add bar.py | 56k | Entrée (lecture du cache) + jetons de sortie. | 3,15 crédits |
Windsurf | J’ai terminé la refactorisation de my_function. Voici un résumé de mes modifications : […] | 2k | Jetons de sortie. | 0,90 crédit |
Total | | 200k | | 10,81 crédits |