Fast Context - Windsurf Docs

Fast Context es un subagente especializado de Windsurf que recupera código relevante de tu base de código hasta 20 veces más rápido que la búsqueda con agentes tradicional. Potencia la capacidad de Cascade para comprender rápidamente bases de código grandes, manteniendo la inteligencia de los modelos de IA más avanzados.

Uso de Fast Context

Cuando Cascade recibe una consulta que requiere búsqueda de código, Fast Context se activará automáticamente. Notarás que Fast Context está funcionando cuando:

Cascade identifica rápidamente archivos relevantes en todo tu base de código
Las consultas sobre bases de código grandes se completan más rápido que antes
Cascade dedica menos tiempo a leer código irrelevante

Cómo funciona

Fast Context utiliza SWE-grep y SWE-grep-mini, modelos personalizados entrenados específicamente para la recuperación rápida de código. Estos modelos combinan la velocidad de la búsqueda tradicional basada en embeddings con la inteligencia de la exploración agentiva. Cuando haces una consulta a Cascade que requiera buscar en tu base de código, Fast Context se activa automáticamente para:

Identificar archivos y secciones de código relevantes mediante llamadas paralelas a herramientas
Ejecutar múltiples búsquedas simultáneamente
Devolver resultados dirigidos en segundos en lugar de minutos

Este enfoque evita la contaminación del contexto y busca mitigar el compromiso tradicional entre velocidad y precisión. Al delegar la recuperación a un subagente especializado, Cascade conserva su presupuesto de contexto y su inteligencia para la tarea principal.

Modelos SWE-grep

Fast Context funciona con la familia de modelos SWE-grep:

SWE-grep: Variante de alta inteligencia optimizada para tareas complejas de recuperación de información
SWE-grep-mini: Variante ultrarrápida que procesa más de 2,800 tokens por segundo

Ambos modelos están entrenados mediante aprendizaje por refuerzo para sobresalir en llamadas paralelas a herramientas y en la navegación eficiente del código. Ejecutan hasta 8 llamadas paralelas a herramientas por turno, con un máximo de 4 turnos, lo que les permite explorar distintas partes de tu base de código simultáneamente. Los modelos usan un conjunto restringido de herramientas multiplataforma (grep, read, glob) para garantizar un rendimiento consistente en diferentes sistemas operativos y entornos de desarrollo.

​Uso de Fast Context

​Cómo funciona

​Modelos SWE-grep

Uso de Fast Context

Cómo funciona

Modelos SWE-grep