Saltar al contenido principalFast Context es un subagente especializado de Windsurf que recupera código relevante de tu base de código hasta 20 veces más rápido que la búsqueda con agentes tradicional. Potencia la capacidad de Cascade para comprender rápidamente bases de código grandes, manteniendo la inteligencia de los modelos de IA más avanzados.
Cuando Cascade recibe una consulta que requiere búsqueda de código, Fast Context se activará automáticamente. También puedes forzar su activación usando Cmd+Enter (Mac) o Ctrl+Enter (Windows/Linux) al enviar tu consulta.
Notarás que Fast Context está funcionando cuando:
- Cascade identifica rápidamente archivos relevantes en todo tu base de código
- Las consultas sobre bases de código grandes se completan más rápido que antes
- Cascade dedica menos tiempo a leer código irrelevante
Fast Context utilizaSWE-grep y SWE-grep-mini, modelos personalizados entrenados específicamente para la recuperación rápida de código. Estos modelos combinan la velocidad de la búsqueda tradicional basada en embeddings con la inteligencia de la exploración agentiva.
Cuando haces una consulta a Cascade que requiera buscar en tu base de código, Fast Context se activa automáticamente para:
- Identificar archivos y secciones de código relevantes mediante llamadas paralelas a herramientas
- Ejecutar múltiples búsquedas simultáneamente
- Devolver resultados dirigidos en segundos en lugar de minutos
Este enfoque evita la contaminación del contexto y busca mitigar el compromiso tradicional entre velocidad y precisión. Al delegar la recuperación a un subagente especializado, Cascade conserva su presupuesto de contexto y su inteligencia para la tarea principal.
Fast Context funciona con la familia de modelos SWE-grep:
- SWE-grep: Variante de alta inteligencia optimizada para tareas complejas de recuperación de información
- SWE-grep-mini: Variante ultrarrápida que procesa más de 2,800 tokens por segundo
Ambos modelos están entrenados mediante aprendizaje por refuerzo para sobresalir en llamadas paralelas a herramientas y en la navegación eficiente del código. Ejecutan hasta 8 llamadas paralelas a herramientas por turno, con un máximo de 4 turnos, lo que les permite explorar distintas partes de tu base de código simultáneamente.
Los modelos usan un conjunto restringido de herramientas multiplataforma (grep, read, glob) para garantizar un rendimiento consistente en diferentes sistemas operativos y entornos de desarrollo.