Exclusivo
Tecnología

Falla global de Cloudflare: la empresa detalla qué provocó la interrupción
La empresa detalló que un cambio en su base de datos generó un archivo defectuoso que saturó el sistema antibots y colapsó la red
Tras la caída de ocho horas que perjudicó a servicios como X, ChatGPT, Canva y League of Legends, Cloudflare reveló el origen del incidente. Matthew Prince aseguró que “el problema no fue causado, ni directa ni indirectamente, por un ciberataque ni por ninguna actividad maliciosa”, dejando claro que el fallo se produjo dentro de su propia infraestructura.
(Lea esta nota también: Caída de ChatGPT en el mundo: ¿por qué tuvo fallas el mismo día que X?)
Según explicó el directivo en el comunicado oficial, la raíz del problema estuvo completamente dentro de la propia infraestructura. Un cambio aplicado en los permisos de una de sus bases de datos provocó un error que se propagó a gran parte de la red. Esta modificación afectó un archivo clave del sistema, generando las condiciones para un fallo en cadena.
La falla en el sistema antibots que provocó el colapso
El ajuste en la base de datos generó contenido duplicado dentro del archivo que alimenta al sistema encargado de detectar bots. Ese archivo, al crecer más de lo previsto, superó el límite tolerado por el software. Como resultado, el sistema no pudo manejar la sobrecarga y comenzó a generar errores de manera consecutiva, afectando el funcionamiento normal de la red.
La empresa detalló que, una vez que el archivo superó su tamaño permitido, el software entró en estado de “pánico”, lo que explica la magnitud del impacto. Este comportamiento generó la desconexión de servicios esenciales de seguridad, CDN y herramientas internas, convirtiendo el fallo en una interrupción generalizada. La réplica del archivo dañado a todos los servidores del mundo amplificó el problema en cuestión de minutos.
Las medidas anunciadas
Cloudflare explicó que, aunque la restauración del archivo afectado fue relativamente rápida, los servicios conectados al núcleo de la plataforma también fallaron por arrastre. Para estabilizar la red fue necesario bloquear la creación del archivo defectuoso y reemplazarlo manualmente.
La compañía reconoció que esta fue su peor interrupción desde 2019 y anunció que implementará controles más estrictos sobre los archivos internos, además de mecanismos adicionales para desactivar funciones en caso de errores inesperados. Estas medidas buscan evitar que fallas similares vuelvan a afectar la continuidad de sus servicios y garantizar la estabilidad de la red global.
Además, Matthew Prince asumió públicamente la responsabilidad de la caída y lamentó la magnitud del impacto. Reconoció que la falla afectó al tráfico principal de la red y afirmó que “hoy les hemos fallado”, subrayando el papel crítico de Cloudflare en el ecosistema digital y la dificultad que representó para el equipo que la red no pudiera enrutar tráfico durante varias horas.
¿Quieres acceder a todo el contenido de calidad sin límites? ¡SUSCRÍBETE AQUÍ!