GitHub admite sus problemas y promete trabajar para solucionar sus constantes interrupciones del servicio

Los servidores de GitHub se caen continuamente desde febrero, ahora sus desarrolladores confirman que tienen un problema más serio de lo que imaginaban.
GitHub se enfrenta a un nuevo problema. La plataforma atraviesa un momento complicado desde las recientes vulnerabilidades detectadas con una oleada de malwares.
La plataforma se ha convertido en una biblioteca de archivos maliciosos que ha llegado a afectar incluso a herramientas como LiteLLM para Python. Además, la situación empieza a ser límite con las continuas interrupciones en el servicio.
GitHub admite tener problemas serios
Desde GitHub confirman haber mejorado la monitorización y los sistemas para aislar componentes críticos con los que prevenir futuras cascadas de fallos. Las nuevas medidas de seguridad son un buen punto de partida, pero no son suficiente.
GitHub ha admitido que necesitan un "trabajo arquitectónico profundo" para resolver las interrupciones continuas que han dejado casi todos sus servicios prácticamente inoperativos.
Vladimir Fedorov, director de tecnología de GitHub, confirma que los incidentes ocurridos entre febrero y marzo fueron consecuencia de un "crecimiento de uso extremadamente rápido" en la plataforma.
GitHub ha terminado siendo víctima de su propio éxito. El uso masivo de la plataforma ha evidenciado las limitaciones que tiene la interfaz desde la base. Las caídas tenían un patrón común: se producían durante los picos de carga.
Dos de las aplicaciones más populares lanzaron actualizaciones a principios de febrero, lo que generó más de diez veces el tráfico API habitual. Las caídas en GitHub empezaron a ser habituales desde ese momento.
Más tráfico y mayores caídas de GitHub

La plataforma se ha visto desbordada en numerosas ocasiones desde febrero debido a un tráfico muy superior a su capacidad. GitHub fue incapaz de filtrar y bloquear a los usuarios con un comportamiento sospechoso.
El 9 de febrero fue un día crítico cuando la plataforma sufrió uno de sus mayores picos de tráfico. Los ciberdelincuentes aprovecharon esta debilidad de GitHub: la plataforma no podía impedir que los hackers saturaran el sistema con solicitudes masivas y código infectado con malwares.
Las interrupciones continuaron hasta marzo con fallos en las solicitudes de hasta el 40% para github.com, el 43% para la API de GitHub y el 21% para GitHub Copilot. Algunos días incluso han registrado fallos en la ejecución de flujos de trabajo en el 95% de las solicitudes con un retraso medio de 30 minutos.
Los problemas siguieron escalando hasta el 19 de marzo, cuando la tasa de error media de Copilot Coding Agent de GitHub llegó al 99%. La plataforma tenía un fallo de autenticación que impidió conectarse a su base de datos.
Jakub Oleksy, vicepresidente de ingeniería de GitHub, ha confirmado estos errores continuos, asegurando que la plataforma necesita un "trabajo arquitectónico profundo".
“Sabemos que GitHub es una infraestructura digital fundamental, y estamos tomando medidas urgentes para garantizar que nuestra plataforma esté disponible cuando y donde la necesites”, según Fedorov en un comunicado.

