Computación en la nube La nube se ha convertido en un elemento crucial de la tecnología actual y funciona como columna vertebral de la conectividad global. Permite a las empresas, los gobiernos y las personas emplear y construir servicios basados en la nube y constituye la base de una amplia gama de sistemas que utilizamos todos los días, incluidas las telecomunicaciones, el transporte, la atención sanitaria, la banca e incluso los servicios de streaming.
Estos sistemas, como cualquier hardware o software, son susceptibles a fallos y ciberataques que pueden ocurrir de forma impredecible. Los cibercriminales son cada vez más decididos y sus ataques cada vez más sofisticados y frecuentes. Una de las tácticas que estos grupos emplean con frecuencia es Denegación de servicio distribuida (DDoS) ataques que inundan los sistemas de las empresas con más solicitudes y tráfico del que sus sistemas de TI pueden manejar.
Esto excluye a los usuarios legítimos del servicio, lo que causa problemas importantes para las empresas, como la pérdida de ingresos y la disminución de la lealtad de los clientes. Este problema puede causar grandes dificultades a empresas como Google y Amazon, que ofrecen servicios de computación en la nube para alojar los datos, sistemas y servicios de los consumidores.
En nuestro último estudioempleamos varias estrategias para demostrar cómo los sistemas de computación en la nube pueden fortalecerse ante el estrés. Empleamos algo llamado ingeniería del caos y estrategias adaptativas, que ayudan al sistema a aprender de las fallas y los ciberataques.
En su análisis trimestral más reciente sobre amenazas de ciberseguridad, la empresa de seguridad en la nube Cloudflare informó un aumento del 65 % en ataques DDoS en el tercer trimestre de 2023 en comparación con el trimestre anterior. Según Cloudflare Informe del segundo trimestre de 2024Hubo cuatro millones de ataques DDoS.
Además de los DDoS y otros ataques deliberados, las empresas que utilizan software basado en la nube también están… vulnerable a cortes de energía causados por problemas que van desde problemas de conexión hasta fallas físicas del servidor, algunos de los cuales también pueden ser resultado de ataques cibernéticos. A veces, Incluso un problema menor, como un error tipográfico.puede derribar sitios web basados en la nube.
El 19 de julio, fallas en el sensor Falcon de CrowdStrike provocaron que los hosts de Windows conectados al sistema de computación en la nube Microsoft Azure colapsaran, lo que provocó una interrupción global del servicio de TI en todo el mundo.
El sensor Falcon, diseñado para prevenir ataques cibernéticos, no se vio afectado por un ciberataque. La interrupción del servicio se debió a un problema técnico con una actualización. El 31 de julio, un error en las defensas DDoS de Microsoft provocó un corte de ocho horas en Azure.
Desenredando la fragilidad
Resolver cortes importantes como estos presenta desafíos significativos debido a la complejidad de la nube y sus numerosas dependencias de otros sistemas, incluso para la ciberseguridad. Implementar soluciones confiables puede llevar desde horas hasta varios días o, en algunos casos, como el de CrowdStrikeincluso más tiempo.
Este tipo de incidentes demuestra la fragilidad de nuestra infraestructura tecnológica en general, pero en particular de los sistemas basados en la nube. Las soluciones actuales se centran en gestionar los efectos de estos incidentes en lugar de abordar los problemas de raíz mediante la creación de sistemas en la nube más fiables y resistentes. Para evitar fallos, un paso crucial es integrar como estándar pruebas avanzadas del software para evaluar su resistencia y fiabilidad bajo presión.
En nuestra investigación, ayudamos a los consumidores de la nube a resistir estas amenazas haciendo exactamente eso: hacer que la computación en la nube sea más capaz de resistir grandes ataques e interrupciones y seguir funcionando. Los sistemas operativos en la nube también deben adaptarse y aprender de incidentes anteriores para fortalecerse.
Hemos estado utilizando una técnica llamada ingeniería del caos (atacar y experimentar deliberadamente con estas aplicaciones de software basadas en la nube) para observar cómo responde el sistema a dichos ataques.
Uno de nuestros artículos más recientes descubrió que podemos usar esta técnica para predecir con mayor precisión Cómo reaccionará un sistema ante un ataque. La ingeniería del caos implica introducir deliberadamente fallos en un sistema y luego medir los resultados. Esta técnica ayuda a identificar y abordar posibles vulnerabilidades y debilidades en el diseño, la arquitectura y las prácticas operativas de un sistema.
Los métodos pueden incluir apagar un servicio, inyectar latencia (un retraso en el modo en que un sistema responde a un comando) y errores, simular ciberataques, finalizar procesos o tareas, o simular un cambio en el entorno en el que el sistema está funcionando y en la forma en que está configurado.
En experimentos recientesintrodujimos fallas en sistemas en vivo basados en la nube para comprender cómo se comportan en situaciones de estrés, como ataques o fallas. Al aumentar gradualmente la intensidad de estas «inyecciones de fallas», determinamos el punto de estrés máximo del sistema.
Nuestra investigación reveló una reducción del rendimiento y de la disponibilidad de los servicios como resultado de ello. Por lo tanto, estos experimentos de ingeniería del caos descubrieron problemas que las mediciones de rendimiento tradicionales no podían detectar.
Aprendiendo del caos
La ingeniería del caos es una gran herramienta para mejorar el rendimiento de los sistemas de software. Sin embargo, para lograr lo que describimos como «antifragilidad» (sistemas que podrían fortalecerse en lugar de debilitarse bajo estrés y caos), necesitamos integrar las pruebas de caos con otras herramientas que transforman los sistemas para que se vuelvan más fuertes ante ataques.
En nuestro último trabajoPresentamos un marco adaptativo para hacer exactamente esto. Este marco, llamado «Unfragile», emplea ingeniería del caos para introducir fallas de manera incremental y evaluar la respuesta del sistema bajo estas tensiones.
Luego, introducimos nuevas estrategias adaptativas para eliminar las vulnerabilidades detectadas mediante la ingeniería del caos. Esto puede incluir la modificación del código fuente del propio software para mejorar su rendimiento. Al introducir métricas sobre el rendimiento del sistema en tiempo real, el sistema puede volverse adaptativo, ya que los problemas potenciales se detectan de manera temprana y se resuelven.
Al combinar la ingeniería del caos con estas estrategias adaptativas para alertar a los operadores sobre vulnerabilidades en tiempo real para que puedan solucionarse, podemos enseñar a los sistemas en la nube no solo a soportar el estrés, sino a volverse más fuertes ante él.
Esto garantizará que nuestra infraestructura digital crítica sea más robusta, confiable y capaz de aprender del caos para enfrentar mejor los desafíos futuros.
Este artículo se vuelve a publicar desde La conversación bajo una licencia Creative Commons. Lea el Artículo original.
Citación:Uso de la «ingeniería del caos» para hacer que la computación en la nube sea menos vulnerable a los ciberataques (26 de agosto de 2024) recuperado el 26 de agosto de 2024 de https://techxplore.com/news/2024-08-chaos-cloud-vulnerable-cyber.html
Este documento está sujeto a derechos de autor. Salvo que se haga un uso legítimo con fines de estudio o investigación privados, no se podrá reproducir ninguna parte del mismo sin autorización por escrito. El contenido se ofrece únicamente con fines informativos.
GIPHY App Key not set. Please check settings