in

Una pequeña actualización provocó la caída de millones de sistemas informáticos en todo el mundo: es una advertencia oportuna

Una pequeña actualización provocó la caída de millones de sistemas informáticos en todo el mundo: es una advertencia oportuna

Una pequeña actualización provocó la caída de millones de sistemas informáticos en todo el mundo: es una advertencia oportuna

Crédito: Gerd Altmann/Pixabay

La interrupción global del servicio informático que se produjo este fin de semana debido a una actualización de software que salió mal pone de relieve la naturaleza interconectada y a menudo frágil de la infraestructura informática moderna y demuestra cómo un único punto de fallo puede tener consecuencias de gran alcance.

El corte Se vinculó a una única actualización que se implementó automáticamente Halcón de Crowdstrikeuna herramienta de ciberseguridad omnipresente utilizada principalmente por grandes organizaciones. Esto provocó que las computadoras Microsoft Windows de todo el mundo dejaran de funcionar.

CrowdStrike ya ha solucionado el problema. Si bien muchas organizaciones han podido reanudar su trabajo, los equipos de TI tardarán un tiempo en reparar por completo todos los sistemas afectados; parte de ese trabajo debe realizarse manualmente.

¿Cómo pudo pasar esto?

Muchas organizaciones dependen de los mismos proveedores de servicios en la nube y de las mismas soluciones de ciberseguridad. El resultado es una especie de monocultura digital.

Si bien esta estandarización significa que los sistemas informáticos pueden funcionar de manera eficiente y son ampliamente compatibles, también significa Un problema puede tener consecuencias en cascada en muchas industrias y geografías. Como hemos visto en el caso de CrowdStrike, incluso puede extenderse por todo el mundo.

La infraestructura de TI moderna está altamente interconectada e interdependiente. Si un componente falla, puede generar una situación en la que el componente averiado desencadene un problema. reacción en cadena que impacta otras partes del sistema.

A medida que el software y las redes en las que opera se vuelven más complejos, aumenta la posibilidad de interacciones y errores imprevistos. Una actualización menor puede tener consecuencias no deseadas y propagarse rápidamente por toda la red.

Como hemos visto ahora, sistemas enteros pueden quedar paralizados antes de que los supervisores puedan reaccionar para evitarlo.

¿Cómo se involucró Microsoft?

Cuando las computadoras con Windows en todas partes comenzaron a fallar con un mensaje de «pantalla azul de la muerte», los primeros informes indicaron que la interrupción del servicio informático fue causada por Microsoft.

De hecho, Microsoft confirmó Experimentó una interrupción en los servicios en la nube en la región central de los Estados Unidos, que comenzó alrededor de las 6 p. m., hora del Este, el jueves 18 de julio de 2024.

Esta interrupción afectó a un subconjunto de clientes que utilizan varios servicios de Azure. Azur Es la plataforma de servicios en la nube propiedad de Microsoft.

La interrupción del servicio de Azure tuvo consecuencias de gran alcance, interrumpiendo los servicios en múltiples sectores, incluidos aerolíneas, minoristabanca y medios de comunicación. No solo en Estados Unidos sino también a nivel internacional en países como Australia y Nueva Zelanda. También afectó a varios servicios de Microsoft 365, incluidos PowerBI, Microsoft Fabric y Teams.

Como se ha demostrado ahora, toda la interrupción de Azure también podría deberse a… Se remonta a la actualización de CrowdStrikeEn este caso, estaba afectando a las máquinas virtuales de Microsoft que ejecutaban Windows con Falcon instalado.

¿Qué podemos aprender de este episodio?

No ponga todos los huevos de TI en una sola canasta.

Las empresas deberían utilizar una estrategia multicloud: distribuir su infraestructura de TI entre varios proveedores de servicios en la nube. De esta manera, si un proveedor deja de funcionar, Los demás pueden continuar para apoyar operaciones críticas.

Las empresas también pueden garantizar Su negocio sigue funcionando Incorporando redundancias en los sistemas de TI. Si un componente falla, otros pueden intervenir. Esto incluye contar con servidores de respaldo, centros de datos alternativos y «conmutación por error«mecanismos que pueden cambiar rápidamente a sistemas de respaldo en caso de una interrupción.

La automatización de los procesos rutinarios de TI puede reducir el riesgo de errores humanos, que son una causa común de interrupciones del servicio. Los sistemas automatizados también pueden monitorear posibles problemas y abordarlos antes de que se conviertan en problemas importantes.

Capacitación del personal sobre Cómo responder cuando se producen cortes de suministro eléctrico Puede gestionar una situación difícil para volver a la normalidad. Esto incluye saber a quién contactar, qué pasos tomar y cómo utilizar flujos de trabajo alternativos.

¿Qué tan grave podría llegar a ser una interrupción del servicio informático?

Es muy poco probable que Internet en su totalidad se caiga debido a la naturaleza distribuida y descentralizada de la infraestructura de Internet. Tiene múltiples rutas y sistemas redundantes. Si una parte falla, el tráfico puede ser redirigido a través de otras redes.

Sin embargo, existe la posibilidad de que se produzcan interrupciones aún mayores y más generalizadas que la interrupción del servicio de CrowdStrike.

El catálogo de posibles causas parece el guión de una película de catástrofes. Intensas erupciones solares, similares a las Evento de Carrington El huracán Katrina de 1859 podría causar daños generalizados a los satélites, las redes eléctricas y los cables submarinos que son la columna vertebral de Internet. Un evento de estas características podría provocar cortes de Internet que se extenderían por varios continentes y durarían meses.

La red mundial de Internet depende en gran medida de una red de cables submarinos de fibra óptica. Los daños simultáneos a varios cables importantes (ya sea por desastres naturales, terremotos, accidentes o sabotajes deliberados) podrían causar importantes interrupciones en el tráfico internacional de Internet.

Los ataques cibernéticos sofisticados y coordinados dirigidos a la infraestructura crítica de Internet, como los servidores DNS raíz o los principales puntos de intercambio de Internet, también podrían causar interrupciones a gran escala.

Si bien es muy poco probable que se produzca un apocalipsis total de Internet, la naturaleza interconectada de nuestro mundo digital implica que cualquier interrupción importante tendrá consecuencias de largo alcance, porque altera los servicios en línea de los que dependemos actualmente.

La adaptación y la preparación continuas son de vital importancia para garantizar la resiliencia de nuestra infraestructura de comunicaciones global.

Proporcionado por The Conversation


Este artículo se vuelve a publicar desde La conversación bajo una licencia Creative Commons. Lea el artículo original.La conversación

Citación:Una pequeña actualización provocó la caída de millones de sistemas informáticos en todo el mundo: es una advertencia oportuna (22 de julio de 2024) recuperado el 22 de julio de 2024 de https://techxplore.com/news/2024-07-small-brought-millions-world.html

Este documento está sujeto a derechos de autor. Salvo que se haga un uso legítimo con fines de estudio o investigación privados, no se podrá reproducir ninguna parte del mismo sin autorización por escrito. El contenido se ofrece únicamente con fines informativos.



Fuente

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

GIPHY App Key not set. Please check settings

Revisión de PDF Expert

Cómo canjear códigos para Type Soul.

Códigos de tipo Alma (julio 2024)