A todos nos ha sucedido en algún momento mientras navegamos por la web: en algún momento, haces clic en un enlace roto y recibes un mensaje que dice que la página web que estás buscando no existe.
Es tan común como frustrante, y parece que el problema solo empeorará a medida que Internet continúa expandiéndose y las páginas web antiguas se migran o se abandonan.
Incluso hay un nombre para el problema. Se llama link rot, un término que data de los años 90, cuando Internet saltó a la fama.
A principios de este mes, el Centro de Investigación Pew publicó un informe que profundiza en el temaconstatando que ya no se puede acceder a un tercio de las páginas web que existían en 2013.
Aquí hay algunas otras ideas que Pew descubrió:
- «El 23% de las páginas web de noticias contienen al menos un enlace roto, al igual que el 21% de las páginas web de sitios gubernamentales».
- «El 54% de las páginas de Wikipedia contienen al menos un enlace en su sección «Referencias» que apunta a una página que ya no existe».
- «Casi uno de cada cinco tweets ya no son visibles públicamente en el sitio apenas unos meses después de su publicación».
Joseph Reagle, profesor asociado de estudios de comunicación en la Universidad Northeastern, dice que el problema comienza con la infraestructura de las tecnologías URL, que significan localizador uniforme de recursos.
Las URL sirven como puntos de dirección para páginas web en Internet, similares a direcciones de lugares físicos como su casa o su trabajo. Las URL son excelentes porque permiten a las personas encontrar sitios web fácilmente, pero el problema es que pueden romperse fácilmente, afirma.
En los años 90, Reagle trabajó con Tim Berners-Lee, a quien se le atribuye en gran medida la invención de Internet, en el World Web Consortium como analista de políticas. Se habló extensamente de los problemas relacionados con las URL.
«Sabíamos, por ejemplo, que las URL no se mantienen muy bien. Si usted es una organización o una empresa y decide reorganizarse o decide cambiar de plataforma, todas las URL generalmente se rompen».
En los inicios de la web, los tecnólogos de Internet examinaron la idea de utilizar alternativas para el sistema URL. En cambio, una propuesta fue utilizar tecnologías basadas en URN, que significan nombres uniformes de recursos, que funcionarían de manera similar al sistema ISBN utilizado para catalogar libros, dice Reagle.
Pero el problema es que alguna organización más grande estaría a cargo de gestionarlo. El sistema ISBN es gestionado por la agencia Internacional ISBN, entidad que fue designada por la Organización Internacional de Normalización.
«Así que uno se enfrenta a dos problemas», dice Reagle. «O dejas que todos creen sus URL y administren sus recursos, y tienden a ser muy malos con el tiempo, o creas repositorios centralizados con identidades permanentes, pero configurarlos es costoso y difícil de mantener».
Por lo tanto, el sistema de URL se ha convertido en la principal forma en que las personas interactúan con la web, señala, y los problemas relacionados con el deterioro de los enlaces persisten.
«La gente plantea el tema de vez en cuando. Recibe un poco de atención y luego el mundo sigue adelante», dice Reagle. «Ha habido intentos de encontrar soluciones, pero los problemas aún persisten».
Las organizaciones de archiveros han surgido de la nada para ayudar a resolver estos problemas. Algunos proyectos notables incluyen Wayback Machine, archive.today y perma.cc, que permiten a las personas acceder a versiones antiguas de páginas web que ya no están activas y archivar ellas mismas páginas web nuevas.
Pero estos servicios existen en gran medida de forma precaria y en la sombra, señala Regale, en gran medida por pequeños grupos de personas con un profundo interés en la preservación en línea.
Estos esfuerzos también requieren que los usuarios individuales ayuden a construir sus bases de datos, lo que puede verse como una gran petición y es insuficiente para archivar adecuadamente grandes extensiones de la web.
«Todos son un poco diferentes y no todos son perfectos», dice. «Perma.cc y otros programas similares requieren que las personas digan de manera proactiva: «Oye, haz una copia de esta página», y no todos van a hacer eso. Hay grandes cantidades de Internet que no están en Perma.cc».
Estos problemas van más allá de los desafíos de infraestructura y colaboración humana. También existen cuestiones relacionadas con los derechos de autor y las protecciones legales que tienen las personas al trabajar para preservar la web, añade Regale.
Ahí es donde el gobierno federal podría ayudar a desempeñar un papel.
«Me podía imaginar [Congress] aprobar una ley que, por ejemplo, otorgara disposiciones de protección a quienes archivaban contenidos con fines educativos o de investigación», afirma.
Esta historia se republica por cortesía de Northeastern Global News. noticias.northeastern.edu.
Citación: ¿Internet es realmente para siempre? Link rot requiere cambios de infraestructura y colaboración humana para resolverse (2024, 29 de mayo) obtenido el 29 de mayo de 2024 de https://techxplore.com/news/2024-05-internet-link-requires-infrastructure-human.html
Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.
GIPHY App Key not set. Please check settings