¿Cómo evolucionará Internet en las próximas décadas?
Los escritores de ficción han explorado algunas posibilidades.
En su novela de 2019 «Caer«, autor de ciencia ficción Neal Stephenson Imaginó un futuro cercano en el que Internet todavía existe. Pero está tan contaminado con desinformación, desinformación y publicidad que es en gran medida inutilizable.
Los personajes de la novela de Stephenson abordan este problema suscribiéndose a «corrientes de edición»: noticias e información seleccionadas por humanos que pueden considerarse confiables.
El inconveniente es que sólo los ricos pueden permitirse este tipo de servicios personalizados, lo que deja a la mayor parte de la humanidad consumiendo contenidos en línea de baja calidad y no seleccionados.
Hasta cierto punto, esto ya ha sucedido: muchas organizaciones de noticias, como The New York Times y The Wall Street Journal, han colocado su contenido curado detrás de muros de pago. Mientras tanto, la desinformación se agrava en plataformas de redes sociales como X y TikTok.
El historial de Stephenson como pronosticador ha sido impresionante: anticipó el metaverso en su novela de 1992 «Choque de nieve,» y un elemento clave de la trama de su «Edad del Diamante«, publicado en 1995, es un manual interactivo que funciona muy parecido a un chatbot.
A primera vista, los chatbots parecen ofrecer una solución a la epidemia de desinformación. Al distribuir contenido factual, los chatbots podrían proporcionar fuentes alternativas de información de alta calidad que no estén acordonadas por muros de pago.
Irónicamente, sin embargo, el resultado de estos chatbots puede representar el mayor peligro para el futuro de la web, un peligro que ya fue insinuado décadas antes por el escritor argentino Jorge Luis Borges.
El auge de los chatbots
Hoy en día, una fracción significativa de Internet todavía se compone de contenido fáctico y aparentemente veraz, como artículos y libros que han sido revisados por pares, verificados o examinados de alguna manera.
Los desarrolladores de grandes modelos de lenguaje, o LLM, los motores que impulsan bots como ChatGPT, Copilot y Gemini, han aprovechado este recurso.
Sin embargo, para realizar su magia, estos modelos deben ingerir inmensas cantidades de texto de alta calidad con fines de formación. Ya se ha extraído una gran cantidad de palabrería de fuentes en línea y se la ha transmitido a los incipientes LLM.
El problema es que la web, por enorme que sea, es un recurso finito. El texto de alta calidad que aún no ha sido extraído es volviéndose escasolo que llevó a lo que The New York Times llamó un «crisis emergente en el contenido«.
Esto ha obligado a empresas como OpenAI a celebrar acuerdos con los editores para obtener aún más materia prima para sus voraces robots. Pero según una predicción, la escasez de datos adicionales de entrenamiento de alta calidad podría ocurrir ya en 2026.
A medida que los resultados de los chatbots terminan en línea, estos textos de segunda generación, completos con información inventada llamada «alucinaciones«, así como errores directos, como sugerencias para poner pegamento en la pizza, contaminarán aún más la web.
Y si un chatbot se junta con el tipo equivocado de personas en línea, puede captar sus opiniones repelentes. Microsoft descubrió esto de la manera más difícil en 2016, cuando tuvo que desconectar a Tayun bot que empezó a repetir contenido racista y sexista.
Con el tiempo, todos estos problemas podrían hacer que el contenido en línea sea aún más menos confiable y menos útil de lo que es hoy. Además, los LLM que reciben una dieta baja en calorías pueden producir resultados aún más problemáticos que también terminan en la web.
Una biblioteca infinita e inútil
No es difícil imaginar un circuito de retroalimentación que resulte en un proceso continuo de degradación a medida que los robots se alimentan de su propia producción imperfecta.
Un artículo de julio de 2024 publicado en Naturaleza exploró las consecuencias de entrenar modelos de IA con datos generados de forma recursiva. Demostró que los «defectos irreversibles» pueden conducir a «colapso del modelo» para sistemas entrenados de esta manera, al igual que la copia de una imagen y una copia de esa copia, y una copia de esa copia, perderán fidelidad a la imagen original.
¿Qué tan malo podría llegar a ser esto?
Consideremos el cuento de Borges de 1941 «La biblioteca de Babel.» Cincuenta años antes que el informático Tim Berners-Lee Cuando creó la arquitectura para la web, Borges ya había imaginado un equivalente analógico.
En su historia de 3.000 palabras, el escritor imagina un mundo formado por un número enorme y posiblemente infinito de habitaciones hexagonales. Las estanterías de cada habitación contienen volúmenes uniformes que, según intuyen sus habitantes, deben contener todas las permutaciones posibles de letras de su alfabeto.
Inicialmente, esta comprensión provoca alegría: por definición, deben existir libros que detallen el futuro de la humanidad y el significado de la vida.
Los habitantes buscan estos libros, sólo para descubrir que la gran mayoría no contienen más que combinaciones de letras sin sentido. La verdad está ahí fuera, pero también toda falsedad concebible. Y todo ello está incrustado en una cantidad inconcebiblemente enorme de galimatías.
Incluso después de siglos de búsqueda, sólo se encuentran unos pocos fragmentos significativos. E incluso entonces, no hay manera de determinar si estos textos coherentes son verdades o mentiras. La esperanza se convierte en desesperación.
¿Estará la Web tan contaminada que sólo los ricos podrán permitirse información precisa y confiable? ¿O un número infinito de chatbots producirá tanta palabrería contaminada que encontrar información precisa en línea será como buscar una aguja en un pajar?
Internet se describe a menudo como uno de los grandes logros de la humanidad. Pero como cualquier otro recurso, es importante pensar seriamente en cómo se mantiene y gestiona, para que no acabemos enfrentándonos a la visión distópica imaginada por Borges.
Este artículo se republica desde La conversación bajo una licencia Creative Commons. Lea el artículo original.
Citación: Un cuento de Borges de 83 años presagia un futuro sombrío para Internet (2024, 19 de noviembre) recuperado el 19 de noviembre de 2024 de https://techxplore.com/news/2024-11-year-short-story-borges -presagia.html
Este documento está sujeto a derechos de autor. Aparte de cualquier trato justo con fines de estudio o investigación privados, ninguna parte puede reproducirse sin el permiso por escrito. El contenido se proporciona únicamente con fines informativos.
GIPHY App Key not set. Please check settings