La historia de internet y las muchas webs antiguas que van a desaparecer

Autor: Adam Rogers

Adam Rogers es un escritor y periodista reconocido por su trabajo en temas de ciencia, tecnología y cultura. Ha contribuido a diversas publicaciones, explorando cómo la innovación y los avances científicos impactan la vida cotidiana.

Estados y tecnología | Globalización | Noticias

24 Nov, 2024

24 Nov, 2024

El profetizado apocalipsis digital ya está aquí, y ha sido pregonado por un post publicado en un blog.

El titular de la publicación, del 18 de julio, sonaba bastante críptico. «Los enlaces del acortador de URL de Google dejarán de estar disponibles», declaraba. Lo sé, lo sé, igual apocalipsis suena exagerado (no es exactamente un ataque de zombis alienígenas de una dimensión mortal). Pero la noticia me asustó. Significa que hay una parte de la web a punto de desaparecer. Este – es preciso recordar – no es un problema nuevo, ya hemos asistido antes de ahora a estos efectos de desaparición, aun cuando hubo proyectos que intentaron conservar la información que tendía a desaparecer. Hay cierta lógica, en cuanto a que el crecimiento de Internet – algo que comentamos en un “paper” de investigación hace algunos años, es incontenible. En aquel momento, habíamos calculado que, si alguien quería leer todo el contenido de la red, debería pasar aproximadamente cien anos dedicado a ello, sin moverse de su lugar, durante las veinticuatro horas del día. También habíamos examinado la denominada “información redundante”, esto es, las repeticiones dentro de la Red ascendían hasta el 30%-40% de la información en ese momento en línea.

La cuestión es la siguiente: Google solía tener un servicio online que generaba versiones breves y fáciles de usar de las largas e incómodas URL, las direcciones que identifican todo en internet. Las URL más cortas son más fáciles de rastrear y mejores para el comercio electrónico. Google dejó de acortarlas en 2019, pero las URL concisas que ya había creado seguían haciendo su trabajo. Hacías clic en una y te llevaba a la página web correcta, como se supone que debe ser.

Pues bien, eso ya es historia. En el artículo publicado en su blog, Google anunciaba que a partir del año que viene, todos los enlaces acortados se desactivaránPuf. En internet, si tu URL no funciona, es como si no existieras. Te vuelves imposible de encontrar. Sin un laborioso proceso de redireccionamiento, todo lo que hay detrás de esos enlaces —miles de millones de ellos, toda una década de contenido digital— se volverá inaccesible. Desaparecerá por completo. 

Ahora bien, hacer que una cantidad de contenido web se vuelva invisible no supone el fin del mundo. No por sí solo. El problema es que este tipo de cosas sigue ocurriendo. Y cada vez es peor. Las redes sociales se están desmoronando. Los medios de comunicación digitales se están viendo abocados al cierre. Las empresas eliminan sus productos online. Los enlaces se corrompen. Los archivos no se encuentran. La nube, como algunos bromistas han señalado, no es más que un concepto que en realidad se basa en «los ordenadores de otros». Y cuando esas nubes se apagan, no queda ni rastro de lo que guardaban.

Quizá nada de esto importe mucho ahora mismo. Pero lo hará. Internet se ha convertido en el archivo predeterminado de nuestra historia y cultura, y ahora mismo se encuentra ardiendo ante nuestros ojos, como la Biblioteca de Alejandría, solo que peor. Por primera vez desde que los humanos comenzaron a tallar en las rocas, estamos creando una era sin historiaEstamos a punto de entrar en la Edad Oscura Digital.

El apocalipsis algorítmico ya está aquí y nos está destrozando la vida:

Los intentos de cuantificar el alcance del problema son desgarradores. La mitad de los enlaces en las decisiones de la Corte Suprema de Estados Unidos ya no conducen a la información que se cita. Un reportaje de 2021 descubrió que una cuarta parte de los más de 2.2 millones de hipervínculos en la web de The New York Times estaban rotos. Aún peor, el Centro de Investigación Pew de Estados Unidos estima que una cuarta parte de todo lo que se publicó en la web entre 2013 y 2023 ahora mismo es inaccesible, lo que significa que casi el 40% de la web tal como existía en 2013 simplemente no existe hoy, apenas una década después.

La destrucción de esos enlaces no me preocuparía tanto si no hubieran reemplazado lo que había antes, si las salas de los museos y los polvorientos estantes de las bibliotecas todavía sirvieran como los almacenes de nuestra memoria colectiva. No es que eche de menos los días de viejos periódicos preservados en microfichas, o de intentar convencer a un bibliotecario para obtener un préstamo interbibliotecario internacional. Me alegra que muchas películas antiguas estén en streaming y que muchos libros descatalogados estén a solo un clic. Pero los archivos y las bases de datos son más que lugares para guardar cosas viejas; lo que conservamos define quiénes somos. Hoy, tanto de todo es solo digital que cuando desaparece, deja un vacío en nuestra cultura compartida.

Gawker ha desaparecido. También lo ha hecho el archivo de The Awl, la querida web de crítica cultural. Puedes ir a una biblioteca y leer toda la producción de periódicos que llevan mucho tiempo muertos como el Los Angeles Herald Examiner o el New York Newsday, pero Dios te ayude si quieres leer viejos artículos de Vice. Los problemas sobre la propiedad de lo que en su día era Paramount han dado como resultado la eliminación de décadas de programas en MTV y Comedy Central.

El archivo de Cartoon Network también ha desaparecido, al igual que Yahoo Groups, Yahoo Respuestas, grandes partes del servicio de fotos Imgur, las partes picantes de Tumblr que fueron eliminadas en una purga de pornografía, todo lo que ocurrió en Friendster y otras redes sociales previas a Facebook, Club Penguin, Neopets, Geocities, AOL y Prodigy. O Tuenti en España. Grandes extensiones de videojuegos creados para sistemas ya obsoletos son hoy recuerdos inalcanzables.

Los discos duros tienen una vida útil finita, y los que la industria musical usó para almacenar en la década de los 90 antes de la transición al formato digital se están deteriorando. El Departamento de Asuntos de Veteranos de los Estados Unidos está legalmente obligado a preservar todos los registros médicos durante 75 años después de la muerte de un veterano, pero está teniendo problemas, en parte debido a un sistema digital de registros defectuoso. Y eso sin mencionar cosas como las fotografías personales, la mayoría de las cuales ahora solo existen en tu teléfono y en ningún otro lugar

¿Todos los correos electrónicos que enviaste o recibiste en tu último trabajo, o cualquier cosa que un familiar fallecido tuviera en su ordenador ahora inutilizable? Estas son las cosas que nos hacen ser nosotros. Sin embargo, te reto a que las encuentres.

Por qué es tan frustrante buscar cualquier cosa en internet:

Siempre hay almas valientes que intentan rescatar pergaminos de una biblioteca en llamas. Pero es difícil rescatar algo que solo existe a nivel etéreo. «Si una biblioteca se incendia, es una tragedia, pero la mayoría de los libros sobreviven en otro lugar», señala Mark Graham, un destacado archivista de internet. «Pero el mundo digital es inherentemente frágil y potencialmente efímero«, añade.

Graham es el director de la Wayback Machine, un proyecto creado hace décadas que busca recolectar y guardar copias digitales de páginas web para evitar que se pierdan. ¿Gawker? Sí, consiguieron conservar la mayor parte. Sobre ese estudio de Pew que he mencionado antes, que decía que más de un tercio del internet reciente había desaparecido, Graham explica lo siguiente: «Cuando repetimos su estudio usando sus datos, descubrimos que alrededor de dos tercios de ese material estaban guardados de manera segura en la Wayback Machine. Así que, en realidad, solo se ha perdido una novena parte».

A medida que almacenamos nuestras vidas en nuestros dispositivos, estamos eligiendo activamente crear enormes vacíos en nuestro registro histórico. Es una amnesia cultural autoinfligida.

La Wayback Machine archiva automáticamente más de 1.000 millones de URL cada día. También realiza un mantenimiento constante de los cientos de millones de enlaces en las 320 ediciones lingüísticas de Wikipedia, que están perdiéndose a un ritmo de nada menos que 10.000 diarios. Recientemente, Graham trabajó en la preservación de 5.000 videos de un canal de YouTube dirigido por activistas rohinyás, cuyo pueblo fue sometido a un genocidio en 2017. «Nos pidieron que los archiváramos porque YouTube elimina regularmente videos de su plataforma. Ni siquiera dejan los metadatos, así que no puede saberse qué contenido ha sido eliminado», comenta Graham. Añade que consiguió conservar todos los videos excepto uno, que tenía restricciones de edad.

Normalmente, el mayor obstáculo de la Wayback Machine son los muros de pago. La mayoría de los artículos en las revistas científicas del mundo, por ejemplo, están ampliamente disponibles para cualquiera con una suscripción universitaria. Pero los artículos son prohibitivamente caros para el resto de nosotros, incluso si nuestros impuestos pagaron la investigación que describen. Un archivo no es realmente un archivo si no es accesible para todos.

Y actualmente, existe una nueva amenaza para archivar nuestra historia: la inteligencia artificial. Cuando las webs no quieren permitir que la IA absorba su contenido, bloquean un cierto tipo de bot rastreador digital, el mismo tipo que usa la Wayback Machine. «Esto ha sucedido casi de la noche a la mañana», señala Graham. La IA, con su insaciable hambre de datos de entrenamiento, no puede acceder a muchas páginas. Pero tampoco pueden los archivistas. Como consecuencia de la aparición de la inteligencia artificial, va a desaparecer más inteligencia, paradójicamente.

Seamos claros: esto va más allá de la desaparición de algunos artículos de noticias o contenido de tu cómic favorito. Lo que un archivo es capaz de conservar, hasta los formatos que caben en sus archivadores o bancos de datos, determina literalmente qué se recuerda. Si preservas, por ejemplo, registros bancarios del siglo XVIII, pero no patrones de costura, olvidarás a muchas personas. De manera similar, si tu archivo digital conserva solo los registros de empresas rentables —porque las que quebraron terminan destruyendo sus servidores— pierdes la memoria de todo por lo que esas empresas desaparecidas trabajaron. Y lo que se recuerda del pasado determina lo que podemos hacer en el presente. «La sociedad es memoria. Cuando pierdes esa memoria, ¿qué implica?», resume Marlene Manoff, quien fue estratega principal de colecciones en las bibliotecas del MIT. 

Los discos duros ilegibles y los enlaces que desaparecen no son las únicas amenazas para el registro histórico. Piensa en los selfies. Hace quince años, una investigadora del Instituto Scripps de Oceanografía llamada Loren McClenachan quería saber si la sobrepesca comercial y los cambios ambientales estaban haciendo que los peces fueran más pequeños. Para conseguirlo, revisó cinco décadas de fotos de las capturas ganadoras de competiciones de pesca deportiva en Key West, Florida. Resultó que la compañía de botes pesqueros que organizaba las competencias había guardado todas las fotografías físicas, la mayoría con la fecha escrita a mano en la parte de atrás.

Armada con estos archivos, McClenachan pudo demostrar que, en la última mitad de siglo, los tamaños de las capturas premiadas habían disminuido en más de un 50%. Ninguno de esos datos hubiera estado disponible si todos los pescadores hubieran guardado los registros de sus capturas en sus teléfonos. En su lugar, estaríamos sujetos a lo que se conoce como «síndrome del punto de referencia cambiante», la suposición común de que lo que es normal hoy, también lo fue en el pasado.

A medida que internet desaparece y almacenamos nuestras vidas en nuestros dispositivos, estamos eligiendo activamente crear enormes vacíos en nuestro registro histórico. Es una amnesia cultural autoinfligida, empeorada por el hecho de que gran parte de la web está en manos de grandes corporaciones que valoran poco la preservación. «A largo plazo, no puedes preservar un objeto digital en su forma original», afirma Manoff, la exbibliotecaria del MIT. «Pero en el caso de la propiedad corporativa, la probabilidad de una gestión responsable a largo plazo del contenido digital en cualquier forma se vuelve cada vez más improbable», añade.

La Edad Oscura, como los historiadores solían llamar a la época de los primeros siglos de la Europa medieval, duró 500 años. Nuestra versión digital podría no tener fin. Una sociedad post-alfabetizada deja exactamente la misma huella en el mundo que una pre-alfabetizada. Es decir, no deja prácticamente ninguna.

.

Traducción de Cristina Gálvez

Comentarios del Director del Laboratorio, Dr. Ricardo Petrissans (en itálica)

Autor: Adam Rogers

Autor: Adam Rogers

Adam Rogers es un escritor y periodista reconocido por su trabajo en temas de ciencia, tecnología y cultura. Ha contribuido a diversas publicaciones, explorando cómo la innovación y los avances científicos impactan la vida cotidiana.

Artículos relacionados

0 comentarios

Enviar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

error: Content is protected !!