viernes, 2 de diciembre de 2011

El futuro de la Arqueología.

No sé cuanto tiempo tendrá que pasar, pero sigo obsesionado con la idea de que la Arqueología del futuro tendrá que ampliar su definición. No hay otra; los arqueólogos/historiadores de los siglos venideros serán programadores o no serán. Proyectos como el de la Wayback Machine son como para flipar y si no leed...el texto que sigue es de Álvaro Ibañez, y originalmente lo pillé de aquí.


Wayback Machine es para muchos uno de los proyectos más apasionantes e interesantes de Internet. Si hubiera que salvar para el futuro sólo uno de todos los que actualmente existen, tal vez debería ser éste. Se trata de un archivo histórico de cómo es y era la Web, desde más de una década: una especie de "memoria histórica" construida rastreando y guardando copias completas de todas las páginas web, imágenes y documentos que en ella aparecen. Tan histórica es su importancia que hace tiempo realizaron una copia de seguridad de toda la información en grandes discos y los enviaron a la biblioteca de Alejandría, para que fueran preservados en caso de catástrofe. 

El actual propietario de la Wayback Machine es The Internet Archive, una organización sin ánimo de lucro que consiguió una de las primeras copias del contenido completo de la Web gracias al trabajo de Alexa Internet -una empresa que ahora es propiedad de Amazon- que se dedicaba a esas labores de rastreo con finalidades de marketing. Este archivo contiene en la actualidad más de 5 petabytes (5 millones de gigabytes) de información, y la herramienta que ofrecen a los usuarios para navegar por tan vasta biblioteca es la "máquina del tiempo" denominada Wayback Machine, que ahora se ha renovado. 


¿Cómo funciona? La nueva Wayback Machine funciona de una manera tan simple como la anterior: basta teclear la dirección (URL) de una página web cualquiera para ver cuál es la última copia que hay guardada en el archivo.

¿Para qué sirve? El archivo, que comenzó a guardarse allá por 1996, contiene todo tipo de webs. Por un lado los "arqueólogos digitales" lo utilizan para examinar cómo eran las versiones de los sitios oficiales de ciertas empresas o proyectos en la antigüedad, dado que las páginas actuales raras veces conservan los diseños anteriores. Por otro lado, si una web desaparece o se borra, aun así permanecerá en el archivo. Este es el caso de webs y dominios que cambian de propietario o simplemente de proyectos con final desgraciado. ¿Quién no recuerda el entrañable mundo de GeoCities? 


A los investigadores privados tampoco les viene mal este archivo, pues es extraño por no decir imposible que algo que estuvo publicado durante un tiempo razonable no haya sido capturado por la máquina y guardado para siempre. La mayor parte de la gente conoce únicamente la famosa "caché de Google", un enlace que aparece junto a los resultados de las búsquedas que muestra cómo es o era una página aunque haya desaparecido temporalmente por alguna razón. Pero cuando una página cambia, es borrada o trasladada de forma definitiva, Google normalmente actualiza su memoria caché, borrando la vieja copia.

Pero si bien Google guarda únicamente una versión de cada página, la Wayback Machine las guarda todas. Es una especie de "fotografía del momento" que perdura para siempre. Aun así, quienes prefieran que ciertos contenidos desaparezcan para siempre –tarea nada fácil, por no decir imposible– sólo tienen que hacer una cosas: crear un fichero llamado robots.txt y ponerlo en su web para evitar que Google, la Wayback Machine u otros "robots" accedan al contenido. Al hacer esto el sistema de Archive.org también borrará los documentos archivados en el pasado dado que, como ellos mismos dicen, "no tenemos ningún interés en dar acceso a webs, documentos o guardar cosas que la gente no quiere que guardemos". [No olvides hacer click en alguno de los Anuncios de Google líneas más abajo. Ayúdame a mantener la web. Gracias!!]

No hay comentarios:

Publicar un comentario

LinkWithin

Related Posts Plugin for WordPress, Blogger...