Recuperar paginas web borradas

Recuperar paginas web borradas

Encontrar sitios web eliminados

Wayback Machine es el famoso y mayor archivo de sitios web del mundo. Tiene más de 400 mil millones de páginas en sus servidores. ¿Existe algún servicio de archivo como Archive.org? Sí, hay algunos servicios alternativos, pero todos ellos no son más que una fina sombra de archive.org. La principal diferencia entre el Archivo de Internet y todas las alternativas es el tamaño. Archive.org es mucho más grande que todos ellos.

Hay unos 25 clones pequeños y locales de archive.org, todos ellos con bases de datos muy limitadas. Este sitio web – timetravel.mementoweb.org es un motor de búsqueda de viajes en el tiempo para archivos web. También puede ayudarte a encontrar contenidos borrados. Time Travel busca páginas en caché en archive.org, archive.is y en algunos lugares extraños como Icelandic Web Archive o Web Archive Singapore. Puedes encontrar la lista de servicios de archivo existentes en su página web – http://timetravel.mementoweb.org/about/

Hace tres años, el 29 de septiembre de 2017, se puso en marcha nuestro servicio de descarga de archive.org. Todos estos 3 años hemos estado en continuo desarrollo, hemos creado nuestro propio CMS, un plugin de WordPress, un sistema…

Páginas de Internet perdidas

En este artículo consideraremos los Archivos Web de sitios o archivos de Internet: cómo recuperar la información eliminada de los sitios, cómo descargar ya sitios inexistentes y otros ejemplos y casos de uso.

El principio de funcionamiento de todos los Archivos de Internet es similar: alguien (cualquier usuario) indica una página para guardar. El Archivo de Internet la descarga, incluyendo el texto, las imágenes y los estilos de diseño, y la guarda. Si se solicita, la página guardada puede verse desde el Archivo de Internet, y no importa si la página original ha cambiado o si el sitio no está disponible o ha dejado de existir por completo.

Muchos Archivos de Internet almacenan varias versiones de la misma página, tomando una instantánea de la misma en diferentes momentos. Gracias a ello, se puede rastrear el historial de cambios del sitio o página web a lo largo de los años de su existencia.

Los puntos en el calendario significan diferentes eventos, los diferentes colores tienen diferentes significados sobre la captura de la web. El azul significa que al archivar la página desde el servidor web, se recibió un código de respuesta 2nn (todo está bien); el verde significa que el rastreador ha recibido el estado 3nn (redirección); el naranja significa que el estado es 4nn (error en el lado del cliente, por ejemplo, la página no se encontró), y el rojo significa que el archivo recibió un error 5nn (problemas en el servidor). Lo más probable es que le interesen los puntos y enlaces azules y verdes.

Restaurar el sitio web eliminado

Si por casualidad ha encontrado este artículo porque recientemente ha sido víctima de la pérdida de su sitio web, entendemos que puede ser una de las peores situaciones que le pueden ocurrir a su negocio.  Mientras que muchos lo restregarán como una “lección difícil de respaldar” no cambia el hecho de que es una amarga realidad.

Dado que muchas personas que se conectan con nosotros han experimentado esto recientemente (sin nombrar ningún nombre de empresa) nos sentimos por cada individuo. Por eso sentimos que era nuestro deber crear un artículo para proporcionar algunas orientaciones sobre los pasos que puede y debe tomar si acaba de perder su sitio.

Este recurso le guiará en el proceso de recuperación y le ayudará a poner en marcha un sitio web más fiable, rápido, flexible y bonito. Nota: El caso ideal es que reproduzca exactamente el mismo sitio que tenía antes (estructura, URLs, contenido, etc.). Sin embargo, esto no es una tarea fácil.

Si algunos de los pasos compartidos le resultan abrumadores, necesita más ayuda o no está seguro de algún paso, no dude en ponerse en contacto con nosotros a través de nuestra página de contacto y estaremos encantados de explicárselo u ofrecerle sugerencias.

Máquina de retroceso

Vamos a suponer que conocemos la URL de una página concreta, que ahora mismo ya no está presente porque el blog o sitio web que la soportaba fue eliminado de todos los servidores de Internet. El primer truco que realizaremos es el siguiente:

Sólo tenemos que ir al navegador de Internet y dirigirnos al enlace que pertenece a Cachedview. También aparecerá un espacio donde, tendremos que copiar la URL de esa página que ya no existe actualmente. No te olvides de poner la URL completa, que también representa HTTP. En la parte inferior, aparecerán unas cuantas opciones de búsqueda, pudiendo probar cada una de ellas si alguna no nos ofrece un resultado efectivo.