Sunrays

Blogger Template by ThemeLib.com

Web superficial y web profunda

Published by Olga under on 22:36
 
La web superficial o visible abarca todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y puede ser recuperada casi en su totalidad mediante una consulta en sus formularios de búsqueda.
Sus características principales son:
 - es de libre acceso
 - su información no está contenida en bases de datos
 - no requiere registrarse para acceder a la información
 - está formada por páginas estáticas, son páginas o archivos con una URL fija y accesible desde otro enlace.
 
La web profunda o invisible es el término utilizado para describir toda la información disponible en internet que no se recupera interrogando a los buscadores convencionales. Normalmente es información almacenada y accesible mediante base de datos.

Sherman y Price, en el año 2001, identifican cuatro tipos de contenidos invisibles en la Web:
 
- la Web opaca

 

- la Web privada                                      
- la Web propietaria            
- la Web realmente invisible

 La web opaca

Se compone de archivos que, podrían estar incluidos en los índices de los buscadores, pero no lo están por alguno de esos motivos:
- Extensión de la indización: no todas las páginas de un sitio son indizadas en los buscadores, a veces, por economía.
 -Frecuencia de la indización: todos los días se agregan y modifican muchas páginas y la indización no se realiza al ritmo que permita incluirlas todas
-Número máximo de resultados visibles: existe un límite en el número de documentos que se muestran (entre 200 y 1000)
-URL desconectadas: Las generaciones más recientes de buscadores, presentan los documentos por relevancia basada en el número de veces que aparecen referenciados en otros. Si un documento no tiene un link a él, desde otro documento, la página no estará indizada y no se podrá encontrar.

La web privada

Son las páginas web que podrían estar indizadas en los buscadorees pero las excluyen por alguno de estos motivos:
- Las páginas están protegidas por contraseñas
- Contienen archivos "robots.txt" para evitar sre indizadas - Contienen un campo "noindex" para evitar que el buscador pueda indizar la parte que corresponde al cuerpo de la página.
 
La web propietaria
 
Incluye las páginas en las que bien de forma gratuita o mediante pago, es necesario registrarse para tener acceso al contenido.
 
La web realmente invisible
 
Estas páginas no puede ser indizadas bien sea por limitaciones técnicas de los buscadores, por programas ejecutables o por archivos comprimidos. Son páginas que se generan a partir de los datos que introduce el usuario y que no pueden ser extraídas a menos que se realice una petición especifica

2 comentarios:

Alberto dijo... @ 23 de junio de 2015, 8:46

Genial! ... y espectacular la infografía!!

Alberto dijo... @ 23 de junio de 2015, 8:46

Genial! ... y espectacular la infografía!!

Publicar un comentario