lunes, 24 de julio de 2017

sábado, 8 de julio de 2017

Web Profunda y Superficial

Los buscadores tradicionales solo ofrecen acceso a una pequeña parte de lo que existe online, lo que se ha comenzado a llamar la Web superficial o visible. Lo que resta, se la llama Web profunda o invisible.
Web Superficial o visible: La Web superficial comprende todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta en sus formularios de búsqueda.
Las características principales de los sitios de la Web visible son:

  •  su información no está contenida en bases de datos 
  •  es de libre acceso 
  •  no se requiere la realización de un proceso de registro para acceder a la información. 
  • mayoritariamente está formada por páginas Web estáticas, es decir páginas o archivos con una URL fija y accesibles desde otro enlace. 

 Web Profunda o invisible: 
Web invisible es el término utilizado para describir toda la información disponible en Internet que no se recupera interrogando a los buscadores convencionales. Generalmente es información almacenada y accesible mediante bases de datos. Parte de la información es "invisible" a los robots de los buscadores convencionales, ya que los resultados se generan en la contestación a una pregunta directa mediante páginas dinámicas es decir páginas que no tienen una URL fija y que se construyen en el mismo instante (temporales), desapareciendo una vez cerrada la consulta.
 Se identifican cuatro tipos de contenidos invisibles en la Web: la Web opaca , la Web privada , la Web propietaria y la Web realmente invisible.
 La Web opaca: está compuesta por archivos que, si bien podrían estar incluidos en los índices de los buscadores, no lo están por alguno de los siguientes motivos:

  •  Extensión de la indexación: a veces, por economía, no todas las páginas de un sitio son indexadas en los buscadores.
  •  Frecuencia de la indexación: los buscadores no poseen la capacidad de indexar todas las páginas existentes; a diario se agregan y modifican muchas y la indexación no se realiza al ritmo que permita incluirlas a todas.
  •  Número máximo de resultados visibles: aunque los motores de búsqueda arrojan a veces un gran número de resultados, generalmente limitan el número de documentos que se muestran (entre 200 y 1000).
  •  URL desconectadas: las generaciones más recientes de buscadores, presentan los documentos por relevancia basada en el número de veces que aparecen referenciados en otros. 

 La Web privada: consiste en las páginas Web que podrían estar indexadas en los buscadores pero son excluidas deliberadamente por alguno de estos motivos:

  •  Las páginas están protegidas por contraseñas. 
  •  Contienen un archivo “robots.txt” para evitar ser indexadas. 
  •  Contienen un campo “noindex” para evitar que el buscador pueda indexar la parte correspondiente al cuerpo de la página. 
 La Web propietaria: incluye aquellas páginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o de pago.
 La Web realmente invisible: se compone de páginas que no pueden ser indexadas por limitaciones técnicas de los buscadores, programas ejecutables y archivos comprimidos, páginas generadas dinámicamente, es decir, que se generan a partir de datos que introduce el usuario, información almacenada en bases de datos relacionales, que no puede ser extraída a menos que se realice una petición específica.
Dentro de la Web profunda se encuentran distintos niveles:
1° nivel: web superficial; sigue siendo algo que no es peligroso, siempre son paginas poco conocidas de fácil acceso, tales como foros y paginas de interés pequeñas. Nada malo o ilegal. Acceder a ellas requiere de poco esfuerzo.
2° nivel: Bergie Web; compuesta por dominios de web aun menos conocidas y por los buscadores independientes tales como lo son Ares y Emule. Lo que se puede hallar en ellas es material de extraña procedencia y de moralidad dudosa. Los contenidos no aptos para todo publico suelen ser su contenido principal. Acceder a ellas requiere mas que Google.
3° nivel: Deep Web d'aboard; las paginas tienen nombres de dominios dejados caer al azar. En ellas no hay publicidad, ni color y lo mas significativo es que no se relacionan entre ellas como las paginas superficiales, ni siquiera aparecen en buscadores como google ni aunque copies el link de la pagina completa. En estas paginas se puede encontrar cosas supremamente extrañas, raras y anticuadas.
4° nivel:Chater Web; aquí el peligro es inminente, esta plagado de hackers, verdaderos piratas informativos. Estas paginas se encuentran plagadas de cosas ilegales.
5° nivel: Marianas Web; su nombre se debe a las " Fosas de las Marianas en el océano Pacifico", lugar mas profundo del mar en si. Aquí se exponen los secretos militares y de estado mas impactante e importantes. También se cree que la entidad que realmente domina al mundo intercambia información entre sus contra partes por aquí. Este nivel necesita algoritmos y son computadoras que solo posee el estado.
6° nivel:the fog; aquí los hackers que logran entrar utilizan computadoras cuánticas para poder sobrepasar la encriptacion. No hay pruebas concretas de que alguien haya entrado. Se requiere de la computación cuántica para navegar por las cantidades masivas de datos en este nivel por el grado y complejidad nivel de seguridad de los datos trasmitidos allí.
7° nivel, Virus Soup; en este nivel todo el mundo esta luchando para mantener a otros fuera de el. Se puede describir a este nivel como una zona de Guerra donde cada quien intenta burlar a los demás para acceder al nivel 8.
8° nivel: the Primarch Sistem; se especula que es el control primario del mismo Internet. Se dice que accediendo a este nivel se maneja a su antojo la web. Para romper estos códigos y encriptaciones, se debe tener conocimientos y equipos especiales para ellos.