Skip to main content

Qu'est-ce que le Web Deep?

Le Web Deep est la partie d'Internet qui est en dehors des méthodes de recherche standard.Un moteur de recherche standard trouve des pages Web en élevant une seule page et en cliquant sur tous les liens.Cela leur permet de s'étendre à partir d'une seule page comme un web géant d'araignée, en trouvant une page après page grâce à la liaison.Ce processus ne capture qu'une fraction des pages qui existent sur Internet;D'énormes quantités de données sont complètement non classifiées pour l'une des nombreuses raisons.Ces pages ne se présenteront jamais dans un moteur de recherche standard et sont donc invisibles pour la plupart des utilisateurs Web.

La surface Web est la partie d'Internet avec laquelle la plupart des utilisateurs sont familiers.Cette partie contient les pages Web et les services Web standard que la plupart des utilisateurs connaissent.Le Web Deep comprend des informations que seules des parties spécifiques des internautes sont conscientes ou ont également accès.La toile profonde est énorme par rapport au Web de surface;En 2000, il était près de 50 fois plus grand que le Web de surface.

La raison pour laquelle la toile profonde existe est principalement due aux limites des moteurs de recherche.Lorsque les moteurs de recherche examinent les liens, ils ne peuvent pas accéder à certains types de pages Web.Ces pages n'entrent jamais dans le système et, par conséquent, ne sont jamais indexées.Lorsqu'un utilisateur recherche l'une de ces pages, il ne le trouvera jamais, car le moteur de recherche n'enregistre pas son existence ou son incapacité à y accéder.

Il existe un certain nombre de types de pages différents qui sont difficiles ou impossibles pour unMoteur de recherche à indexer.Les pages Web dynamiques et basées sur la base de données sont pratiquement impossibles, car elles nécessitent une entrée spécifique pour exister.Ces pages Web sont composées sur place, souvent via la saisie des utilisateurs.Étant donné qu'une page dynamique n'existe pas avant qu'elle ne soit nécessaire, les moteurs de recherche les sautent parce qu'ils ne savent pas quoi demander.

Les pages Web privées ou fermées constituent une autre grande partie du Web Deep.Étant donné que ces pages nécessitent des informations d'identification ou des informations de connexion et que le moteur de recherche n'a pas non plus, il est empêché d'accéder aux informations de l'autre côté de la connexion.Même avec ce problème, certains sites basés sur les connexions font partie du Web de surface.Le site Web met en place des dispositions spéciales pour permettre aux moteurs de rechercher ses pages.Ceci est courant parmi les pages qui ont une inscription ouverte et qui souhaitent générer un trafic supplémentaire.

Une autre grande partie de la toile profonde est faite de sites Web non liés ou restreints.Ces pages ne possèdent aucun lien vers des ressources extérieures ni ne bloquent activement les liens existants.Cela empêche les moteurs de recherche de trébucher sur la page, il n'est donc jamais ajouté à aucune annonce.Cela était courant parmi les pages Web personnelles, mais les changements dans l'utilisation du Web moderne ont fait lier et indexé la plupart des pages personnelles.