Skip to main content

Comment fonctionnent les moteurs de recherche?

Les moteurs de recherche sont essentiellement des algorithmes informatiques qui aident les utilisateurs à trouver les informations spécifiques qu'ils recherchent.Avec littéralement des milliards de pages d'informations en ligne, sans moteurs de recherche efficaces, trouver quoi que ce soit sur Internet serait presque impossible.Différents moteurs de recherche fonctionnent de différentes manières spécifiques, mais ils utilisent tous les mêmes principes de base.

La première chose que les moteurs de recherche doivent faire pour fonctionner est de faire une base de données locale, en gros, Internet.Les premiers moteurs de recherche indexés des mots clés et des titres de pages, mais les moteurs de recherche contemporains indexent tout le texte sur chaque page, ainsi qu'une grande partie d'autres données sur la relation de cette page avec d'autres pages, et dans certains cas, tout ou partie de la partie deLes médias disponibles également sur la page.Les moteurs de recherche doivent indexer toutes ces informations afin qu'ils puissent effectuer des recherches efficacement, plutôt que d'avoir à courir sur Internet chaque fois qu'une requête de recherche est envoyée.

Les moteurs de recherche créent ces bases de données en effectuant des rampes périodiques d'Internet.Les premiers moteurs de recherche exigeaient souvent que les pages leur soient soumises afin de les ramper, mais maintenant la plupart des pages sont trouvées en suivant les liens d'autres pages.Ce qu'on appelle les robots ou les araignées, les programmes informatiques conçus pour indexer les pages, passer de page à la page, enregistrer toutes les données de la page et suivre chaque lien vers de nouvelles pages.Différents moteurs de recherche rafraîchissent leurs index à différents intervalles, selon le nombre d'araignées qu'ils ont constamment rampant et à quelle vitesse ces araignées rampent, certains travaillant sur Internet tous les jours ou deux, et d'autres ne font qu'un actualisation périodique chaque semaine ou chaque foismois.

L'araignée passe par ces pages, il enregistre les mots qu'il trouve sur les pages.Il prend des notes sur le nombre de fois que chaque mot apparaît, que les mots soient pondérés de certaines manières, peut-être en fonction de la taille, de l'emplacement ou du balisage HTML, et décide à quel point les mots sont pertinents sur les liens qui viennent sur la page etsur le contexte général de la page. Les moteurs de recherche doivent alors pondérer la valeur de chaque page et la valeur de chaque page pour les mots qui y apparaissent.C'est la partie la plus délicate de ce qu'un moteur de recherche doit faire, mais aussi le plus important.Au niveau le plus simple, un moteur de recherche pourrait simplement garder une trace de chaque mot de la page et enregistrer cette page comme pertinente pour les recherches avec ce mot-clé.Cependant, cela ne ferait pas grand-chose de bien à la plupart des utilisateurs, car ce qui est souhaité est la page la plus pertinente pour leur requête de recherche.Ainsi, différents moteurs de recherche proposent différentes façons de pondérer l'importance. Les algorithmes utilisés par divers moteurs de recherche sont bien protégés, pour empêcher les gens de créer spécifiquement des pages pour obtenir de meilleurs rangs, ou du moins pour limiter le degré auquel ils peuvent fairece.Cette différence est la raison pour laquelle différents moteurs de recherche donnent des résultats différents pour les mêmes termes.Google pourrait déterminer qu'une page est le meilleur résultat pour un terme de recherche, et Ask pourrait déterminer que la même page n'est même pas dans le top 50. Tout cela est simplement basé sur la façon dont ils apprécient les liens entrants et sortants, la densité des mots clés qu'ilstrouver important, comment ils apprécient le placement différent des mots, et n'importe quel nombre de facteurs plus petits. La dernière tendance des moteurs de recherche, et probablement l'avenir de la recherche en général, est de s'éloigner des recherches basées sur des mots clés aux recherches basées sur le concept.Dans cette nouvelle forme de recherche, plutôt que de limiter une recherche aux mots clés que les entrées du chercheur, le moteur de recherche essaie de déterminer ce que signifient ces mots clés, afin qu'il puisse suggérer des pages qui ne peuvent pas inclure le mot exact, mais qui sont néanmoins accessibles àla recherche.C'est toujours un domaine en développement, mais jusqu'à présent, il semble avoir beaucoup de potentiel pour rendre les recherches plus pertinentes, ce qui rend le Web un endroit encore plus facile pour trouver exactement ce que vous recherchez.