Skip to main content

Qu'est-ce qu'un mot d'arrêt?

Dans les applications informatiques et en ligne, un Word Stop est un mot qui est filtré lors du traitement d'un type de texte, comme lors de l'initiation d'une recherche en ligne.Connu sous le nom de composant du traitement du langage naturel ou de la PNL, l'idée derrière ce type de filtrage est d'aider à accélérer les recherches en omettant des articles de discours communs à partir de la demande.Au lieu de cela, le moteur de recherche utilise un marqueur simple pour noter la présence du mot dans la chaîne de texte mais n'empêche pas la présence de ce marqueur d'inclure cette page dans les résultats de recherche.

Une façon de comprendre comment les mots d'arrêt peuvent compliquer la fonction des moteurs de recherche est de considérer le fait que lors de la recherche d'une recherche, le moteur examinera chaque mot inclus dans la demande de recherche soumise par l'utilisateur.Dans le cadre de cette considération, le moteur recherche des pages contenant chaque mot.Cela signifie que si la demande de recherche contient trois mots, le moteur fait trois balayages d'Internet, donnant finalement la priorité aux pages qui incluent les trois mots.

Par exemple, une recherche telle que «la maison sur la colline» nécessiterait que le moteur effectue des recherches sur chaque mot dans la séquence, certains exécutant même une recherche sur le mot d'arrêt «le» deux fois.Cela prend du temps et des ressources qui pourraient être détournées vers l'aide dans d'autres recherches de mots clés que d'autres utilisateurs finaux mènent actuellement.En utilisant des marqueurs pour remplacer «les» et «sur» pendant la recherche, le moteur peut consacrer moins de ressources et renvoyer des résultats qui sont très susceptibles de satisfaire l'utilisateur final.

Bien que le mot d'arrêt soit parfois appelé mot de poison , il n'y a vraiment rien de mal à inclure des articles de discours dans le texte utilisé pour effectuer des recherches.L'utilisation d'un mot d'arrêt ou de mots dans le cadre de la demande de recherche peut compliquer le processus d'indexation du moteur de recherche lors de la tentative de récupération des données qui répondent aux critères de recherche.Pourtant, l'utilisateur final ne verra probablement pas beaucoup de différence dans l'extraction d'informations qui est finalement renvoyé.

Il n'y a pas de liste de mots d'arrêt dure et rapide qui est utilisée universellement par tous les moteurs de recherche.En fait, certains moteurs de recherche n'utilisent aucun type de liste de mots d'arrêt dans le cadre de la tâche de traitement du langage naturel.D'autres moteurs, cependant, feront largement l'utilisation de la liste des mots d'arrêt comme moyen d'attribuer des ressources de manière plus efficace, tout en renvoyant des résultats de moteur de recherche qui sont précis et susceptibles d'être très appropriés pour les demandes de recherche soumises par toute personne utilisant un particuliermoteur.