Skip to main content

Hvad er et stopord?

I computing og online applikationer er et stop -ord et ord, der filtreres ud under behandlingen af en eller anden form for tekst, f.eks. Under indledningen af en søgning online.Kendt som en komponent i naturlig sprogbehandling eller NLP, er ideen bag denne type filtrering at hjælpe med at fremskynde søgninger ved at udelade almindelige taleartikler fra anmodningen.I stedet bruger søgemaskinen en simpel markør til at bemærke tilstedeværelsen af ordet i tekststrengen, men forhindrer ikke tilstedeværelsen af denne markør i at inkludere denne side i søgeresultaterne.

En måde at forstå, hvordan stopord kan komplicere søgemaskinens funktion, er at overveje det faktum, at når du udfører en søgning, vil motoren overveje hvert ord, der er inkluderet i søgeanmodningen, der er indsendt af brugeren.Som en del af denne overvejelse ser motoren efter sider, der indeholder hvert ord.Det betyder, at hvis søgeanmodningen indeholder tre ord, udgør motoren tre fejer på Internettet, hvilket til sidst prioriterer de sider, der inkluderer alle tre af ordene.

For eksempel ville en søgning som ”huset på bakken” kræve, at motoren foretager søgninger på hvert ord i sekvensen, med nogle endda at køre en søgning på stopordet “The” to gange.Dette tager tid og ressourcer, der kan omdirigeres til at hjælpe med andre søgeordssøgninger, som andre slutbrugere i øjeblikket udfører.Ved at bruge markører til at erstatte “The” og “On” under søgningen, kan motoren bruge færre ressourcer og stadig returnere resultater, der er meget sandsynligt at tilfredsstille slutbrugeren.

Mens stopordet undertiden omtales som et giftord , er der virkelig intet særligt galt med at inkludere taleartikler i teksten, der bruges til at udføre søgninger.Brug af et stopord eller ord som en del af søgeanmodningen kan komplicere processen med søgemaskineindeksering, når man forsøger at hente data, der opfylder søgekriterierne.Stadig vil slutbrugeren sandsynligvis ikke se meget forskel i informationsekstraktionen, der i sidste ende returneres.

Der er ikke noget hårdt og hurtigt stop -ordliste, der bruges universelt af alle søgemaskiner.Faktisk bruger nogle søgemaskiner ikke nogen form for stopordliste som en del af den naturlige sprogbehandlingsopgave overhovedet.Andre motorer vil dog gøre rigelig brug af stopordlisten som et middel til at tildele ressourcer på en mere effektiv måde, mens de stadig returnerer søgemaskinresultater, der er nøjagtige og sandsynligvis er meget passende til søgeanmodninger, der er indsendt af alle, der bruger en bestemtmotor.