Skip to main content

Hoe werken zoekmachines?

Zoekmachines zijn in principe computeralgoritmen die gebruikers helpen de specifieke informatie te vinden waarnaar ze op zoek zijn.Met letterlijk triljoenen pagina's met informatie online, zonder effectieve zoekmachines, zou het vinden van iets op internet bijna onmogelijk zijn.Verschillende zoekmachines werken op verschillende specifieke manieren, maar ze gebruiken allemaal dezelfde basisprincipes.

Het eerste wat zoekmachines moeten doen om te functioneren is om een lokale database te maken met, in feite, internet.Vroege zoekmachines geïndexeerden zojuist zoekwoorden en titels van pagina's, maar hedendaagse zoekmachines indexeren alle tekst op elke pagina, evenals een groot deel van andere gegevens over de relatie van die pagina met andere pagina's, en in sommige gevallen alle of een deel vanDe media die ook op de pagina beschikbaar zijn.Zoekmachines moeten al deze informatie indexeren, zodat ze er efficiënt op zoek kunnen gaan naar zoekopdrachten, in plaats van op internet te lopen telkens wanneer een zoekopdracht wordt verzonden.

Zoekmachines maken deze databases door periodieke kruipen van internet uit te voeren.Vroege zoekmachines moesten vaak pagina's aan hen worden voorgelegd om ze te kruipen, maar nu worden de meeste pagina's gevonden door links van andere pagina's te volgen.Wat worden robots of spinnen genoemd, computerprogramma's gebouwd om pagina's te indexeren, van pagina naar pagina te flitsen, alle gegevens op de pagina op te nemen en elke link naar nieuwe pagina's te volgen.Verschillende zoekmachines vernieuwen hun indexen met verschillende intervallen, afhankelijk van hoeveel spinnen ze constant hebben gekropen, en hoe snel die spinnen kruipen, met sommigen die elke dag of twee door internet werken, en anderen die alleen elke week een periodieke verversing doen of elke week ofMaand.

Terwijl de spin door deze pagina's gaat, registreert het de woorden die het op de pagina's vindt.Het maakt opmerkingen over hoe vaak elk woord er verschijnt, of de woorden op bepaalde manieren worden gewogen, misschien gebaseerd op grootte, locatie of HTML -opmaak, en beslist hoe relevant de woorden zijn gebaseerd op de links die naar de pagina komen, enin de algemene context van de pagina.

Zoekmachines moeten dan de waarde van elke pagina wegen en de waarde van elke pagina voor de woorden die erop verschijnen.Dit is het lastigste deel van wat een zoekmachine te doen heeft, maar ook de belangrijkste.Op het meest eenvoudige niveau kan een zoekmachine eenvoudigweg elk woord op de pagina bijhouden en die pagina registreren als relevant voor zoekopdrachten met dat trefwoord.Dit zou echter niet veel goeds doen voor de meeste gebruikers, want wat gewenst is, is de meest relevante pagina voor hun zoekopdracht.Dus verschillende zoekmachines komen met verschillende manieren om van belang te wegen.

De algoritmen die verschillende zoekmachines gebruiken, zijn goed beschermd, om te voorkomenDat.Dit verschil is de reden waarom verschillende zoekmachines verschillende resultaten opleveren voor dezelfde termen.Google kan bepalen dat één pagina het beste resultaat is voor een zoekterm, en vragen kan bepalen dat dezelfde pagina niet eens in de top 50 staat. Dit is allemaal alleen gebaseerd op hoe ze inkomende en uitgaande links waarderen, de dichtheid van de trefwoorden die zeZoek belangrijk, hoe ze een verschillende plaatsing van woorden waarderen en een willekeurig aantal kleinere factoren.

De nieuwste trend in zoekmachines, en waarschijnlijk de toekomst van zoeken in het algemeen, is om weg te gaan van zoekopdrachten op zoek naar conceptgebaseerde zoekopdrachten.In deze nieuwe vorm van zoekopdracht, in plaats van een zoekopdracht te beperken tot de zoekwoorden, probeert de inputs van de zoekers te zoeken wat die zoekwoorden betekenen, zodat het pagina's kan suggereren die mogelijk niet het exacte woord bevatten, maar toch actueel zijnde zoektocht.Dit is nog steeds een ontwikkelend veld, maar lijkt tot nu toe veel potentieel te hebben om zoekopdrachten relevanter te maken, waardoor het web een nog eenvoudigere plek is om precies te vinden wat je zoekt.