Skip to main content

Wat is een schermschraper?

Een schermschraper is een computerprogramma dat op tekens gebaseerde gegevens verzamelt uit de weergave-uitvoer van een ander programma.Schermschrapers kunnen de gegevens die ze zoeken extraheren en deze in een rijker formaat presenteren, zoals met grafieken of tabellen, of eenvoudig de gegevens voor opslag indexeren.Er zijn veel andere namen voor een schermschraper, waaronder websiteschraper, contentminer, website ripper, webextractor, geautomatiseerde gegevensverzamelaar en HTML -schraper.

Een schermschraper zoekt de code van een website en filtert de externe code die aanwezig is om een mooie presentatie aan de eindbrowser te geven.Een dergelijke code is nodig om de hele pagina in de beoogde lay -out te bekijken, maar een schraper is gewoon op zoek naar nuttige gegevens.Deze gegevens worden verzameld en gepresenteerd als een eenvoudige database, zonder de toeters en fluitjes de originele HTML -code die is verstrekt.

Een goed voorbeeld van een schermschraper in actie is bij spinnen van zoekmachines.Deze spinnen hebben toegang tot honderdduizenden websites, die elk talloze pagina's bevatten.De trefwoordgegevens van deze sites worden verzameld en geïndexeerd en vervolgens uiteindelijk gepresenteerd aan de eindgebruiker als zoekmachines.JavaScript of PHP.De gegevens die worden gedolven, kunnen vervolgens worden gepresenteerd als HTML zelf, zodat de gebruiker deze toegang heeft tot zijn webbrowser of opgeslagen als tekstgegevens die offline door de gebruiker kunnen worden toegankelijk.

Bedrijven gebruiken schermschrapers om de gegevens van verschillende zoekwoordgerelateerde websites te ontginnen om grafieken, grafieken, spreadsheets en vergelijkingsgegevens te genereren die moeten worden gebruikt in rapporten en presentaties.De schermschraper bespaart een buitengewone tijd, omdat een werknemer die dezelfde taak doet, moet zoeken naar relevante sites, op links klikken en door elke site afzonderlijk bladeren om de toepasselijke gegevens die ze nodig hebben te vinden en vast te leggen.Een schermschraper kan ook worden gebruikt wanneer informatie wordt opgeslagen op een systeem dat niet langer toegankelijk is vanwege compatibiliteitsproblemen met nieuwere hardware of software.

Schermschrapers kunnen zowel een zegen als een vloek zijn voor site -eigenaren en websurfers.Hoewel ze absoluut een functionele service bieden voor bedrijven, zoekmachines en anderen, kan een schermschraper ook voor minder dan altruïstische doeleinden worden gebruikt.Bedrijven of personen die spam als een advertentiemethode gebruiken, kunnen bijvoorbeeld een schermschraper gebruiken om e-mailadressen van websites te ontginnen.

Hoewel een schermschraper een handig hulpmiddel kan zijn, is er een debat onder de webgemeenschap over legaliteit enethiek bij gebruik ze.Copyrightproblemen worden wazig wanneer een schermschraper iemands hard werken uithaalt en presenteert deze in een ander formaat voor een andere website, en die sites die afhankelijk zijn van advertenties om inkomsten te genereren, hebben problemen wanneer hun advertenties worden weggegooid door de schermschraper.Als gevolg hiervan zijn sommige website -eigenaren begonnen met het implementeren van tools die voorkomen dat hun sites worden geschraapt.