Skip to main content

Vad är en skärmskrapa?

En skärmskrapa är ett datorprogram som samlar karaktärbaserad data från visningsutgången från ett annat program.Skärmskrapor kan extrahera data de letar efter och presentera dem i ett rikare format, till exempel med grafer eller tabeller, eller helt enkelt indexera data för lagring.Det finns många andra namn på en skärmskrapa, inklusive webbplatsskrapa, innehållsgruvar, webbplats Ripper, Web Extractor, Automated Data Collector och HTML Scraper.

En skärmskrapa kommer att söka igenom koden på en webbplats och filtrera bort den främmande koden som finns för att ge en snygg presentation till slut webbläsaren.Sådan kod är nödvändig för att se hela sidan i sin avsedda layout, men en skrapa letar helt enkelt efter användbar data.Dessa data samlas in och presenteras som en enkel databas, utan klockorna och visslar den ursprungliga HTML -koden som tillhandahålls.

Ett bra exempel på en skärmskrapa är med sökmotorspindlar.Dessa spindlar får åtkomst till hundratusentals webbplatser, som var och en innehåller många sidor inom.Nyckelorddata från dessa webbplatser samlas in och indexeras och presenteras sedan slutligen för slutanvändaren som sökmotorresultat.

De flesta skärmskrapare skurar HTML -kodningen av en webbplats för att få sin information, men de kan också söka andra skriptspråk som såsomJavaScript eller PHP.Uppgifterna som bryts kan sedan presenteras som HTML själv, så att användaren kan komma åt dem med sin webbläsare, eller lagras som textdata som kan nås av användaren offline.

Företag använder skärmskrapare för att bryta data från olika sökordrelaterade webbplatser för att generera grafer, diagram, kalkylblad och jämförelsedata som ska användas i rapporter och presentationer.Skärmskrapan sparar en extraordinär tid, eftersom en anställd som gör samma uppgift skulle behöva söka efter relevanta webbplatser, klicka på länkar och bläddra i varje webbplats individuellt för att hitta och registrera tillämpliga data de behöver.En skärmskrapa kan också användas när information lagras på ett system som inte längre kan nås på grund av kompatibilitetsproblem med nyare hårdvara eller programvara.

Skärmskrapor kan vara både en välsignelse och en förbannelse för webbplatsägare och webbsurfare.Även om de absolut tillhandahåller en funktionell tjänst för företag, sökmotorer och andra, kan en skärmskrapa också användas för mindre än altruistiska ändamål.Till exempel kan företag eller individer som använder skräppost som en reklammetod använda en skärmskrapa för att bryta e-postadresser från webbplatser.

Medan en skärmskrapa kan vara ett praktiskt verktyg, finns det en viss debatt bland webbsamhället över legaliteter ochetik när du använder dem.Upphovsrättsfrågor blir suddiga när en skärmskrapa extraherar något hårt arbete och presenterar det i ett annat format för en annan webbplats, och de webbplatser som är beroende av reklam för att generera intäkter har problem när deras annonser kasseras av skärmskrapan.Som ett resultat har vissa webbplatsägare börjat implementera verktyg som förhindrar att deras webbplatser skrapas.