Skip to main content

Cos'è un raschietto a schermo?

Un raschiatore a schermo è un programma per computer che raccoglie i dati basati sui caratteri dall'output di visualizzazione di un altro programma.Gli scremati di screen possono estrarre i dati che stanno cercando e presentarli in un formato più ricco, ad esempio con grafici o tabelle o semplicemente indicizzare i dati per l'archiviazione.Esistono molti altri nomi per uno scraper a schermo, tra cui raschietto del sito Web, minatore di contenuti, Squartatore Web, Extractor Web, Collector di dati automatizzato e Scala HTML.

Un raschiatore a schermo cercherà il codice di un sito Web e filtrerà il codice estraneo che è in atto per fornire una presentazione di bell'aspetto al browser finale.Tale codice è necessario per visualizzare l'intera pagina nel layout previsto, ma un raschietto è semplicemente alla ricerca di dati utili.Questi dati vengono raccolti e presentati come un semplice database, senza le campane e fischiano il codice HTML originale fornito.

Un buon esempio di uno scraper a schermo in azione è con i ragni del motore di ricerca.Questi ragni accedono a centinaia di migliaia di siti Web, che contengono ciascuno numerose pagine all'interno.I dati delle parole chiave di questi siti vengono raccolti e indicizzati, quindi alla fine presentati all'utente finale come risultati dei motori di ricerca.

La maggior parte degli scremati di screenici sfumano la codifica HTML di un sito Web per ottenere le loro informazioni, ma possono anche cercare altri linguaggi di scripting comeJavaScript o PHP.I dati che vengono estratti possono quindi essere presentati come HTML stesso, in modo che l'utente possa accedervi con il proprio browser Web o archiviati come dati di testo a cui è possibile accedere all'utente offline.

Le aziende usano gli scremati di screen per estrarre i dati da una varietà di siti Web relativi alle parole chiave al fine di generare grafici, grafici, fogli di calcolo e dati di confronto da utilizzare in report e presentazioni.Il raschiatore dello schermo consente di risparmiare un periodo di tempo straordinario, poiché un dipendente che svolge lo stesso compito dovrebbe cercare siti pertinenti, fare clic sui collegamenti e sfogliare ogni sito individualmente per trovare e registrare i dati applicabili di cui hanno bisogno.È inoltre possibile utilizzare uno scraper a schermo quando le informazioni vengono archiviate su un sistema a cui non è più possibile accedere a causa di problemi di compatibilità con hardware o software più recenti.

Gli screent di screen possono essere sia una benedizione che una maledizione per i proprietari di siti e i surfisti web.Sebbene forniscano assolutamente un servizio funzionale per aziende, motori di ricerca e altri, un raschietto a schermo può essere utilizzato anche per scopi meno che altruistici.Ad esempio, le aziende o le persone che usano lo spam come metodo pubblicitario possono utilizzare uno scraper a schermo per estrarre gli indirizzi e-mail dai siti Web.

Mentre un raschietto a schermo può essere uno strumento utile, c'è qualche dibattito tra la comunità web rispetto alla legalità eEtica quando li usi.I problemi di copyright diventano sfocati quando uno schermo raschietto estrae un duro lavoro e lo presenta in un altro formato per un altro sito Web e quei siti che dipendono dalla pubblicità per generare entrate hanno problemi quando i loro annunci vengono scartati dal raschietto dello schermo.Di conseguenza, alcuni proprietari di siti Web hanno iniziato a implementare strumenti che impediscono la raschiatura dei loro siti.