Skip to main content

Ano ang isang screen scraper?

Ang isang screen scraper ay isang programa ng computer na nangongolekta ng data na batay sa character mula sa display output ng isa pang programa.Ang mga scraper ng screen ay maaaring kunin ang data na kanilang hinahanap at ipakita ito sa isang mas mayamang format, tulad ng mga graph o talahanayan, o i -index lamang ang data para sa imbakan.Maraming iba pang mga pangalan para sa isang screen scraper, kabilang ang web site scraper, minero ng nilalaman, web site ripper, web extractor, awtomatikong kolektor ng data, at HTML scraper.

Ang isang screen scraper ay maghanap sa pamamagitan ng code ng isang website at i-filter ang extraneous code na nasa lugar upang magbigay ng isang magandang hitsura ng pagtatanghal sa end browser.Ang nasabing code ay kinakailangan upang tingnan ang buong pahina sa inilaan nitong layout, ngunit ang isang scraper ay naghahanap lamang ng kapaki -pakinabang na data.Ang data na ito ay nakolekta at ipinakita bilang isang simpleng database, nang walang mga kampanilya at mga whistles ang orihinal na HTML code na ibinigay.

Ang isang magandang halimbawa ng isang screen scraper na kumikilos ay may mga spider ng search engine.Ang mga spider na ito ay nag -access ng daan -daang libong mga website, na bawat isa ay naglalaman ng maraming mga pahina sa loob.Ang data ng keyword mula sa mga site na ito ay nakolekta at na -index, pagkatapos ay ipinakita sa end user bilang mga resulta ng search engine.JavaScript o PHP.Ang data na mined ay maaaring iharap bilang HTML mismo, upang ma -access ito ng gumagamit sa kanilang web browser, o nakaimbak bilang data ng teksto na maaaring ma -access ng offline ng gumagamit.

Ang mga negosyo ay gumagamit ng mga scraper ng screen upang minahan ang data mula sa iba't ibang mga website na may kaugnayan sa keyword upang makabuo ng mga graph, tsart, spreadsheet, at data ng paghahambing na gagamitin sa mga ulat at pagtatanghal.Ang screen scraper ay nakakatipid ng isang pambihirang oras ng oras, dahil ang isang empleyado na gumagawa ng parehong gawain ay kailangang maghanap para sa mga nauugnay na site, mag -click sa mga link, at mag -browse sa bawat site nang paisa -isa upang mahanap at maitala ang naaangkop na data na kailangan nila.Maaari ring magamit ang isang screen scraper kapag ang impormasyon ay naka -imbak sa isang system na hindi na mai -access dahil sa mga isyu sa pagiging tugma sa mas bagong hardware o software.

Ang mga scraper ng screen ay maaaring maging isang pagpapala at isang sumpa para sa mga may -ari ng site at mga web surfers.Habang sila ay ganap na nagbibigay ng isang functional na serbisyo para sa mga negosyo, search engine, at iba pa, ang isang screen scraper ay maaari ring magamit para sa mas mababa sa mga layunin ng altruistic.Halimbawa, ang mga kumpanya o indibidwal na gumagamit ng spam bilang isang paraan ng advertising ay maaaring gumamit ng isang screen scraper sa minahan ng mga e-mail address mula sa mga website.etika kapag ginagamit ang mga ito.Ang mga isyu sa copyright ay nagiging malabo kapag ang isang screen scraper ay kumukuha ng mga masipag na trabaho at ipinakita ito sa isa pang format para sa isa pang website, at ang mga site na nakasalalay sa advertising upang makabuo ng kita ay may mga problema kapag ang kanilang mga ad ay itinatapon ng screen scraper.Bilang isang resulta, ang ilang mga may -ari ng website ay nagsimulang magpatupad ng mga tool na maiiwasan ang kanilang mga site na mai -scrap.