Skip to main content

Ano ang malaking data?

Ang malaking data ay mga sukat ng data na lumago nang napakalaki na ang mga normal na database ay hindi naglalaman at gumana kasama ang napakalaking dami ng impormasyon.Dumating ang data sa tatlong laki: maliit, katamtaman at malaki;Wala sa mga sukat na ito ay mahigpit;Sa halip, ang bawat isa ay higit na nakasalalay sa kadalian ng paggamit at kung anong uri ng makina ang maaaring hawakan ang impormasyon.Ang mga espesyal na makina, mas malaki at kumplikado kaysa sa mga ginamit para sa mga ordinaryong database, ay kinakailangan para sa malaking data.Ang mga ganitong uri ng data ay karaniwang matatagpuan sa mga ahensya ng gobyerno at pang -agham, ngunit ang ilang napakalaking website ay naglalaman din ng malaking halaga ng impormasyon na ito.

Ang data ay dumating sa tatlong pamantayan, ngunit hindi mahigpit, laki.Ang maliit na data ay maaaring magkasya sa isang solong computer o makina, tulad ng isang laptop.Ang medium data ay maaaring magkasya sa isang disk array at pinakamahusay na pinamamahalaan ng isang database.Ang mga database, kahit gaano kalaki, ay hindi kayang magtrabaho sa Big Data, at ang mga espesyal na sistema ay gagamitin sa halip.Habang walang mahigpit na gabay para sa kung ano ang malaking data, karaniwang nagsisimula sa paligid ng antas ng terabyte (TB) at umakyat sa antas ng petabyte (PB).Ang halaga ng data ay magiging sanhi ng maraming malaking problema.Ang database ay hindi makayanan ang dami ng impormasyon, kaya dapat mabura ang ilang data.Ito ay tulad ng pagsisikap na magkasya sa 100 gigabytes (GB) sa isang computer na may 50 GB lamang ng hard drive space;Hindi ito magagawa.Ang data na naiwan ay hindi mapakali sa parehong kontrol at pamahalaan, dahil ang anumang pag -andar ay aabutin ng mahabang panahon upang makumpleto at ang database ay dapat na sarado sa mga bagong pagsumite., Lumilikha ito ng hindi kanais -nais na problema.Ito ay dahil ang software ng database ay ginawa lamang upang gumana sa daluyan ng data.Ang mga mas malalaking datasets ay humantong sa mga pagkakamali at mga problema sa administratibo, dahil ang software ay hindi maaaring ilipat o magtrabaho sa malaking data nang hindi nakatagpo ng mga problema.

Ang malaking data ay hindi nakatagpo ng karamihan sa mga organisasyon o website.Ang mga ahensya ng pagtatanggol at militar ay gumagamit ng halagang ito ng impormasyon upang lumikha ng mga modelo at mga resulta ng pagsubok sa pag -iimbak, at maraming malalaking ahensya ng pang -agham ang nangangailangan ng mga dalubhasang makina para sa mga katulad na kadahilanan.Ang ilang napakalaking website ay nangangailangan ng malalaking data machine, ngunit ang mga website ay hindi karaniwan sa mga ahensya sa merkado na ito.Ang mga samahang ito ay kailangang panatilihin ang lahat ng kanilang data, dahil nakakatulong ito upang mas mahusay na pag -aralan ang data sa hinaharap at gumawa ng mga hula.