Skip to main content

Hvad er big data?

Big data er målinger af data, der er vokset så store, at normale databaser ikke er i stand til at indeholde og arbejde med den enorme mængde information.Data findes i tre størrelser: små, mellemstore og store;Ingen af disse målinger er strenge;I stedet afhænger hver mere af brugervenlighed og hvilken type maskine der kan håndtere informationen.Specielle maskiner, meget større og komplekse end dem, der bruges til almindelige databaser, er nødvendige til big data.Disse typer data findes typisk i regerings- og videnskabelige agenturer, men nogle meget store websteder indeholder også denne store mængde information.

Data findes i tre standard, men ikke strenge størrelser.Små data er i stand til at passe på en enkelt computer eller maskine, såsom en bærbar computer.Medium data er i stand til at passe på en diskarray og administreres bedst af en database.Databaser, uanset hvor store, er ude af stand til at arbejde med big data, og specielle systemer bruges i stedet meget.Selvom der ikke er nogen streng retningslinje for, hvad Big Data er, starter de typisk omkring Terabyte (TB) niveau og går op til Petabyte (PB) niveau.Mængde af data vil medføre flere væsentlige problemer.Databasen er ikke i stand til at håndtere mængden af information, så nogle data skal slettes.Dette er som at prøve at passe 100 gigabyte (GB) på en computer med kun 50 GB harddiskplads;det kan ikke lade sig gøre.De tilbageholdte data vil være uhåndterlige til både kontrol og styring, fordi enhver funktion vil tage lang tid at gennemføre, og databasen skal lukkes for nye indsendelser.

Mens det er muligt at fortsætte med at købe maskiner og tilføje nye data til databaserne, dette skaber det uhåndterlige problem.Dette skyldes, at databasesoftware kun er lavet til at arbejde med mellemstore data.Større datasæt fører til fejl og administrative problemer, fordi softwaren simpelthen ikke kan flytte eller arbejde med store data uden at støde på problemer.

Big data er ikke stødt på af de fleste organisationer eller websteder.Forsvars- og militære agenturer bruger denne mængde information til at skabe modeller og butikstestresultater, og mange store videnskabelige agenturer har brug for disse specialiserede maskiner af lignende grunde.Nogle meget store websteder har brug for store datamaskiner, men websteder er ikke så almindelige som agenturer på dette marked.Disse organisationer er nødt til at beholde alle deres data, fordi det hjælper med at analysere fremtidige data bedre og foretage forudsigelser.