Skip to main content

Cosa sono i big data?

I big data sono misurazioni di dati che sono cresciuti così grandi che i normali database non sono in grado di contenere e lavorare con l'enorme quantità di informazioni.I dati sono disponibili in tre dimensioni: piccoli, medi e grandi;Nessuna di queste misurazioni è severa;Invece, ognuno dipende più dalla facilità d'uso e dal tipo di macchina può gestire le informazioni.Per i big data sono necessarie macchine speciali, molto più grandi e complesse di quelle utilizzate per i database ordinari.Questi tipi di dati si trovano in genere nel governo e nelle agenzie scientifiche, ma alcuni siti Web molto grandi contengono anche questa grande quantità di informazioni. I dati sono disponibili in tre dimensioni standard, ma non rigorose.Piccoli dati sono in grado di adattarsi a un singolo computer o macchina, come un laptop.I dati medi sono in grado di adattarsi a un array di disco e sono meglio gestiti da un database.I database, non importa quanto grandi, non sono in grado di lavorare con i big data e invece verranno utilizzati sistemi speciali.Sebbene non vi siano linee guida rigorose per quali siano i big data, in genere inizia intorno al livello di terabyte (TB) e passa al livello di Petabyte (PB).

Tentando di lavorare con i big data su un database che non è specializzato per questoLa quantità di dati causerà diversi problemi sostanziali.Il database non è in grado di gestire la quantità di informazioni, quindi alcuni dati devono essere cancellati.È come cercare di adattarsi a 100 gigabyte (GB) su un computer con solo 50 GB di spazio del disco rigido;non può essere fatto.I dati rimasti saranno ingombranti sia nel controllo che nella gestione, perché qualsiasi funzione richiederebbe molto tempo per il completamento e il database deve essere chiuso a nuove comunicazioni.

Mentre è possibile continuare ad acquistare macchine e aggiungere nuovi dati ai database, questo crea il problema ingombrante.Questo perché il software di database viene fatto solo per funzionare con dati medi.Set di dati più grandi portano a errori e problemi amministrativi, poiché il software semplicemente non può muoversi o funzionare con grandi dati senza riscontrare problemi.

I big data non sono riscontrati dalla maggior parte delle organizzazioni o siti Web.Le agenzie di difesa e militari utilizzano questa quantità di informazioni per creare modelli e archiviare i risultati dei test e molte grandi agenzie scientifiche necessitano di queste macchine specializzate per ragioni simili.Alcuni siti Web molto grandi richiedono grandi macchine di dati, ma i siti Web non sono comuni come le agenzie in questo mercato.Queste organizzazioni devono mantenere tutti i loro dati, perché aiutano ad analizzare meglio i dati futuri e fare previsioni.