Skip to main content

Cos'è la distribuzione dell'istogramma?

La distribuzione dell'istogramma nelle statistiche si riferisce ai modelli, alle forme e alle posizioni delle barre di dati univariate su un istogramma.Come e dove vengono distribuite le barre possono essere utilizzate per analizzare e trarre conclusioni sui dati.L'analisi della distribuzione dell'istogramma è importante per identificare tratti come la normalità dei dati, le distribuzioni multimodali e i dati distorti.

Un istogramma è una visualizzazione di dati univariati che utilizza rettangoli proporzionali nell'area a classe o frequenze bidoni per mostrare visivamente le caratteristiche dei dati.I punti dati nell'istogramma sono organizzati in bin e la distribuzione dell'istogramma stessa è un'approssimazione visiva della funzione di distribuzione della frequenza dei dati o di densità di probabilità.La forma della distribuzione può cambiare in base al numero di bin.

L'analisi della distribuzione dell'istogramma viene spesso utilizzata come controllo qualitativo per la normalità dei dati.Sebbene esistano metodi analitici per determinare la normalità, gli istogrammi possono essere utilizzati per fornire un controllo rapido e di buon senso per risparmiare tempo.Se i dati dell'istogramma appare approssimativamente uniformi e incentrati sulla media, si presume che i dati siano normali.Sebbene rapido e relativamente facile, questo tipo di controllo qualitativo è soggettivo e dovrebbe essere utilizzato metodi analitici se è richiesto uno standard di accuratezza più elevato.

Determinazione se un set di dati mostra l'asimmetria è un altro modo in cui è possibile utilizzare l'analisi di distribuzione dell'istogramma.L'asimmetria dei dati è definita come asimmetria pronunciata nei dati.L'inclinazione negativa, o l'incontro a sinistra, è visto in set di dati con pochissimi valori bassi.L'inclinazione positiva o l'incontro a destra si verifica in set di dati con pochi valori alti.Osservare la distribuzione dell'istogramma può rivelare valori anomali e dati distorti.

Oltre a rivelare le caratteristiche dei dati con una modalità singola, la forma di un istogramma può anche rivelare le caratteristiche dei dati multimodali.I set di dati multimodali contengono più di una modalità e sono caratterizzati da distribuzioni di frequenza che hanno più di un picco o massimi.Le affiliazioni politiche in una città, i sondaggi di opinione di approvazione e le dimensioni del corpo delle api sono esempi di set di dati che possono essere multimodali.Osservare la forma dell'istogramma e rilevare i vari picchi nei dati multimodali può spesso fornire a un ricercatore più approfondimenti rispetto ai semplici calcoli statistici univariati.

L'analisi degli istogrammi e la distribuzione dei dati sono altamente dipendenti dalle dimensioni del bin scelte.In pratica, il numero di contenitori può essere stimato prendendo la radice quadrata del numero di osservazioni, sebbene possano essere utilizzate altre dimensioni del contenitore.Ad esempio, un insegnante può scegliere di analizzare i voti di test scegliendo le dimensioni del cestino che riflettono i voti delle lettere.