Skip to main content

Co je distribuce histogramu?

Distribuce histogramu ve statistikách se týká vzorců, tvarů a umístění univariačních datových sloupců na histogramu.Jak a kde jsou tyče distribuovány k analýze a vyvození závěrů o datech.Distribuční analýza histogramu je důležitá při identifikaci vlastností, jako je datová normalita, multimodální distribuce a zkosená data.

Histogram je univariační displej dat, který používá obdélníky úměrné v oblasti k frekvencím třídy nebo koš, aby vizuálně vykazovalo vlastnosti dat.Datové body v histogramu jsou uspořádány do zásobníků a samotná distribuce histogramu je vizuální aproximací distribuce frekvence dat nebo hustoty pravděpodobnosti.Tvar distribuce se může změnit na základě počtu zásobníků. Analýza distribuce histogramu se často používá jako kvalitativní kontrola normality dat.Ačkoli existují analytické metody pro stanovení normality, histogramy lze použít k poskytnutí rychlé kontroly zdravého rozumu, aby se ušetřil čas.Pokud se data histogramu objeví zhruba a soustředěná na průměr, předpokládá se, že data jsou normální.Ačkoli rychlý a relativně snadný, tento druh kvalitativní kontroly je subjektivní a analytické metody by měly být použity, pokud je vyžadována vyšší úroveň přesnosti.Skewness dat je v datech definována jako výrazná asymetrie.Negativní zkosení nebo zkosení doleva je vidět v datových souborech s velmi málo nízkými hodnotami.Pozitivní zkosení nebo zkosení doprava se vyskytuje v datových souborech s několika vysokými hodnotami.Pozorování distribuce histogramu může odhalit odlehlé hodnoty a zkosená data.Multimodální datové soubory obsahují více než jeden režim a jsou charakterizovány distribucí frekvencí, které mají více než jeden vrchol nebo maxima.Politická příslušnost ve městě, průzkumy veřejného mínění a velikosti těla včel jsou příklady datových souborů, které mohou být multimodální.Pozorování tvaru histogramu a zaznamenávání různých píků v multimodálních datech může často poskytnout výzkumníkovi více vhledu než jednoduché univariační statistické výpočty.V praxi lze počet zásobníků odhadnout tím, že vezme druhou odmocninu počtu pozorování, i když mohou být použity jiné velikosti koše.Například učitel se může rozhodnout analyzovat testovací stupně výběrem velikosti bin, které odrážejí známky písmen.