Skip to main content

Co to są klasy histogramu?

Klasy histogramu to zakresy wartości zawierające punkty danych w rozkładu częstotliwości lub tabeli danych surowych.Są one również określane jako odstępy, pojemniki lub szerokości pojemników.W histogramie, rodzaju wykresu słupków, klasy te są przedstawiane jako kolumny pionowe, w których wysokość kolumny wskazuje liczbę punktów danych zawartych w zakresie klasy.Zazwyczaj dokonuje się wyboru klasy histogramu w celu zwiększenia wizualnej reprezentacji statystyki lub trendów danych.

Gdy istnieje duża ilość danych do wyświetlenia, histogram jest szczególnie przydatny do przedstawiania kształtu jego rozkładu.Cały zakres danych jest podzielony na przedziały, a liczba punktów danych wpadających do każdego z nich jest liczona, aby zapewnić częstotliwość klasy.Zakres lub szerokość przedziału określa liczbę klas histogramu i wpływa na kształt wykresu.

Jeśli przedział jest zbyt szeroki, znaczące informacje mogą zostać pominięte przez klasy zbyt integracyjne.Gdy wybór szerokości przedziału jest zbyt wąski, niska częstotliwość klasy może przynieść nadmierną wagę do tego, co jest faktycznie losową zmiennością.Istnieje kilka metod ustawiania odpowiedniej liczby klas histogramu dla zestawu danych.

Zgodnie z zasadą Sturgiss liczba klas powinna znajdować się blisko podstawowego dziennika liczby punktów danych plus jeden.Korzystając z reguły Rices, liczba zdefiniowanych klas powinna być dwukrotnie więcej niż pierwiastek kostki liczby punktów danych.Niezależnie od metody stosuje się do wyboru liczby klas histogramu, należy spróbować kilku różnych szerokości, aby przetestować czułość kształtu histogramu na wielkość klasy.Prawidłowa liczba klas jest tą, która najdokładniej przedstawia rozkład danych.

Z odpowiednią liczbą klas histogramu dla szeregu danych powinna wynikać znacząca reprezentacja graficzna, która umożliwia jasną interpretację.Histogram powinien pokazać środek i rozprzestrzenianie się danych, dowolnej skośności lub asymetrii danych oraz wartości odstających lub punktów danych występujących poza oczekiwanym zakresem wartości.Tryb lub najczęściej występująca wartość powinna być widoczna, a także grupy, które mogą wskazywać na wielokrotną modalność.Analiza histogramu może również wskazywać na usterki w procesie gromadzenia danych.

Długo stosowane w finansach i naukach społecznych, histogramy stają się coraz bardziej znane w graficznych wyświetlaczach elektroniki użytkowej.Fotografia cyfrowa jest szczególnie otwarta na ich użycie, z wieloma kamerami zawierającymi histogram kolorów w celu wskazania równowagi białej i ekspozycji.Histogram fotografii cyfrowej może również pokazywać piksele jako klasy histogramu wykreślone przeciwko odcieniom szarości.