Skip to main content

Was ist Histogrammverteilung?

Histogrammverteilung in Statistiken bezieht sich auf die Muster, Formen und Stellen univariater Datenbalken in einem Histogramm.Wie und wo die Balken verteilt werden, können verwendet werden, um Schlussfolgerungen zu den Daten zu analysieren und zu ziehen.Die Histogrammverteilungsanalyse ist wichtig für die Identifizierung von Merkmalen wie Datennormalität, multimodale Verteilungen und verzerrten Daten.

Ein Histogramm ist eine univariate Datenanzeige, die Rechtecke verwendet, die im Bereich der Klassen- oder Binfrequenzen proportional sind, um die Datenfunktionen visuell zu zeigen.Die Datenpunkte im Histogramm sind in Bins organisiert und die Histogrammverteilung selbst ist eine visuelle Näherung der Datenfrequenzverteilung oder Wahrscheinlichkeitsdichtefunktion.Die Form der Verteilung kann sich basierend auf der Anzahl der Behälter ändern.

Histogrammverteilungsanalyse wird häufig als qualitative Überprüfung der Datennormalität verwendet.Obwohl analytische Methoden zur Bestimmung der Normalität bestehen, können Histogramme verwendet werden, um eine schnelle, gesunde Menschenverstand zu überprüfen, um Zeit zu sparen.Wenn die Histogrammdaten ungefähr gleichmäßig und auf den Mittelwert zentrieren, wird angenommen, dass die Daten normal sind.Obwohl schnell und relativ einfach, ist diese Art der qualitativen Überprüfung subjektiv und analytische Methoden sollten verwendet werden, wenn ein höherer Genauigkeitsstandard erforderlich ist.

Bestimmung, ob ein Datensatz aufweist, ist eine andere Art und Weise, wie Histogrammverteilungsanalyse verwendet werden kann.Die Datenweichheit ist in den Daten als ausgeprägte Asymmetrie definiert.In Datensätzen mit sehr wenigen niedrigen Werten wird negativer Versatz oder Links nach links gesehen.Ein positiver Versatz oder Nach rechts tritt in Datensätzen mit wenigen hohen Werten auf.Die Beobachtung der Histogrammverteilung kann Ausreißer und verzerrte Daten aufzeigen.

Zusätzlich zu den Eigenschaften von Daten mit einem einzigen Modus kann die Form eines Histogramms auch Eigenschaften multimodaler Daten aufzeigen.Multimodale Datensätze enthalten mehr als einen Modus und sind durch Frequenzverteilungen mit mehr als einem Peak oder Maxima gekennzeichnet.Politische Zugehörigkeiten in einer Stadt, Anerkennung Meinungsumfragen und Körpergrößen von Bienen sind Beispiele für Datensätze, die multimodal sein können.Die Beobachtung der Form des Histogramms und das Hinweis der verschiedenen Peaks in multimodalen Daten kann häufig einen Forscher mit mehr Einsicht als einfache univariate statistische Berechnungen bieten.

Die Analyse von Histogrammen und die Verteilung der Daten hängt stark von den ausgewählten Bin -Größen ab.In der Praxis kann die Anzahl der Mülleimer geschätzt werden, indem die Quadratwurzel der Anzahl der Beobachtungen übernommen wird, obwohl andere Behältergrößen verwendet werden können.Beispielsweise kann ein Lehrer die Testklassen analysieren, indem sie Bin -Größen auswählen, die Buchstabenklassen widerspiegeln.