Skip to main content

Apa itu distribusi histogram?

Distribusi histogram dalam statistik mengacu pada pola, bentuk dan lokasi bilah data univariat pada histogram.Bagaimana dan di mana bilah didistribusikan dapat digunakan untuk menganalisis dan menarik kesimpulan tentang data.Analisis distribusi histogram penting dalam mengidentifikasi sifat -sifat seperti normalitas data, distribusi multimodal dan data miring.

Histogram adalah tampilan data univariat yang menggunakan persegi panjang proporsional di area ke kelas atau frekuensi bin untuk menunjukkan fitur data secara visual.Titik data dalam histogram diatur ke dalam nampan dan distribusi histogram itu sendiri adalah perkiraan visual dari distribusi frekuensi data atau fungsi kepadatan probabilitas.Bentuk distribusi dapat berubah berdasarkan jumlah tempat sampah.

Analisis distribusi histogram sering digunakan sebagai pemeriksaan kualitatif untuk normalitas data.Meskipun metode analitik untuk menentukan normalitas ada, histogram dapat digunakan untuk memberikan pemeriksaan akal sehat yang cepat untuk menghemat waktu.Jika data histogram muncul secara kasar dan berpusat pada rata -rata, data diasumsikan normal.Meskipun cepat dan relatif mudah, pemeriksaan kualitatif semacam ini bersifat subyektif dan metode analitik harus digunakan jika standar akurasi yang lebih tinggi diperlukan.

Menentukan apakah set data menunjukkan kemiringan adalah cara lain analisis distribusi histogram dapat digunakan.Kemiringan data didefinisikan sebagai asimetri yang diucapkan dalam data.Kemiringan negatif, atau miring ke kiri, terlihat dalam set data dengan sedikit nilai rendah.Kemiringan positif, atau miring ke kanan, terjadi pada set data dengan beberapa nilai tinggi.Mengamati distribusi histogram dapat mengungkapkan outlier dan data miring.

Selain mengungkapkan karakteristik data dengan mode tunggal, bentuk histogram juga dapat mengungkapkan karakteristik data multimodal.Set data multimodal berisi lebih dari satu mode dan ditandai dengan distribusi frekuensi yang memiliki lebih dari satu puncak atau maxima.Afiliasi politik di kota, jajak pendapat persetujuan, dan ukuran lebah adalah contoh set data yang mungkin multimodal.Mengamati bentuk histogram dan mencatat berbagai puncak dalam data multimodal sering dapat memberikan peneliti dengan wawasan yang lebih daripada perhitungan statistik univariat sederhana.

Analisis histogram dan distribusi data sangat tergantung pada ukuran bin yang dipilih.Dalam praktiknya, jumlah tempat sampah dapat diperkirakan dengan mengambil akar kuadrat dari jumlah pengamatan, meskipun ukuran nampan lainnya dapat digunakan.Misalnya, seorang guru dapat memilih untuk menganalisis nilai tes dengan memilih ukuran bin yang mencerminkan nilai huruf.