Skip to main content

ヒストグラムの分布とは何ですか?

statistics統計のヒストグラム分布は、ヒストグラム上の単変量データバーのパターン、形状、および位置を指します。バーがどのように、どこで分散されているかを使用して、データに関する結論を分析および描画できます。ヒストグラム分布分析は、データの正常性、マルチモーダル分布、歪んだデータなどの特性を識別する上で重要です。ヒストグラムのデータポイントはビンに編成され、ヒストグラム分布自体は、データの頻度分布または確率密度関数の視覚的近似です。分布の形状は、ビンの数に基づいて変化する可能性があります。正規性を決定するための分析方法は存在しますが、ヒストグラムを使用して、時間を節約するための迅速な常識チェックを提供できます。ヒストグラムデータがほぼ均等に表示され、平均に集中している場合、データは正常であると想定されます。高速で比較的簡単ですが、この種の定性的チェックは主観的であり、より高い標準の精度が必要な場合は分析的な方法を使用する必要があります。データの歪度は、データの非対称性として定義されます。負のスキュー、または左に歪むのは、値が非常に少ないデータセットで見られます。ポジティブスキュー、または右に歪むことは、ほとんど高い値のデータセットで発生します。ヒストグラムの分布を観察すると、外れ値と歪んだデータが明らかになります。Single単一モードでデータの特性を明らかにすることに加えて、ヒストグラムの形状はマルチモーダルデータの特性を明らかにすることもできます。マルチモーダルデータセットには複数のモードが含まれており、複数のピークまたは最大値を持つ周波数分布によって特徴付けられます。町での政治的所属、承認意見調査、およびミツバチの体のサイズは、マルチモーダルである可能性のあるデータセットの例です。ヒストグラムの形状を観察し、マルチモーダルデータのさまざまなピークに注目すると、多くの場合、単純な単変量統計計算よりも多くの洞察を研究者に提供できます。実際には、他のビンサイズを使用することができますが、ビンの数は観測数の平方根を取得することで推定できます。たとえば、教師は、レターグレードを反映するビンサイズを選択して、テストグレードを分析することを選択できます。