ヒストグラムのクラスとは何ですか?
ヒストグラムクラスは、頻度分布のデータポイント、または生データの集計を含む値の範囲です。また、間隔、ビン、またはビン幅とも呼ばれます。棒グラフのタイプであるヒストグラムでは、これらのクラスは、列の高さがクラス範囲に含まれるデータポイントの数を示す垂直列として描かれています。通常、ヒストグラムクラスの選択は、データ統計またはトレンドの視覚的表現を強化するために行われます。
表示するデータが大量にある場合、ヒストグラムはその分布の形状を描くのに特に役立ちます。 データの全範囲が間隔に分割され、それぞれに分類されるデータポイントの数がカウントされ、クラスの頻度が得られます。間隔の範囲または幅は、ヒストグラムクラスの数を決定し、グラフの形状に影響します。
間隔が広すぎる場合、クラスが包括的すぎると重要な情報が省略される可能性があります。いつ間隔の幅の選択は狭すぎるため、クラスの周波数が低いと、実際にランダムな変動であるものが過度に重要になる可能性があります。データセットに適切な数のヒストグラムクラスを設定する方法はいくつかあります。
Sturgisのルールによれば、クラスの数は、データポイントの数と1つのデータポイントのベース2ログに近いものでなければなりません。ライスのルールを使用して、定義されたクラスの数は、データポイントの数の2倍の立方根でなければなりません。ヒストグラムクラスの数の選択に使用される方法のいずれかを使用する方法は、ヒストグラム形状の感度をクラスサイズにテストするために、いくつかの異なる幅を試してみる必要があります。正しい数のクラスは、データの分布を最も正確に描写するクラスです。
さまざまなデータの適切な数のヒストグラムクラスを使用すると、明確な解釈を可能にする意味のあるグラフィカルな表現が生じる必要があります。 histogrAMは、データの中心と広がり、歪度、またはデータの非対称性、および予想される値の範囲外で発生する外れ値、またはデータポイントを表示する必要があります。モード、または最も頻繁に発生する値は、複数のモダリティを示す可能性のあるグループと同様に明らかである必要があります。ヒストグラム分析は、データ収集プロセスの障害を示している可能性もあります。
金融および社会科学で長い間使用されているため、ヒストグラムは家電のグラフィカルディスプレイでより馴染みのあるものになりつつあります。デジタル写真は、特に使用に対して開かれており、多くのカメラにカラーヒストグラムが組み込まれており、ホワイトのバランスと露出を示すことができます。デジタル写真のヒストグラムは、灰色の色合いに対してプロットされたヒストグラムクラスとしてピクセルを表示する場合があります。