Skip to main content

ボックスプロットとは何ですか?

boxボックスプロットまたはボックスアンドウィスカー図は、数値データを単一の数字ラインに沿って整理する方法であり、水平または垂直のいずれかです。実際のボックスは、プロットが水平になると、数字の線のわずかに上にあり、3つの垂直線で構成され、水平線で接続されています。ボックスの水平境界は、データの中央値または50パーセンタイルである中央線で区切られた第1および第3の四分位数(25パーセンタイルと75パーセンタイル)を表しています。水平線の中央からのボックスプロットの両側に、垂直線が伸びることもあります。これらがデータセットの最小数と最大数に達すると、より小さな水平線で終わりますが、これはデータの広がりによってわずかに異なる場合があります。これらのチャートを作成するタイミングを知るために。これらの最初のものは、5つの数字の要約と呼ばれ、多くの場合5 numと略されます。和。これは、データの第1四分位と3番目の四分位数、中央値、最大数と最大数のリストです。いくつかのアプリケーションでは、人々はこれらをプロットの近くにリストする必要がありますが、良い数字のプロットの分析は、3つの水平線とエンディングウィスカーを見ることでこれらの数値を導き出すこともできます。5つの数字のために、プロットを描く人にとっては鶏/卵の質問ではありません。和。プロットを作成するために使用する必要があります。

人々はまた、四分位範囲(IQR)と呼ばれる数字を知る必要があります。3番目の四分位から最初の四分位を引くとIQRが派生し、さまざまなソフトウェアまたは科学的計算機を使用すると、すべてのデータを入力してこの数字と5つの数の要約も取得できます。ボックスから伸びる線は通常、IQRの1.5倍にしか伸びていないため、IQRは重要です。その点を超えるデータは、連続線の代わりにドットで示されます。これらのドットはしばしば、データに外れ値があることを示唆しています。boxボックスプロットにはさまざまな用途が存在します。いくつかのプロットを1つの数字の上に描画でき、いくつかの重要な要因によって区別される同様のデータセットを比較できます。たとえば、科学者や統計学者は、男性と女性の心拍数を記録し、2つの積み重ねられたボックスプロットを構築して、範囲と四分位数の大きな違いを探すことができます。追加のスケール(垂直または水平)の欠如は、繰り返しの数字、データセットサイズ、およびほとんどの個々の数値に関する情報を省略します。ボックスプロットを見ている人は、5つの数の要約、範囲、およびデータに外れ値があるかどうかを最も理解します。ボックスのサイズ、中央値と四分位数の関係、ウィスカーの長さは、データが歪んでいるかどうかを示すことができますが、平均、モード、標準偏差などに話すことはできません。ヒストグラムのような他のチャートは、頻度などのものを表現したり、データ分布に関するより良いビジュアルを導き出したりする場合に、より便利になる場合があります。