学校で行うテストで、先生から平均点を教えてもらうことはありませんか?
たとえば、「クラスのテストの平均点が80点だった」と聞くと、「自分の点数と比べて良いのか悪いのか」と判断材料にすることもあるでしょう。
しかし、この「平均値」、実は思っているほど信用できない場面もあるのです。特に外れ値(極端に大きい値や小さい値)がある場合、平均値は簡単に歪んでしまいます。今回は、そんな平均値の落とし穴について、具体例を交えながら説明していきます。
そもそも「平均値」とは
平均値とは、データがどのように分布しているのかを表す代表値の1つです。
平均値の求め方は
(データの値の合計)÷(データの個数)
となります。
具体的な例を見てみましょう。以下のような5人の月収データがあるとします。
Aさん | Bさん | Cさん | Dさん | Eさん |
22万円 | 28万円 | 24万円 | 26万円 | 200万円 |
ここで、平均月収を計算するとどうなるでしょうか?
(平均) = (22+28+24+26+200) ÷ 5
= 300 ÷ 5
= 60 万円
この計算結果を見ると

平均月収は60万円か…。みんなけっこう稼いでるな…。
と感じるかもしれません。
ですが、これは正しい判断でしょうか?
平均値だけを見ると本当の状況がわからない
先ほどの例をよく見ると、Eさんの「200万円」という収入が他の人に比べて極端に高いことがわかります。このような外れ値があると、平均値はその影響を大きく受けてしまいます。
実際に、Eさん以外の4人(Aさん~Dさん)の収入の平均を計算すると以下の通りです。
(A〜Dの平均) = (22+28+24+26) ÷ 5
= 100 ÷ 4
= 25 万円
この結果を見ると、多くの人の収入は「25万円前後」であり、平均60万円という値はグループ全体を正確に反映していないことがわかります。
なぜ平均値を安易に信じてはいけないのか?
平均値はすべてのデータを単純に足し合わせて、その合計をデータの個数で割っただけの値です。極端な値(外れ値)が存在すると、他の値に比べて大きく引っ張られてしまいます。そのため、以下のようなケースでは平均値をそのまま信じるのは危険です。
①.外れ値がある場合
一部の極端な値が全体の平均を歪めます。
②.データの分布が偏っている場合
データが一方向に偏っていると、平均は「典型的な値」からずれてしまうことがあります。
ではどのように判断すればよいのか?
平均値だけではなく、中央値や最頻値といった他の代表値も確認することで、データの分布をより正確に把握できます。
• 中央値:データを小さい順に並べたときの真ん中の値
• 最頻値:最も頻繁に出現する値
先ほどの月収の例では、データを小さい順に並べると以下のようになります。
22 , 24 , 26 , 28 , 200
• 中央値は真ん中の値、つまり26万円。
• 最頻値は重複しているデータがないため、ありません。
中央値を見ると、グループ全体の典型的な値が26万円程度であることがわかります。
まとめ
● 平均値は便利な指標ですが、外れ値の影響を受けやすい。
● データを見るときは、中央値や最頻値といった平均値以外の代表値も注目し、全体の分布のようすを意識することが大切!
数字の背景に隠された真実を見抜く力を身につけて、賢く情報を活用していきましょう!
コメント