問題
データを代表する値のことを代表値といい, 代表値には次のようなものがある.
- A:平均値…データの値の合計をデータの個数でわった値
- B:中央値…データの大きさの順に並べかえたとき, ちょうど真ん中に位置する値
- C:最頻値…データの中で, 最も多く現れた値
- D:最大値…データの中で, 最も大きい値
このとき, 次の問いに答えよ.
解説
問① 次のア〜ウの場合で, どの代表値を使用するのが適当か. それぞれ問題文の A, B, C, D の中から1つ選び記号で答えよ.
- ア:クラス30人が受けたテストの結果のデータから, 自分の得点が半分以上の上位15人に入っているかどうかを調べるとき.
- イ:クラス対抗全員リレーをするとき, それぞれのクラス全員が測定した50m走の記録のデータからクラスの順位を予想するとき.
- ウ:靴屋でスニーカーを売るとき, 昨年売れたスニーカーのサイズのデータからどのサイズを多く仕入れればよいか決めるとき.
アは, 全データの半分を知りたいのでB(中央値)を, イは, 全員のタイムが知りたいのでA(平均値)を, ウは, 最も売れたサイズが知りたいので, C(最頻値)を使用するのがよいです.
W君は, 周りの中学生が1ヶ月あたりにどのくらいのお小遣いをもらっているのかを調べた.
問② 次の資料は「W君が調べた中学生10人の1ヶ月あたりのお小遣い(円)」である. このデータについて, 平均値, 中央値, 最頻値, 最大値を求めよ.

それぞれの値を求めると,
- 平均値:$(500+800+0+2000+800+800+1000+15000+2000+1000)\div10=$$2390$
- 中央値:データを小さい順に並べると, $0, 500, 800, 800, 800, 1000, 1000, 2000, 2000, 15000$より, $(800+1000)\div2=$$900$
- 最頻値:300
- 最大値:15000
となります.
問③ 問②のようなデータを用いて結論を出すとき, 代表値として使用するのは平均値より中央値が適切である. 平均値が適切ではない理由を説明せよ.
平均値が2390に対して, 平均を上回っているデータが15000の1つしかないため, より実情を表している中央値を用いた方が良いとされます.
*平均値が外れ値(極端に大きいor小さい値のこと)に弱い, ということは社会の統計や理科の実験などでも出題されることがあるので覚えておきましょう!
