В таблице представлены данные о месячном доходе в тысячах рублях жителей некоторого региона по выборке из 1000 жителей. Доход [ 0;10] [ 10;20] [20;30 ] [30;40 ] [ 40;50] [ 50;60] [ 60;70]
Число жителей 55 96 186 312 137 132 82 Найдите по этой выборке выборочную дисперсию месячного дохода
Задача решается для сгруппированных данных через приближение значений классов их серединками (мидпойнтами).
Данные
- Всего наблюдений n = 1000
- Классы (мес. доход): [0;10], [10;20], [20;30], [30;40], [40;50], [50;60], [60;70]
- Частоты f_i: 55, 96, 186, 312, 137, 132, 82
- Мидпойнты классов x_i (тыс. руб.): 5, 15, 25, 35, 45, 55, 65
1) Найдем выборочное среднее (по сгруппированным данным)
- Сумма f_i * x_i = 55*5 + 96*15 + 186*25 + 312*35 + 137*45 + 132*55 + 82*65
- = 36040
- x̄ = (1/n) Σ f_i x_i = 36040 / 1000 = 36.04 (тыс. руб.)
2) Найдем сумму квадратов отклонений
Для каждого класса вычислим d_i = x_i − x̄ и d_i^2, затем f_i * d_i^2, и сумму по всем i.
- Класс [0;10], x_i = 5: d = 5 − 36.04 = −31.04, d^2 = 963.4816, f_i d^2 = 55 * 963.4816 = 52,991.488
- [10;20], x_i = 15: d = −21.04, d^2 = 442.6816, f_i d^2 = 96 * 442.6816 = 42,497.4336
- [20;30], x_i = 25: d = −11.04, d^2 = 121.8816, f_i d^2 = 186 * 121.8816 = 22,669.9776
- [30;40], x_i = 35: d = −1.04, d^2 = 1.0816, f_i d^2 = 312 * 1.0816 = 337.4592
- [40;50], x_i = 45: d = 8.96, d^2 = 80.2816, f_i d^2 = 137 * 80.2816 = 10,998.5792
- [50;60], x_i = 55: d = 18.96, d^2 = 359.4816, f_i d^2 = 132 * 359.4816 = 47,451.5712
- [60;70], x_i = 65: d = 28.96, d^2 = 838.6816, f_i d^2 = 82 * 838.6816 = 68,771.8912
Сумма S = Σ f_i d_i^2 = 245,718.4 (тыс.^2 руб.)
3) Выборочная дисперсия
- n = 1000, поэтому дискриптор (выборочная дисперсия) s^2 = S / (n − 1) = 245,718.4 / 999 ≈ 245.964 (тыс. руб.^2)
Ответ
- Выборочная дисперсия месячного дохода по данной выборке ≈ 245.96 (тыс. руб.)^2
- При необходимости можно дополнительно привести стандартное отклонение: s ≈ sqrt(245.964) ≈ 15.68 тыс. руб.