У родильниц в возрастной группе 20-30 лет (1 группа) и возрастной группе 30-40 лет (2 группа) производилась оценка состояния новорожденного по шкале Апгар. Сравните возрастные группы
1. Сформировать научную гипотезу на основании условия задачи
2. Записать испытуемую и альтернативную (нулевую) статистические гипотезы
3. Рассчитать основн ь основные статистики групп: М (ср. значение), о (среднекв. отклонение, SD), т (ошибка) 4. Выбрать уровень значимости а и определить число степеней свободы оf 5. С помощью критерия Стьюдента (ткрит и трасч) проверить нулевую гипотезу 6. Принять или отвергнуть испытуемую статистическую гипотезу
7. Сделать текстовое заключение по научной гипотезе (различии исследуемых групп)
1 группа 2 группа
1. 7 8
2. 6 5
3. 7 9
4. 6 3
5. 8 5
6 . 6 8
7. 8 4
8. 7 5
9. 4 5
10 7 4
Задача: сравнить две возрастные группы мам (1 группа 20–30 лет, 2 группа 30–40 лет) по шкале Апгар у новорожденных. Данные по группам (10 наблюдений каждая):
1 группа: 7, 6, 7, 6, 8, 6, 8, 7, 4, 7
2 группа: 8, 5, 9, 3, 5, 8, 4, 5, 5, 4
1. Научная гипотеза
- Гипотеза заключается в том, что средние баллы Апгар между двумя группами различаются.
- Неформулируемая формулировка: различие в среднем Апгар между группой матерей 20–30 лет и 30–40 лет существует.
2. Нулевая и альтернативная гипотезы
- Нулевая гипотеза H0: μ1 = μ2 (средние Апгар в двух группах равны).
- Альтернативная гипотеза H1: μ1 ≠ μ2 (средние Апгар в двух группах различны). (Дваессторонняя проверка.)
3. Основные статистики групп
- Группа 1 (n1 = 10):
- Среднее M1 = 66 / 10 = 6.6
- Дисперсия s1^2 = [сумма избыточных квадратов отклонений] / (n1−1) = 12.4 / 9 ≈ 1.3778
- Стандартное отклонение s1 ≈ sqrt(1.3778) ≈ 1.175
- Группа 2 (n2 = 10):
- Среднее M2 = 56 / 10 = 5.6
- Дисперсия s2^2 = 36.4 / 9 ≈ 4.0444
- Стандартное отклонение s2 ≈ sqrt(4.0444) ≈ 2.010
- Разница средних: D = M1 − M2 = 6.6 − 5.6 = 1.0
- Выбор метода по вариациям:
- Признаем, что дисперсии не равны (s1^2 ≈ 1.38, s2^2 ≈ 4.04). Поэтому применим критерий Стъюдента с неравными дисперсиями (Welch t-test).
- Стандартная ошибка для Welch:
SE = sqrt( s1^2/n1 + s2^2/n2 ) = sqrt(1.3778/10 + 4.0444/10) = sqrt(0.1378 + 0.4044) = sqrt(0.5422) ≈ 0.736
- t-статистика (Welch):
t = D / SE = 1.0 / 0.736 ≈ 1.359
- Степени свободы по формуле Welch-Satterthwaite:
A = s1^2/n1 ≈ 0.1378
B = s2^2/n2 ≈ 0.4044
df ≈ (A + B)^2 / (A^2/(n1−1) + B^2/(n2−1))
≈ 0.5422^2 / (0.1378^2/9 + 0.4044^2/9)
≈ 0.2940 / (0.00211 + 0.01818)
≈ 0.2940 / 0.02029
≈ 14.5
- Значение p-уровня (двусторонняя проверка) для t ≈ 1.359 и df ≈ 14.5 примерно p ≈ 0.19–0.20. (Точная величина зависит от табличного или компьютерного расчета, но существенно больше 0.05.)
4. Уровень значимости и число степеней свободы
- Уровень значимости α = 0.05 (типичная пороговая величина).
- В Welch-критерии степени свободы df ≈ 14.5 (приближенно), в случае равных дисперсий df = n1 + n2 − 2 = 18. Поскольку дисперсии не равны, предпочтительно приводим к df ≈ 14–15.
5. Проверка гипотезы (Критерий Стьюдента, t-распределение)
- Вычисленная t-статистика: t ≈ 1.359 (Welch).
- По df ≈ 14–15 и α = 0.05 двухсторонняя критическая величина t_crit ≈ ±2.14.
- Сравнение: |t| = 1.359 < 2.14, значит не отвергаем H0 на уровне α = 0.05.
- Альтернатива: по p-значению ≈ 0.19–0.20 > 0.05; следовательно, недостаточно доказательств различий между группами.
6. Принятие или отклонение нулевой гипотезы
- Нулевую гипотезу H0: μ1 = μ2 мы не отвергаем на уровне значимости α = 0.05. То есть статистически значимого различия в средних баллах Апгар между двумя возрастными группами мам не обнаружено в данной выборке.
7. Текстовое заключение по научной гипотезе
- В данной выборке из 10 новорожденных в каждой группе средний Апгар в группе матерей 20–30 лет (6.6) был немного выше, чем в группе 30–40 лет (5.6). Однако разница оказалась статистически не значимой по t-тесту с учетом неравных дисперсий: t ≈ 1.36, df ≈ 14–15, p ≈ 0.19. Это означает, что на уровне значимости 0.05 нет достаточных оснований заключать, что возраст матери влияет на средний Апгар у новорожденного в этой выборке. Следовательно, различие между группами не подтверждается. Ограничения: небольшой размер выборки, возможная неравномерность вариаций внутри групп, требуют дополнительного исследования на большем наборе данных.
Примечания:
- Можно привести доверительный интервал для разницы средних: в расчете поWelch приблизительно diff ± t_crit·SE = 1.0 ± 2.14·0.736 ≈ [-0.58, 2.58]. Включение нуля в этот интервал согласуется с отсутствием статистически значимого различия.
- Для полноты можно дополнительно привести альтернативную версию теста (например, с равными дисперсиями) и сравнить результаты; в обоих случаях различие не достигает статистической значимости в этом наборе данных.