Предположим, что у тебя есть два производителя, которые производят одинаковые игральные кубики. Кубик первого производителя подбрасывается 1000 раз, а кубик второго – 2000 раз.
Каковы твои ожидания в отношении распределения значений, и как это связано с законом больших чисел?
Коротко: если кубики действительно одинаковые и каждую грань выкидывают с вероятностью 1/6, то после большого числа подбрасываний частоты выпадения каждой грани будет близка к 1/6, а среднее значение по всем броскам близко к 3.5. Различия между двумя сериями уменьшаются с ростом числа подбрасываний.
Развёрнуто:
- Пусть для каждого кубика i = 1,2 и каждой грани g ∈ {1,2,3,4,5,6} Yi,g — число раз, когда на i-м кубике выпала грань g. Пусть ni — число подбрасываний (n1 = 1000, n2 = 2000).
- Ожидания и дисперсии:
- E[Yi,g] = ni/6.
- Var(Yi,g) = ni · p · (1 − p) с p = 1/6, то есть Var(Yi,g) = ni · (5/36).
- Частота оценки p̂i,g = Yi,g / ni имеет E[p̂i,g] = 1/6 и Var(p̂i,g) = p(1−p)/ni = (5/36)/ni.
- Численные значения:
- Для g = любая грань:
- На n1 = 1000: sd(p̂1,g) ≈ sqrt((5/36)/1000) ≈ 0.0118.
Ожидаемое число выпадений: E[Yi,g] ≈ 1000/6 ≈ 166.7, std.dev. ≈ sqrt(1000·5/36) ≈ 11.8.
95% доверительный интервал для пропорции: ≈ 1/6 ± 1.96·0.0118 ≈ 0.1667 ± 0.023 → примерно [0.144, 0.189].
Для счётчиков: примерно 166.7 ± 1.96·11.8 ≈ [143.6, 189.8].
- На n2 = 2000: sd(p̂2,g) ≈ sqrt((5/36)/2000) ≈ 0.0083.
Ожидаемое число выпадений: E[Yi,g] ≈ 2000/6 ≈ 333.3, std. dev. ≈ sqrt(2000·5/36) ≈ 16.7.
95% доверительный интервал для пропорции: ≈ 0.1667 ± 1.96·0.0083 ≈ ±0.016 → примерно [0.151, 0.183].
Для счётчиков: примерно 333.3 ± 1.96·16.7 ≈ [301, 366].
- Как это связано с законом больших чисел:
- Закон больших чисел (ЛБЧ) говорит, что для каждого кубика среднее значение выпавших чисел и частоты граней сходятся к их теоретическим ожидениям по мере роста числа подбрасываний.
- В случае честного кубика эти теоретические вероятности равны 1/6 для каждой грани, а математическое ожидание значения равно E[X] = 3.5.
- Следовательно, по мере увеличения ni (и особенно для 2000 против 1000) наблюдаемые распределения станут ближе к равномерному распределению по граням и к среднему 3.5. Разница между двумя экспериментами (если кубики идентичны) будет растираживаться менее заметной, т.е. их выборочныеverages будут сходиться друг к другу.
- Более тонко: точность оценки пропорций улучшается как sqrt(1/ni). По сути, увеличение числа подбрасываний уменьшает стандартную ошибку и делает распределение ближе к теоретическому.
Кратко итог: обе серии подбрасываний должны давать близкую к равномерному распределению частот граней; более длинная серия (2000 бросков) даст ещё меньшие отклонения от 1/6 и от 3.5, что напрямую следует из закона больших чисел и из нормального приближения (Центральная предельная теорема) для оценок пропорций.