Конспект по вероятности и статистике
Ответ нейросети
21 января 2026 12:57
Ниже компактный конспект по вероятности и статистике, ориентированный на подготовку к университетским экзаменам. Разделы: основы, распределения, оценивание и интервальные оценки, проверка гипотез, регрессия и корреляция, непараметрические методы, примеры задач.
- Основы вероятности
- Аксиомы Kolmogorov: вероятность события A есть число P(A) ∈ [0,1], P(Ω)=1, для набора взаимно несовместимых событий A1…Ak выполняется P(⋃ Ai)=∑P(Ai).
- Условная вероятность: P(A|B)=P(A∩B)/P(B), если P(B)>0.
- Независимость: A и B независимы, если P(A∩B)=P(A)P(B). Независимость МВД нарушаться.
- Правила: сложения и умножения для вероятностей; полная вероятность: P(A)=∑ P(A|B_i)P(B_i) для разбиения Ω на B_i.
- Теорема Байеса: P(B|A)=P(A|B)P(B)/P(A).
- Случайная величина: задача описания числового вывода наблюдений. Дискретная и непрерывная. Плотность f_X(x)≥0, ∫ f_X(x) dx =1, функция распределения F_X(x)=P(X≤x)=∫_{-∞}^x f_X(t) dt.
- Распределения и функции распределения
- Функция распределения F_X(x) и плотность f_X(x) (для непрерывных).
- Моменты: математическое ожидание E[X], дисперсия Var(X)=E[(X−E[X])^2].
- Линейность ожидания: E[aX+b]=aE[X]+b.
- Стандартное нормальное: Z~N(0,1), X=μ+σZ. z-значение z=(x−μ)/σ.
Дискретные распределения
- Биномиальное: X∼Bin(n,p). P(X=k)=C(n,k) p^k (1−p)^{n−k}. E[X]=np, Var(X)=np(1−p).
- Пуассоновское: X∼Poisson(λ). P(X=k)=e^{−λ} λ^k / k!. E[X]=Var(X)=λ.
- Геометрическое (число испытаний до первого успеха): P(X=k)=(1−p)^{k−1} p, k=1,2,…; E[X]=1/p, Var(X)=(1−p)/p^2.
- Распределение равномерное на [a,b]: f(x)=1/(b−a) для a≤x≤b. E[X]=(a+b)/2, Var(X)=(b−a)^2/12.
Непрерывные распределения
- Нормальное: f(x)=(1/(σ√{2π})) exp(−(x−μ)^2/(2σ^2)); F(x)=Φ((x−μ)/σ). E[X]=μ, Var(X)=σ^2.
- Экспоненциальное: f(x)=λ e^{−λx}, x≥0. E[X]=1/λ, Var(X)=1/λ^2.
- Равномерное: на [a,b] — как выше.
- Гамма, экспоненциальное иррациональное: встречаются в статистике. E[Гамма(k,θ)]=kθ, Var=kθ^2.
Центральная предельная теорема
- Пусть X_i i.i.d. с E[X_i]=μ, Var(X_i)=σ^2<∞. Тогда √n(\bar X − μ) → N(0, σ^2) и \bar X приблизительно N(μ, σ^2/n) для больших n.
- Оценка параметров: точечная и интервальная
- Точечная оценка: выборочная величина как оценка параметра.
- Математическое ожидание μ: оценка x̄; дисперсия σ^2: оценка s^2= (1/(n−1))∑(x_i−x̄)^2.
- Пусть θ — параметр; метод моментов и максимального правдоподобия (MLE) — базовые подходы.
- Интервальная оценка (доверительные интервалы):
- Среднее при известной σ: μ ∈ [ x̄ − z_{α/2} σ/√n, x̄ + z_{α/2} σ/√n ].
- Среднее при неизвестной σ: μ ∈ x̄ ± t_{n−1,α/2} s/√n.
- Интервалы для пропорции p (биномиальное): Wald-интервал p̂ ± z_{α/2}√[p̂(1−p̂)/n] (часто требуется улучшение: Wilson, Agresti–Coull).
- Интервалы для дисперсии σ^2 в нормальном: ( (n−1)s^2 / χ²_{1−α/2, n−1} , (n−1)s^2 / χ²_{α/2, n−1} ).
- Оценки параметров:
- МЛЕ для μ в нормальном: x̄; для σ^2: (1/n)∑(x_i−x̄)^2 (модель с максимальным правдоподобием, несмещённая оценка обычно s^2=(1/(n−1))∑(x_i−x̄)^2).
- Проверка гипотез
- Формулировки: H0: θ=θ0 против H1: θ≠θ0 (двусторонняя) или однонаправленная.
- Статистика теста:
- Z-тест: когда σ известно: Z = (x̄−θ0)/(σ/√n).
- t-тест: когда σ неизвестно: T = (x̄−θ0)/(s/√n), распределение t_{n−1}.
- Хи-квадрат тест: для дисперсии или независимости в таблицах: χ² = ∑ (O−E)²/E.
- F-тест: сравнение дисперсий двух нормальных выборок.
- P-значение и порог α. Ошибки I рода (α) и II рода (β).
- Пример: тест на среднее при неизвестной дисперсии и равных условиях.
- Регрессия и корреляция
- Линейная регрессия Y = β0 + β1 X + ε, ε∼N(0, σ²).
- Оценки: β1_hat = cov(X,Y)/var(X); β0_hat = ȳ − β1_hat x̄.
- Доверительные интервалы для β1 и β0; R² — доля объяснённой дисперсии.
- Предсказания и их доверительные интервалы.
- Корреляция:
- Пирсона r = cov(X,Y)/(s_X s_Y), ∈ [−1,1], тест на нулевую корреляцию.
- Спирмен ранговая корреляция.
- Непараметрические методы
- Для сравнения двух независимых выборок: Манна–Уитни (U), тест Уилкоксона ранговый.
- Критерий Краскела–Уоллиса для сравнения более чем двух групп.
- Часто применяются, если распределения не нормальны или выборки малы.
- Практические приемы и типичные ошибки
- Не использовать нормальное приближение для малых n без проверки условий.
- Игнорировать зависимость наблюдений.
- Различать выборочную дисперсию s² и несмещённую оценку (n−1 в знаменателе).
- Корректность интервалов для интервальных оценок пропорций (Wald может быть не надёжен при малых p или n).
- Учитывать множественные сравнения при тестировании нескольких гипотез.
- Примерные задачи (кратко)
- Задача 1: Биномиальное. n=20, p=0.3. Найти P(X≥5). Подсчет: P(X≥5)=1−P(X≤4)=1−∑_{k=0}^4 C(20,k) 0.3^k 0.7^{20−k}.
- Задача 2: Нормальное. X∼N(μ, σ²), известен σ. 95% CI для μ на основе n наблюдений: x̄ ± z_{0.975} σ/√n.
- Задача 3: t-тест. Независимые выборки, неизвестная дисперсия, проверить разницу средних μ1−μ2=0. Статистика: t = (x̄1−x̄2)/√(s_p^2(1/n1+1/n2)), где s_p^2 — объединённая дисперсия.
- Задача 4: Хи-квадрат тест на независимость 2×2 таблицы. χ² = ∑ (O−E)²/E; сравнить с χ²_{critical, df=(r−1)(c−1)}.
- Задача 5: Регрессия. Данные пары (X_i, Y_i). Найти β0̂, β1̂, R², доверительные интервалы для β1.
Если хотите, могу сделать под ваши курсы: привести конкретный конспект под ваш вуз/кафедру, адаптировать формулы к темам лекций, подобрать конкретные примеры и типовые задачи из вашего семестра. Можете сообщить уровень курса (бакалавриат/магистратура), язык преподавания и какие распределения чаще встречаются в вашем экзаменационном билете.
Понравился ответ?
Задай свой вопрос
Напиши любую задачу или вопрос, а нейросеть её решит



