Вопрос от Анонимного юзера 21 января 2026 12:57

Question 1

Конспект по вероятности и статистике

Answer

Ниже компактный конспект по вероятности и статистике, ориентированный на подготовку к университетским экзаменам. Разделы: основы, распределения, оценивание и интервальные оценки, проверка гипотез, регрессия и корреляция, непараметрические методы, примеры задач.

Основы вероятности

Аксиомы Kolmogorov: вероятность события A есть число P(A) ∈ [0,1], P(Ω)=1, для набора взаимно несовместимых событий A1…Ak выполняется P(⋃ Ai)=∑P(Ai).
Условная вероятность: P(A|B)=P(A∩B)/P(B), если P(B)>0.
Независимость: A и B независимы, если P(A∩B)=P(A)P(B). Независимость МВД нарушаться.
Правила: сложения и умножения для вероятностей; полная вероятность: P(A)=∑ P(A|B_i)P(B_i) для разбиения Ω на B_i.
Теорема Байеса: P(B|A)=P(A|B)P(B)/P(A).
Случайная величина: задача описания числового вывода наблюдений. Дискретная и непрерывная. Плотность f_X(x)≥0, ∫ f_X(x) dx =1, функция распределения F_X(x)=P(X≤x)=∫_{-∞}^x f_X(t) dt.

Распределения и функции распределения

Функция распределения F_X(x) и плотность f_X(x) (для непрерывных).
Моменты: математическое ожидание E[X], дисперсия Var(X)=E[(X−E[X])^2].
Линейность ожидания: E[aX+b]=aE[X]+b.
Стандартное нормальное: Z~N(0,1), X=μ+σZ. z-значение z=(x−μ)/σ.

Дискретные распределения

Биномиальное: X∼Bin(n,p). P(X=k)=C(n,k) p^k (1−p)^{n−k}. E[X]=np, Var(X)=np(1−p).
Пуассоновское: X∼Poisson(λ). P(X=k)=e^{−λ} λ^k / k!. E[X]=Var(X)=λ.
Геометрическое (число испытаний до первого успеха): P(X=k)=(1−p)^{k−1} p, k=1,2,…; E[X]=1/p, Var(X)=(1−p)/p^2.
Распределение равномерное на [a,b]: f(x)=1/(b−a) для a≤x≤b. E[X]=(a+b)/2, Var(X)=(b−a)^2/12.

Непрерывные распределения

Нормальное: f(x)=(1/(σ√{2π})) exp(−(x−μ)^2/(2σ^2)); F(x)=Φ((x−μ)/σ). E[X]=μ, Var(X)=σ^2.
Экспоненциальное: f(x)=λ e^{−λx}, x≥0. E[X]=1/λ, Var(X)=1/λ^2.
Равномерное: на [a,b] — как выше.
Гамма, экспоненциальное иррациональное: встречаются в статистике. E[Гамма(k,θ)]=kθ, Var=kθ^2.

Центральная предельная теорема

Пусть X_i i.i.d. с E[X_i]=μ, Var(X_i)=σ^2<∞. Тогда √n(\bar X − μ) → N(0, σ^2) и \bar X приблизительно N(μ, σ^2/n) для больших n.

Оценка параметров: точечная и интервальная

Точечная оценка: выборочная величина как оценка параметра.
- Математическое ожидание μ: оценка x̄; дисперсия σ^2: оценка s^2= (1/(n−1))∑(x_i−x̄)^2.
- Пусть θ — параметр; метод моментов и максимального правдоподобия (MLE) — базовые подходы.
Интервальная оценка (доверительные интервалы):
- Среднее при известной σ: μ ∈ [ x̄ − z_{α/2} σ/√n, x̄ + z_{α/2} σ/√n ].
- Среднее при неизвестной σ: μ ∈ x̄ ± t_{n−1,α/2} s/√n.
- Интервалы для пропорции p (биномиальное): Wald-интервал p̂ ± z_{α/2}√[p̂(1−p̂)/n] (часто требуется улучшение: Wilson, Agresti–Coull).
- Интервалы для дисперсии σ^2 в нормальном: ( (n−1)s^2 / χ²_{1−α/2, n−1} , (n−1)s^2 / χ²_{α/2, n−1} ).
Оценки параметров:
- МЛЕ для μ в нормальном: x̄; для σ^2: (1/n)∑(x_i−x̄)^2 (модель с максимальным правдоподобием, несмещённая оценка обычно s^2=(1/(n−1))∑(x_i−x̄)^2).

Проверка гипотез

Формулировки: H0: θ=θ0 против H1: θ≠θ0 (двусторонняя) или однонаправленная.
Статистика теста:
- Z-тест: когда σ известно: Z = (x̄−θ0)/(σ/√n).
- t-тест: когда σ неизвестно: T = (x̄−θ0)/(s/√n), распределение t_{n−1}.
- Хи-квадрат тест: для дисперсии или независимости в таблицах: χ² = ∑ (O−E)²/E.
- F-тест: сравнение дисперсий двух нормальных выборок.
P-значение и порог α. Ошибки I рода (α) и II рода (β).
Пример: тест на среднее при неизвестной дисперсии и равных условиях.

Регрессия и корреляция

Линейная регрессия Y = β0 + β1 X + ε, ε∼N(0, σ²).
- Оценки: β1_hat = cov(X,Y)/var(X); β0_hat = ȳ − β1_hat x̄.
- Доверительные интервалы для β1 и β0; R² — доля объяснённой дисперсии.
- Предсказания и их доверительные интервалы.
Корреляция:
- Пирсона r = cov(X,Y)/(s_X s_Y), ∈ [−1,1], тест на нулевую корреляцию.
- Спирмен ранговая корреляция.

Непараметрические методы

Для сравнения двух независимых выборок: Манна–Уитни (U), тест Уилкоксона ранговый.
Критерий Краскела–Уоллиса для сравнения более чем двух групп.
Часто применяются, если распределения не нормальны или выборки малы.

Практические приемы и типичные ошибки

Не использовать нормальное приближение для малых n без проверки условий.
Игнорировать зависимость наблюдений.
Различать выборочную дисперсию s² и несмещённую оценку (n−1 в знаменателе).
Корректность интервалов для интервальных оценок пропорций (Wald может быть не надёжен при малых p или n).
Учитывать множественные сравнения при тестировании нескольких гипотез.

Примерные задачи (кратко)

Задача 1: Биномиальное. n=20, p=0.3. Найти P(X≥5). Подсчет: P(X≥5)=1−P(X≤4)=1−∑_{k=0}^4 C(20,k) 0.3^k 0.7^{20−k}.
Задача 2: Нормальное. X∼N(μ, σ²), известен σ. 95% CI для μ на основе n наблюдений: x̄ ± z_{0.975} σ/√n.
Задача 3: t-тест. Независимые выборки, неизвестная дисперсия, проверить разницу средних μ1−μ2=0. Статистика: t = (x̄1−x̄2)/√(s_p^2(1/n1+1/n2)), где s_p^2 — объединённая дисперсия.
Задача 4: Хи-квадрат тест на независимость 2×2 таблицы. χ² = ∑ (O−E)²/E; сравнить с χ²_{critical, df=(r−1)(c−1)}.
Задача 5: Регрессия. Данные пары (X_i, Y_i). Найти β0̂, β1̂, R², доверительные интервалы для β1.

Если хотите, могу сделать под ваши курсы: привести конкретный конспект под ваш вуз/кафедру, адаптировать формулы к темам лекций, подобрать конкретные примеры и типовые задачи из вашего семестра. Можете сообщить уровень курса (бакалавриат/магистратура), язык преподавания и какие распределения чаще встречаются в вашем экзаменационном билете.

Question 2

Конспект по вероятности и статистике

Answer

Ниже компактный конспект по вероятности и статистике, ориентированный на подготовку к университетским экзаменам. Разделы: основы, распределения, оценивание и интервальные оценки, проверка гипотез, регрессия и корреляция, непараметрические методы, примеры задач. 1) Основы вероятности - Аксиомы Kolmogorov: вероятность события A есть число P(A) ∈ [0,1], P(Ω)=1, для набора взаимно несовместимых событий A1…Ak выполняется P(⋃ Ai)=∑P(Ai). - Условная вероятность: P(A|B)=P(A∩B)/P(B), если P(B)>0. - Независимость: A и B независимы, если P(A∩B)=P(A)P(B). Независимость МВД нарушаться. - Правила: сложения и умножения для вероятностей; полная вероятность: P(A)=∑ P(A|B_i)P(B_i) для разбиения Ω на B_i. - Теорема Байеса: P(B|A)=P(A|B)P(B)/P(A). - Случайная величина: задача описания числового вывода наблюдений. Дискретная и непрерывная. Плотность f_X(x)≥0, ∫ f_X(x) dx =1, функция распределения F_X(x)=P(X≤x)=∫_{-∞}^x f_X(t) dt. 2) Распределения и функции распределения - Функция распределения F_X(x) и плотность f_X(x) (для непрерывных). - Моменты: математическое ожидание E[X], дисперсия Var(X)=E[(X−E[X])^2]. - Линейность ожидания: E[aX+b]=aE[X]+b. - Стандартное нормальное: Z~N(0,1), X=μ+σZ. z-значение z=(x−μ)/σ. Дискретные распределения - Биномиальное: X∼Bin(n,p). P(X=k)=C(n,k) p^k (1−p)^{n−k}. E[X]=np, Var(X)=np(1−p). - Пуассоновское: X∼Poisson(λ). P(X=k)=e^{−λ} λ^k / k!. E[X]=Var(X)=λ. - Геометрическое (число испытаний до первого успеха): P(X=k)=(1−p)^{k−1} p, k=1,2,…; E[X]=1/p, Var(X)=(1−p)/p^2. - Распределение равномерное на [a,b]: f(x)=1/(b−a) для a≤x≤b. E[X]=(a+b)/2, Var(X)=(b−a)^2/12. Непрерывные распределения - Нормальное: f(x)=(1/(σ√{2π})) exp(−(x−μ)^2/(2σ^2)); F(x)=Φ((x−μ)/σ). E[X]=μ, Var(X)=σ^2. - Экспоненциальное: f(x)=λ e^{−λx}, x≥0. E[X]=1/λ, Var(X)=1/λ^2. - Равномерное: на [a,b] — как выше. - Гамма, экспоненциальное иррациональное: встречаются в статистике. E[Гамма(k,θ)]=kθ, Var=kθ^2. Центральная предельная теорема - Пусть X_i i.i.d. с E[X_i]=μ, Var(X_i)=σ^2<∞. Тогда √n(\bar X − μ) → N(0, σ^2) и \bar X приблизительно N(μ, σ^2/n) для больших n. 3) Оценка параметров: точечная и интервальная - Точечная оценка: выборочная величина как оценка параметра. - Математическое ожидание μ: оценка x̄; дисперсия σ^2: оценка s^2= (1/(n−1))∑(x_i−x̄)^2. - Пусть θ — параметр; метод моментов и максимального правдоподобия (MLE) — базовые подходы. - Интервальная оценка (доверительные интервалы): - Среднее при известной σ: μ ∈ [ x̄ − z_{α/2} σ/√n, x̄ + z_{α/2} σ/√n ]. - Среднее при неизвестной σ: μ ∈ x̄ ± t_{n−1,α/2} s/√n. - Интервалы для пропорции p (биномиальное): Wald-интервал p̂ ± z_{α/2}√[p̂(1−p̂)/n] (часто требуется улучшение: Wilson, Agresti–Coull). - Интервалы для дисперсии σ^2 в нормальном: ( (n−1)s^2 / χ²_{1−α/2, n−1} , (n−1)s^2 / χ²_{α/2, n−1} ). - Оценки параметров: - МЛЕ для μ в нормальном: x̄; для σ^2: (1/n)∑(x_i−x̄)^2 (модель с максимальным правдоподобием, несмещённая оценка обычно s^2=(1/(n−1))∑(x_i−x̄)^2). 4) Проверка гипотез - Формулировки: H0: θ=θ0 против H1: θ≠θ0 (двусторонняя) или однонаправленная. - Статистика теста: - Z-тест: когда σ известно: Z = (x̄−θ0)/(σ/√n). - t-тест: когда σ неизвестно: T = (x̄−θ0)/(s/√n), распределение t_{n−1}. - Хи-квадрат тест: для дисперсии или независимости в таблицах: χ² = ∑ (O−E)²/E. - F-тест: сравнение дисперсий двух нормальных выборок. - P-значение и порог α. Ошибки I рода (α) и II рода (β). - Пример: тест на среднее при неизвестной дисперсии и равных условиях. 5) Регрессия и корреляция - Линейная регрессия Y = β0 + β1 X + ε, ε∼N(0, σ²). - Оценки: β1_hat = cov(X,Y)/var(X); β0_hat = ȳ − β1_hat x̄. - Доверительные интервалы для β1 и β0; R² — доля объяснённой дисперсии. - Предсказания и их доверительные интервалы. - Корреляция: - Пирсона r = cov(X,Y)/(s_X s_Y), ∈ [−1,1], тест на нулевую корреляцию. - Спирмен ранговая корреляция. 6) Непараметрические методы - Для сравнения двух независимых выборок: Манна–Уитни (U), тест Уилкоксона ранговый. - Критерий Краскела–Уоллиса для сравнения более чем двух групп. - Часто применяются, если распределения не нормальны или выборки малы. 7) Практические приемы и типичные ошибки - Не использовать нормальное приближение для малых n без проверки условий. - Игнорировать зависимость наблюдений. - Различать выборочную дисперсию s² и несмещённую оценку (n−1 в знаменателе). - Корректность интервалов для интервальных оценок пропорций (Wald может быть не надёжен при малых p или n). - Учитывать множественные сравнения при тестировании нескольких гипотез. 8) Примерные задачи (кратко) - Задача 1: Биномиальное. n=20, p=0.3. Найти P(X≥5). Подсчет: P(X≥5)=1−P(X≤4)=1−∑_{k=0}^4 C(20,k) 0.3^k 0.7^{20−k}. - Задача 2: Нормальное. X∼N(μ, σ²), известен σ. 95% CI для μ на основе n наблюдений: x̄ ± z_{0.975} σ/√n. - Задача 3: t-тест. Независимые выборки, неизвестная дисперсия, проверить разницу средних μ1−μ2=0. Статистика: t = (x̄1−x̄2)/√(s_p^2(1/n1+1/n2)), где s_p^2 — объединённая дисперсия. - Задача 4: Хи-квадрат тест на независимость 2×2 таблицы. χ² = ∑ (O−E)²/E; сравнить с χ²_{critical, df=(r−1)(c−1)}. - Задача 5: Регрессия. Данные пары (X_i, Y_i). Найти β0̂, β1̂, R², доверительные интервалы для β1. Если хотите, могу сделать под ваши курсы: привести конкретный конспект под ваш вуз/кафедру, адаптировать формулы к темам лекций, подобрать конкретные примеры и типовые задачи из вашего семестра. Можете сообщить уровень курса (бакалавриат/магистратура), язык преподавания и какие распределения чаще встречаются в вашем экзаменационном билете.

Конспект по вероятности и статистике

Ответ нейросети

Задай свой вопрос

Похожие вопросы 15