Основы статистики

Определения

  • Вероятность
  • Среднее
  • Медиана
  • Стандартное отклонение
  • Дисперсия
  • Функция распределения
  • Плотность распределения
  • Корреляция
  • P-value
  • Статистическая значимость

Характеристики случайных величин

Положение

Разброс

Характеристики положения

*Image credit: "Описательная статистика" by Статистика и Котики

Характеристики разброса

*Image credit: "Описательная статистика" by Статистика и Котики

Порядковые статистики

Положение (медиана)

1.4  3.2  4.6  6.5  9.3  12.2  15.5  15.8  21.4  22.4  54.2

медиана

5 значений

5 значений

1.4  3.2  4.6  6.5  9.3  12.2  12.7  15.5  15.8  21.4  22.4  54.2

медиана

5 значений

5 значений

\frac{12.2+12.7}{2}=12.45
12.2+12.72=12.45\frac{12.2+12.7}{2}=12.45

cреднее = 15.14

cреднее = 14.93

Порядковые статистики

Разброс (интерквартильный размах)

1.4  3.2  4.6  6.5  9.3  12.2  15.5  15.8  21.4  22.4  54.2

1-й квартиль

25% значений

25% значений

3-й квартиль

\frac{4.6+6.5}{2}=5.55
4.6+6.52=5.55\frac{4.6+6.5}{2}=5.55
\frac{15.8 + 21.4}{2}=18.6
15.8+21.42=18.6\frac{15.8 + 21.4}{2}=18.6

Порядковые статистики

Визуализация

Distribution 1: 1.4  3.2  4.6  6.5  9.3  12.2  15.5  15.8  21.4  22.4  54.2

Distribution 2: 1.3  1.5  1.6  3.5  4.4   9.6   10.9  13.9  16.4  16.7  18.5

Выброс

Медианы

Квартили

Места, где начинаются выбросы

Сравнение медианы и среднего

Взаимосвязь между наблюдениями

Корреляция Пирсона

Корреляция: 0.94

Корреляция -0.08

Проблемы корреляции Пирсона

Корреляция Спирмена

Корреляция 0.92

Корреляция 0.35

Вероятность

Вероятность непрерывных событий

Нормальное распределение

Вопросы?

Статистика в реальной жизни

Статистика в реальной жизни

Генеральная совокупность

Выборка

Наблюдение

Оценка средних

Мыши без лекарства

Среднее время жизни: 20 месяцев

Генеральная совокупность

Среднее время жизни: ???

Закон больших чисел

Наблюдаемое распределение сходится к реальному при увеличении размера выборки.

Оценка средних

Мыши без лекарства

Среднее время жизни: 20 месяцев

Генеральная совокупность

Среднее время жизни: ???

Центральная предельная теорема

S_n=\Sigma_{i=1}^nX_i
Sn=Σi=1nXiS_n=\Sigma_{i=1}^nX_i
X_i
XiX_i

        - независимые одинаково распределённые случайные величины, имеющие конечное среднее      и дисперсию       .

\mu
μ\mu
\sigma^2
σ2\sigma^2

Тогда

\frac{S_n-\mu n}{\alpha\sqrt{n}}\rightarrow N(0,1)
SnμnαnN(0,1)\frac{S_n-\mu n}{\alpha\sqrt{n}}\rightarrow N(0,1)

Пример

Рандомизация эксперимента

Оценка средних

Мыши с лекарством

Среднее время жизни: 22 месяца

Мыши без лекарства

Среднее время жизни: 20 месяцев

Распределение средних

* Image credit: "Основы статистики" by Анатолий Карпов

Проверка гипотез

Проверка гипотез

Введение в статистику

By Viktor Petukhov

Введение в статистику

  • 894