Уровень значимости (Significance level)

Синонимы: Уровень достоверности

Разделы: Метрики

В математической статистике уровень значимости — это величина, используемая для оценки истинности некоторого результата или гипотезы. Например, при проверке статистической гипотезы уровень значимости определяется как вероятность отклонить нулевую гипотезу, если на самом деле она истинна (ошибка первого рода).

Уровень значимости применяется совместно с p-значением. Если p-значение меньше уровня значимости, то нулевая гипотеза отвергается. Чем меньше p-значение, тем более весомой называется тестовая статистика, и тем больше оснований отклонять нулевую гипотезу.

Уровень значимости обычно обозначается греческой буквой «альфа». Популярными уровнями значимости являются 5%, 1% и 0.1%. Если в результате теста было получено p-значение меньше уровня значимости, то нулевая гипотеза отклоняется, а соответствующие результаты признаются статистически значимыми. Например, если утверждается, что «шанс того, что случившееся является совпадением, равны одному из тысячи», то имеется в виду уровень значимости 0.1%.

Выбор уровня значимости при проверке статистических гипотез противоречив. С одной стороны, большой уровень значимости дает большую уверенность в истинности альтернативной гипотезы. Но при этом возрастает риск не отвергнуть ложную нулевую гипотезу (ошибка второго рода).

Таким образом, выбор уровня значимости требует компромисса между значимостью и риском ошибки и, следовательно, между вероятностями ошибок первого и второго рода.

В любом выборочном статистическом исследовании всегда существует вероятность того, что полученные в нём результаты обусловлены только ошибками выборки. Но если p-значение, рассчитанное по выборке меньше уровня значимости, можно сделать вывод, что выборка отражает свойства всей совокупности, тем самым отвергая нулевую гипотезу.

Этот метод проверки статистической значимости результатов был разработан в начале 20-го века Рональдом Фишером.