Критерий Фишера (F-test)

Синонимы: F-критерий

Разделы: Метрики

Критерий Фишера — статистический критерий для оценки значимости различия дисперсий двух случайных выборок. Для этого вычисляется F-статистика, равная , где — большая дисперсия, — меньшая дисперсия.

Статистика теста так или иначе сводится к отношению выборочных дисперсий (сумм квадратов, деленных на число степеней свободы). Чтобы статистика имела распределение Фишера, необходимо, чтобы числитель и знаменатель были независимыми случайными величинами и соответствующие суммы квадратов имели распределение Хи-квадрат. Для этого требуется, чтобы данные имели нормальное распределение. Кроме того, предполагается, что дисперсия случайных величин, квадраты которых суммируются, одинакова.

Если полученное значение F-статистики больше критического для определенного уровня значимости и соответствующих чисел степеней свободы для числителя и знаменателя, то дисперсии считаются значимо различающимися. В Data Mining применяется для оценки значимости регрессионных моделей.