Хи-квадрат критерий (Chi-square test) Скачать в PDF
Синонимы: Критерий согласия Пирсона
Разделы: Метрики
Loginom: Отчет по регрессии
Критерий согласия для проверки гипотезы о законе распределения исследуемой случайной величины. Во многих практических задачах точный закон распределения неизвестен. Поэтому выдвигается гипотеза о соответствии имеющегося эмпирического закона, построенного по наблюдениям, некоторому теоретическому. Данная гипотеза требует статистической проверки, по результатам которой будет либо подтверждена, либо опровергнута.
Пусть — исследуемая случайная величина. Требуется проверить гипотезу о том, что данная случайная величина подчиняется закону распределения . Для этого необходимо произвести выборку из независимых наблюдений над случайной величиной : , и по ней построить эмпирический закон распределения случайной величины .
Гипотеза : порождается функцией .
Разделим на непересекающихся интервалов .
Пусть — количество наблюдений в j-м интервале;
— вероятность попадания наблюдения в j-й интервал при выполнении гипотезы ;
— ожидаемое число попаданий в j-й интервал;
тогда распределение Хи-квадрат с числом степеней свободы будет иметь следующую статистику:
В зависимости от значения критерия гипотеза может приниматься либо отвергаться:
- — гипотеза выполняется.
- — попадает в левый «хвост» распределения. Следовательно, теоретические и практические значения очень близки. Если, к примеру, происходит проверка генератора случайных чисел, который сгенерировал чисел из отрезка [0,1] и выборка распределена равномерно на [0,1], то генератор нельзя называть случайным (гипотеза случайности не выполняется), т.к. выборка распределена слишком равномерно, но гипотеза выполняется.
- — попадает в правый «хвост» распределения, гипотеза отвергается.