Тест отношения правдоподобия (Likelihood-ratio test) Скачать в PDF

Синонимы: Тест Уилкса, Wilks’s test, LR-test

Разделы: Метрики

Тест отношения правдоподобия — это статистическая процедура для оценивания степени соответствия данным двух статистических моделей, одна из которых строится на множестве всех доступных переменных выборки, а другая только на некотором их подмножестве.

Иными словами, цель применения теста заключается в том, чтобы подтвердить или опровергнуть гипотезу, что модель с меньшим числом переменных (короткая модель) не будет значимо отличаться по качеству от модели с большим числом переменных (длинной модели). При этом модели полагаются вложенными, т.е. короткую модель можно получить из длинной путем наложения ограничений на ее параметры.

Цель применения теста в предсказательном моделировании — снижение размерности пространства входных признаков. Действительно, чем больше переменных мы используем для построения модели, тем больше информации привлекается, и тем лучше модель, как ожидается, будет соответствовать данным. Однако на практике не все входные переменные являются одинаково информативными и значимо влияют на выходную переменную. Включение таких переменных в модель только усложняет ее, не улучшая существенно качество.

Таким образом, если удастся обнаружить малозначимые переменные и доказать,что модель без них будет работать не хуже (или незначительно хуже), чем с ними, то эти переменные можно исключить без значимого ущерба для точности модели, заместив длинную модель короткой. Для этого и служит тест отношения правдоподобия.

Статистика теста отношения правдоподобия вычисляется по формуле:

$λ_{L R} = - 2 ln (\frac{L (Θ_{0} | x)}{L (Θ | x)}),$

где $L (Θ | x)$ — это функции правдоподобия модели без ограничений на параметры (длинной модели), и $L (Θ_{0} | x)$ — функция правдоподобия для модели с ограничениями на параметры (короткой модели).

Поскольку все вероятности положительны и ограниченный максимум не может превышать неограниченный максимум, отношение правдоподобия изменяется между нулем и единицей.

Если короткая и длинная модель работают одинаково хорошо, то значения их функции правдоподобия близки, и $λ_{L R}$ стремится к 0. Если короткая модель работает хуже, чем длинная, т.е. ее функция правдоподобия уменьшается, то $λ_{L R}$ становится больше 0. Статистическую значимость данного увеличения и должен подтвердить или опровергнуть тест.

Для параметров $Θ_{0} = Θ \cap Θ_{0}$ выдвигается простая гипотеза $H_{0} : (φ (Θ ∖ Θ_{0}) = 0)$ . Если $H_{0}$ верно, то статистика теста отношения правдоподобия имеет (возможно, асимптотическое) распределение по закону $χ^{2} (q)$ , по которому можно оценить статистическую значимость модели. $Θ ∖ Θ_{0}$ — это разность множеств, $Θ \cap Θ_{0}$ — пересечение множеств параметров $Θ$ и $Θ_{0}$ , а $q$ — число ограничений на параметры (т.е. количество параметров, которое нужно исключить из длинной модели, чтобы получить короткую). Оно же равно числу степеней свободы распределения.

На практике чаще всего используется ограничение $Θ_{0} = {θ_{i_{1}} = 0, θ_{i_{2}} = 0, . . . θ_{i_{n - q}} = 0}$ для параметров $Θ = {θ_{1}, θ_{2}, . . . θ_{n}}$ .

Если значение статистики больше критического, которое определяется по таблицам критических значений распределения $χ^{2}$ для числа степеней свободы $q$ при заданном уровне значимости, то ограничения отвергаются, и предпочтение отдается длинной модели, а в противном случае — короткой.