Значимость регрессионной модели (Significance of regression model) Скачать в PDF
Значимостью регрессионной модели называют степень статистической связи между ее входной и выходной переменными. Если такая связь полностью отсутствует, то поведение входной переменной никак не «объясняет» поведение выходной, и модель оказывается бесполезной.
Для простой линейной регрессии это означает, что в уравнении коэффициент и линия регрессии будет параллельна оси .
Такая модель для любых значений входной переменной всегда будет выдавать одну и ту же оценку выходной переменной , равную ее среднему значению, вычисленную по всем наблюдениям. Очевидно, что такая модель будет, скорее всего, бесполезной. С таким же успехом для оценки выходной переменной можно использовать ее среднее значение.
Если коэффициент отличен от 0, то линия регрессии имеет наклон, что указывает на зависимость выходной переменной от входной, а сама линия аппроксимирует эту зависимость. В этом случае модель будет иметь некоторую значимость. C целью оценки ее уровня для регрессионной модели используются коэффициент детерминации и коэффициент корреляции.
На практике значимость регрессионной модели определяется значимостью ее коэффициентов, т.е. требуется провести тестирование с целью выяснить, значимо ли ее коэффициент отличается от нуля для конкретного набора данных.
Для этого используются специальные статистические таблицы, в которых для заданного числа наблюдений выборки и числа параметров модели , а точнее числа степеней свободы , определяется критическое значение статистики и сравнивается с уровнем значимости (например, 5%).
Если критическое значение меньше уровня значимости, то нулевую гипотезу о незначимости коэффициента регрессии следует отвергнуть и принять альтернативную, т.е. коэффициент значим.