Гомоскедастичность (Homoscedastic regression)

Гомоскедастичностью называют свойство данных, используемых для построения модели линейной регрессии, которое заключается в том, что их дисперсия вдоль прямой регрессии является постоянной. Гомоскедастичность — одно из условий эффективности регрессионной модели.

В статистике последовательность или вектор случайных величин являются гомоскедастичными, если все случайные величины в последовательности или векторе имеют одинаковую дисперсию.

Гомоскедастичность

Если предположение о гомоскедастичности нарушается, т.е. имеет место гетероскедастичность, это может затруднить интерпретацию результатов регрессии, поскольку в этом случае значение выходной переменной зависит не только от величины изменения входной, но и от того, относительно какой величины это изменение происходит.

Например, если использовать при построении регрессионной модели данные о доходе клиентов, то попытка применить одну модель для богатых и бедных может вызвать проблемы. Действительно, если изменение суммы дохода на 1 000 руб. окажется значимым для клиента с доходом 10 000 руб., то для клиента с доходом 1 000 000 руб. это не так. А регрессионная модель, тем не менее, применяет к ним одну и ту же закономерность. Чтобы этого не произошло, клиентов с низкими и высокими доходами следует разбить на две выборки и таким образом обеспечить гомоскедастичность.