Таблица сопряженности (Contingency table) Скачать в PDF
Синонимы: Таблица контингентности, Факторная таблица
В статистике — метод представления многомерного частотного распределения двух признаков, предназначенный для исследования статистической связи между ними. Широко используется в областях, где требуется статистическая обработка результатов исследований и построение аналитических моделей, особенно в бизнес-аналитике. Впервые термин был введен Карлом Пирсоном в 1904 году.
Например, в представленной ниже таблице сопряженности показано распределение заемщиков, допустивших и не допустивших просрочку, по переменной «Пол».
Пол\Просрочка | Допущена | Не допущена | Всего |
---|---|---|---|
Мужской | 12 | 40 | 52 |
Женский | 4 | 44 | 48 |
Всего | 16 | 84 | 100 |
Таблицы сопряженности являются удобным средством изучения статистических зависимостей. Они часто используются для проверки гипотез о наличии связи между двумя признаками с использованием теста Фишера или критерия согласия Пирсона хи-квадрат.
По строкам таблицы сопряженности размещаются значения одного признака, а по столбцам — другого (если признаки числовые, то они должны быть предварительно преобразованы к интервальному представлению). На пересечении строки и столбца указывается частота совместного появления соответствующих значений признаков и .
Сумма частот по строке называется маргинальной частотой строки, а по столбцу — маргинальной частотой столбца. Сумма маргинальных частот равна размеру выборки , а их распределение представляет собой одномерное распределение переменной, образующей строки или столбцы таблицы.
В таблицах сопряженности могут быть представлены как абсолютные, так и относительные частоты (в долях или процентах). Относительные частоты могут рассчитываться по отношению:
- к маргинальной частоте по строке;
- к маргинальной частоте по столбцу;
- к объему выборки.