Метод главных компонент (Principal component analysis)

Разделы: Алгоритмы

Loginom: Факторный анализ (обработчик)

Метод сокращения размерности пространства признаков с минимальной потерей полезной информации. Предложен K.Пирсоном в 1901 г., а затем детально разработан американским экономистом и статистиком Г.Хоттелингом.

В основе метода лежит переход к новой системе координат от исходной системы координат многомерного пространства признаков, которая является системой ортонормированных комбинаций:

,

где математическое ожидание значений признака . Линейные комбинации выбираются таким образом, чтобы первая главная компонента имела бы максимальную дисперсию.

Иными словами, новая ось будет ориентирована вдоль направления наибольшей вытянутости эллипсоида рассеяния точек объектов исследуемого множества данных в пространстве признаков.

Вторая главная компонента имеет наибольшую дисперсию среди всех оставшихся линейных преобразований, некоррелированных с первой главной компонентой. Она интерпретируется как направление наибольшей вытянутости эллипсоида рассеяния, перпендикулярное первой главной компоненте. Следующие главные компоненты определяются по аналогичной схеме.

В аналитических системах метод главных компонент широко используется для снижения размерности входных данных на этапе предобработки.

results matching ""

    No results matching ""