Кластерный анализ (Cluster analysis)

Разделы: Бизнес-задачи, Алгоритмы

Loginom: Кластеризация (обработчик), EM Кластеризация (обработчик)

Кластерный анализ — технология многомерного анализа данных, в основе которой лежит кластеризация данных.

Кластерный анализ

Основными этапами кластерного анализа являются:

  1. Построение кластерной модели на обучающем множестве, формирование структуры кластеров.
  2. Проверка состоятельности модели — оценка качества кластеризации.
  3. Содержательная интерпретация кластеров.
  4. Практическое использование построенной модели.

Преимуществами кластерного анализа являются:

  • отсутствие необходимости предварительного определения целевых значений (как при классификации), что позволяет использовать технологию обучения без учителя;
  • поиск новизны — кластерная структура более естественно, чем классы, описывает данные, поэтому позволяет обнаружить группы особенных объектов;
  • для кластеризации разработано достаточно много удобных и многомерных средств визуализации.

Главной проблемой кластерного анализа является неоднозначность постановки задачи — лучшее число кластеров, которое наиболее полно описывает данные, заранее неизвестно.

Кластерный анализ широко используется для обработки данных, полученных в результате проведения маркетинговых компаний, для сегментации рынка, выявления отношений между группами потребителей и т.д.