Кластерный анализ (Cluster analysis) Скачать в PDF
Разделы: Бизнес-задачи, Алгоритмы
Loginom: Кластеризация (обработчик), EM Кластеризация (обработчик)
Кластерный анализ — технология многомерного анализа данных, в основе которой лежит кластеризация данных.
Основными этапами кластерного анализа являются:
- Построение кластерной модели на обучающем множестве, формирование структуры кластеров.
- Проверка состоятельности модели — оценка качества кластеризации.
- Содержательная интерпретация кластеров.
- Практическое использование построенной модели.
Преимуществами кластерного анализа являются:
- отсутствие необходимости предварительного определения целевых значений (как при классификации), что позволяет использовать технологию обучения без учителя;
- поиск новизны — кластерная структура более естественно, чем классы, описывает данные, поэтому позволяет обнаружить группы особенных объектов;
- для кластеризации разработано достаточно много удобных и многомерных средств визуализации.
Главной проблемой кластерного анализа является неоднозначность постановки задачи — лучшее число кластеров, которое наиболее полно описывает данные, заранее неизвестно.
Кластерный анализ широко используется для обработки данных, полученных в результате проведения маркетинговых компаний, для сегментации рынка, выявления отношений между группами потребителей и т.д.