Веб-майнинг (Web Mining)

Разделы: Бизнес-задачи

Разновидность Data Mining. Предназначен для автоматического обнаружения веб-документов и услуг, извлечения информации из веб-ресурсов и выявления общих закономерностей в интернете.

Системы Web Mining могут ответить на многие вопросы, например, кто из посетителей является потенциальным клиентом интернет-магазина, какая группа клиентов интернет-магазина приносит наибольший доход, каковы интересы определенного посетителя или группы посетителей.

Технология Web Mining охватывает методы, которые способны на основе данных сайта обнаружить новые, ранее неизвестные знания и которые в дальнейшем можно будет использовать на практике.

Другими словами, технология Web Mining применяет технологию Data Mining для анализа неструктурированной, неоднородной, распределенной и значительной по объему информации, содержащейся на Web-узлах.

В Web Mining можно выделить следующие этапы:

  • входной этап (input stage) – получение "сырых" данных из источников (логи серверов, тексты электронных документов);
  • этап предобработки (preprocessing stage) – данные представляются в форме, необходимой для успешного построения той или иной модели;
  • этап моделирования (pattern discovery stage);
  • этап анализа модели (pattern analysis stage) – интерпретация полученных результатов.

Конкретные процедуры каждого этапа зависят от поставленной задачи. В связи с этим выделяют различные категории Web Mining:

  • Анализ использования веб-ресурсов (Web Usage Mining).
  • Извлечение веб-структур (Web Structure Mining).
  • Извлечение веб-контента (Web Content Mining).

Общая взаимосвязь между категориями Web Mining и задачами Data Mining изображена на рисунке:

В бизнес-аналитике Web Mining решает следующие задачи:

  • описание посетителей сайта (кластеризация, классификация);
  • описание посетителей, которые совершают покупки в интернет-магазине (кластеризация, классификация);
  • определение типичных сессий и навигационных путей пользователей сайта (поиск популярных наборов, ассоциативных правил);
  • определение групп или сегментов посетителей (кластеризация);
  • нахождение зависимостей при пользовании услугами сайта (поиск ассоциативных правил).

results matching ""

    No results matching ""