Потоковая аналитика (Streaming analytics)

Разделы: Бизнес-задачи

Потоковая аналитика представляет собой направление в бизнес-аналитике, в рамках которого данные собираются и обрабатываются в реальном времени по мере их формирования. В этом заключается ее отличие от пакетной аналитики, где информация сначала консолидируются и накапливаются в хранилище, а затем анализируются по мере необходимости. Таким образом, в пакетной аналитике обработка данных может существенно запаздывать относительно бизнес-событий, которые их создали.

Целью потоковой аналитики является обеспечение анализа данных, когда они еще «в движении», т.е. в процессе их формирования, обновления и консолидации. Следовательно, зависимости и закономерности, несущие полезные знания о бизнес-процессах, можно обнаруживать в режиме реального времени, что дает возможность оперативно реагировать на изменения ситуации и принимать упреждающие решения.

Например, финансовые учреждения могут обнаруживать мошеннические транзакции и реагировать на них немедленно (скажем, блокировать транзакцию по кредитной карте до завершения). Это делает потоковую аналитику особенно привлекательной в системах antifraud.

Розничные торговые сети могут отслеживать изменения товарных запасов в режиме реального времени и оптимизировать логистику, корректируя ее параметры по технологии «точно в срок». В промышленности потоковая аналитика используется для мониторинга производственных мощностей и выявления потенциальных проблем до того, как они приведут к сбоям.

Организация рабочих процессов потоковой аналитики, как правило, сложнее и дороже, чем традиционной пакетной. Поэтому для ее реализации целесообразно использовать специальную инфраструктуру, в основе которой лежит платформа потоковой обработки, осуществляющая централизованное подключение источников данных и их анализа, в процессе перемещения к местам долговременного хранения.

В таблице представлено сравнение потоковой и пакетной аналитики и рекомендации по их использованию.

Особенность Потоковая аналитика Пакетная аналитика
Время анализа данных По мере формирования После сохранения в хранилище данных
Использование В приложениях реального времени Отложенное
Преимущества Быстрое реагирование на события Возможность анализа больших объемов данных
Недостатки Сложность реализации Медленная работа для приложений реального времени
Время реакции В реальном времени Отложенная
Принятие решений Упреждающее С задержкой
Стоимость хранения данных Низкая Высокая
Обработка данных В реальном времени По запросу

Потоковую аналитику рекомендуется использовать, прежде всего, в ситуациях, когда время для принятия решений ограничено (требуется опережение), а так же в системах, где этот процесс автоматизируется (например, в скоринговых системах).

Предпочтение пакетной аналитике следует отдать в том случае, когда время принятия решений не критично, также если требуется более глубокая аналитика с привлечением ранее накопленных данных, а не только тех, которые находятся «в движении».

Таким образом, несмотря на то, что система потоковой аналитики дороже и сложнее традиционной пакетной, ее применение в отраслях бизнеса, где высоки риски, оказывается оправданным, так как она обеспечивает возможность выявления проблем на ранней стадии и реагирования на них, прежде чем они приведут к значимым потерям.