Потоковая аналитика (Streaming analytics) Скачать в PDF
Разделы: Бизнес-задачи
Потоковая аналитика представляет собой направление в бизнес-аналитике, в рамках которого данные собираются и обрабатываются в реальном времени по мере их формирования. В этом заключается ее отличие от пакетной аналитики, где информация сначала консолидируются и накапливаются в хранилище, а затем анализируются по мере необходимости. Таким образом, в пакетной аналитике обработка данных может существенно запаздывать относительно бизнес-событий, которые их создали.
Целью потоковой аналитики является обеспечение анализа данных, когда они еще «в движении», т.е. в процессе их формирования, обновления и консолидации. Следовательно, зависимости и закономерности, несущие полезные знания о бизнес-процессах, можно обнаруживать в режиме реального времени, что дает возможность оперативно реагировать на изменения ситуации и принимать упреждающие решения.
Например, финансовые учреждения могут обнаруживать мошеннические транзакции и реагировать на них немедленно (скажем, блокировать транзакцию по кредитной карте до завершения). Это делает потоковую аналитику особенно привлекательной в системах antifraud.
Розничные торговые сети могут отслеживать изменения товарных запасов в режиме реального времени и оптимизировать логистику, корректируя ее параметры по технологии «точно в срок». В промышленности потоковая аналитика используется для мониторинга производственных мощностей и выявления потенциальных проблем до того, как они приведут к сбоям.
Организация рабочих процессов потоковой аналитики, как правило, сложнее и дороже, чем традиционной пакетной. Поэтому для ее реализации целесообразно использовать специальную инфраструктуру, в основе которой лежит платформа потоковой обработки, осуществляющая централизованное подключение источников данных и их анализа, в процессе перемещения к местам долговременного хранения.
В таблице представлено сравнение потоковой и пакетной аналитики и рекомендации по их использованию.
Особенность | Потоковая аналитика | Пакетная аналитика |
---|---|---|
Время анализа данных | По мере формирования | После сохранения в хранилище данных |
Использование | В приложениях реального времени | Отложенное |
Преимущества | Быстрое реагирование на события | Возможность анализа больших объемов данных |
Недостатки | Сложность реализации | Медленная работа для приложений реального времени |
Время реакции | В реальном времени | Отложенная |
Принятие решений | Упреждающее | С задержкой |
Стоимость хранения данных | Низкая | Высокая |
Обработка данных | В реальном времени | По запросу |
Потоковую аналитику рекомендуется использовать, прежде всего, в ситуациях, когда время для принятия решений ограничено (требуется опережение), а так же в системах, где этот процесс автоматизируется (например, в скоринговых системах).
Предпочтение пакетной аналитике следует отдать в том случае, когда время принятия решений не критично, также если требуется более глубокая аналитика с привлечением ранее накопленных данных, а не только тех, которые находятся «в движении».
Таким образом, несмотря на то, что система потоковой аналитики дороже и сложнее традиционной пакетной, ее применение в отраслях бизнеса, где высоки риски, оказывается оправданным, так как она обеспечивает возможность выявления проблем на ранней стадии и реагирования на них, прежде чем они приведут к значимым потерям.