Искусственный интеллект для ИТ-операций (Artificial Intelligence for IT Operations) Скачать в PDF

Синонимы: AIOps

Разделы: Бизнес-задачи

Концепция использования возможностей искусственного интеллекта (ИИ) и машинного обучения (ML) с целью повышения оперативности и точности обнаружения проблем в IT-структурах компании, уменьшения нагрузки на IТ-специалистов и ускорения процессов принятия решений. Она позволяет разрабатывать платформы для автоматизации, мониторинга, обнаружения проблемных ситуаций, диагностики и принятия решений с целью оптимизации и улучшения управления ИТ-инфраструктурой.

Впервые термин был введен компанией Gartner в 2016 году для описания концепции применения ИИ и ML с целью повышения эффективности ИТ-структур при решении проблемы растущих объемов данных и сложности методов их обработки.

Платформы AIOps используют ML, обработку естественного языка и аналитику данных не только для выявления проблем, но и для реакции на них в реальном масштабе времени. Они осуществляют непрерывный мониторинг и сбор данных о работе и состоянии компонентов IT-инфраструктуры, и применяя к ним технологии ИИ, позволяют обеспечить проактивный мониторинг, предсказывать значения различных показателей и выявлять зависимости для предотвращения сбоев, автоматически рассылать оповещения персоналу и многое другое.

Инструменты AIOps часто разделяют на:

  • доменозависимые — решают задачи в рамках узкой проблемной области, например, осуществляют только мониторинг сети или приложений, а также рассылку сообщений;
  • доменонезависмые — имеют более широкий функционал, распространяющийся на несколько проблемных областей: не только на мониторинг и регистрацию, но и на работу в облаке, различных объектах IT-инфраструктуры, а также могут строить модели на основе данных и применять их к различным проблемным ситуациям.

Рабочий процесс AIOps содержит следующие этапы:

  • Сбор и интегрирование данных от различных компонентов IT-инфраструктуры компании, которые включают журналы событий, метрики производительности, пользовательские отчеты и т.д. Эти данные поступают в реальном времени и накапливаются для формирования истории, что позволяет анализировать не только текущее состояние системы, но и выявлять долгосрочные тренды.
  • Очистка и нормализация данных позволяет подготовить данные к применению ML-моделей.
  • Анализ данных заключается в использовании технологий машинного обучения для обнаружения аномалий, корреляции событий (обнаружение связей между ними) и прогнозирования проблем, таких как возможные сбои оборудования, угрозы безопасности данных, перегрузки системы и т.д. Применение ИИ позволяет AIOps выявлять глубинные взаимосвязи между событиями, которые не всегда очевидны для IT-специалистов.
  • Автоматическая реакция на события позволяет не только оперативно передавать IT-командам точную информацию о причинах и последствиях проблем, но и вырабатывать оптимальную схему действий для устранения проблемы или минимизации последствий, а затем автоматически запускать соответствующие процессы.

Одной из целей внедрения AIOps в компаниях является переход от реактивного управления IT-инфраструктурой, когда реакция на проблемы происходит после их возникновения и обнаружения, к проактивному, при котором потенциальные проблемы обнаруживаются и устраняются до того, как они начинают оказывать негативное влияние на бизнес-процессы компании. Это и становится возможным благодаря использованию предсказательных ML-моделей.

Сервисы AIOps предоставляют организациям мощные инструменты для решения ключевых задач в управлении IT-инфраструктурой. В частности, за счет автоматизации рутинных процессов ее эксплуатации снижается нагрузка на персонал: вместо того чтобы тратить время на повторяющиеся операции, специалисты могут сосредоточиться на стратегически важных направлениях, таких как улучшение пользовательского опыта, разработка инновационных решений и модернизация IT-инфраструктуры компании.

Новости, материалы по аналитике, кейсы применения, активное сообщество