А/Б-тестирование (A/B testing) Bucket tests, Split-run testing, Раздельное тестирование |
Проверка значимости различия двух реализаций случайной переменной. Часто применяется в маркетинге для оценки влияния какого-либо признака на результат — скажем, разных вариантов дизайна сайта на конверсию клиентов. |
Автозаказ (Auto Order) Автоматический заказ |
Комплекс процессов автоматического управления запасами и заказами, а также реализующая их электронная система. В основном применятся в розничной торговле и дистрибуции. |
Автокорреляционная функция (Autocorrelation function) АКФ, ACF |
Автокорреляционная функция показывает степень линейной статистической связи между значениями временного ряда. Представляет собой последовательность коэффициентов корреляции между исходным рядом, и его копией, сдвинутой на заданное число интервалов ряда. Позволяет обнаруживать во временных рядах тенденции и циклические компоненты, |
Автокорреляция (Autocorrelation) |
Мера статистической связи между функцией и ее копией, сдвинутой на некоторый интервал, называемый лагом. В анализе данных автокорреляция широко используется для анализа и моделирования временных рядов. |
Автоматизация (Automation) |
Технология построения производственных, бизнес- и других процессов с минимальным вмешательством человека или вообще без него. Одно из важнейших направлений — автоматизация процессов сбора и анализа данных для поддержки принятия управленческих решений. |
Авторегрессионная модель (Autoregressive model) Авторегрессивная модель |
Модель временного ряда, в которой его текущее значение линейно зависит от предыдущих (ретроспективных) значений. Основное назначение — прогнозирование, выявление тенденций и других особенностей. |
Агрегатный взрыв (Aggregate explosion) |
Многократное возрастание объема данных в хранилище или базе данных за счет хранения вместе с детализированными данными различных агрегированных значений. Риску агрегатного взрыва больше подвержены многомерные хранилища. |
Агрегирование (Aggregation) Обобщение, укрупнение, объединение |
Приведение детализированных данных к некоторому обобщенному представлению. Заключается в вычислении агрегатов — значений, получаемых преобразованием исходного набора данных, например, суммы, среднего, медианы, максимального или минимального значений. |
Адаптивная модель прогнозирования (Adaptive model of forecasting) Адаптивное прогнозирование |
Самонастраивающаяся рекуррентная модель, способная давать достаточно точные оценки будущих значений временного ряда даже в условиях его высокой изменчивости. Актуальна для динамичных бизнес-процессов, фондовых и товарно-сырьевых рынков. |
Активационная функция нейрона (Activation function) Функция активации нейрона, Передаточная функция нейрона |
В теории нейронных сетей — функция, где аргумент — взвешенная сумма входов, а значение — выход нейрона. От вида и формы активационной функции зависит выбор алгоритма обучения сети. |
Активный прогноз (Conditional prediction) Условный прогноз |
Прогноз, при построении которого предполагается, что лицо, принимающее решение, может осуществлять воздействие на исследуемые показатели. Применение активных прогнозов позволяет повышать эффективность принятия решений. |
Алгоритм Apriori (Apriori algorithm) |
Алгоритм поиска ассоциативных правил, которые генерируются на основе всех обнаруженных частых предметных наборов и удовлетворяют заданному уровню поддержки и достоверности. Позволяет сократить пространства поиска благодаря свойству антимонотонности множеств. |
Алгоритм AQ (AQ algorithm) |
Разновидность алгоритмов покрытия. Формирует классификатор, состоящий из набора правил вида «если, то». В машинном обучении строится на основе обучения с учителем. |
Алгоритм C4.5 (Algorithm C4.5) |
Улучшенная модификация алгоритма ID3 для построения деревьев решений. Использует критерий информационной энтропии, или прироста информации. Способен работать с непрерывными и дискретными атрибутами и обучаться на данных, содержащих пропуски. |
Алгоритм CART (CART algorithm) Classification and Regression Tree |
Популярный алгоритм построения деревьев решений. Может работать с дискретной и непрерывной выходной переменной, т.е. решать задачи и классификации, и регрессии. Выбирает такое разбиение из всех возможных, чтобы дочерние узлы были максимально однородными. |
Алгоритм ID3 (ID3 algorithm) Iterative Dichotomizer-3 |
Наиболее популярный алгоритм обучения деревьев решений. Основан на рекурсивном разбиении обучающего множества на подмножества с помощью решающих правил. Целью является получение компактного, простого, но достаточно точного дерева. |
Алгоритм обратного распространения ошибки (Back propagation algorithm) Алгоритм BackProp, Алгоритм Back Propagation, BackProp |
Один из наиболее известных алгоритмов машинного обучения и обучения нейронных сетей. Использует выходную ошибку нейронной сети для вычисления величин коррекции весов нейронов в ее скрытых слоях. |
Алгоритм последовательного покрытия (Sequential covering algorithm) |
Алгоритм, генерирующий набор классифицирующих правил, которые последовательно разделяют обучающее множество на подмножества до тех пор, пока в каждом из них не останутся объекты только одного класса. |
Альтернативная гипотеза (Alternative hypothesis) |
Тип предположений в статистических тестах, используемых для получения выводов или суждений на основе данных. Является взаимоисключающей альтернативой нулевой гипотезе и содержит противоположное ей утверждение. |
Анализ ABC (ABC-analysis) ABC-анализ |
Метод разделения ресурсов (товаров, клиентов, партнеров) на три категории — самые ценные (А), промежуточные (В) и наименее ценные (С). В основе лежит принцип Парето — 20% ресурсов дают 80% результата. |
Анализ RFM (RFM-analysis) RFM-анализ |
Анализ клиентов компании с целью их сегментации по ценности для бизнеса. Широко используется в маркетинге, директ-маркетинге и, особенно, в розничной торговле и сфере услуг. |
Анализ XYZ (XYZ analysis) XYZ-анализ |
Метод классификации ресурсов компании в зависимости от стабильности потребления и точности его прогнозирования, устойчивости спроса, подверженности спроса сезонным колебаниям или случайного характера спроса. |
Анализ ассортимента (Assortment analysis) |
Процесс изучения состава и структуры ассортимента товаров и услуг компании с целью оценки его соответствия текущим и перспективным условиям рынка для формирование обоснованных выводов о том, какие продукты и услуги компании приносят наибольшую прибыль, а от каких следует отказаться. По результатам анализа проводится оптимизация ассортимента. |
Анализ клиентской базы (Customer Database Analysis) Customer Data Analysis, Анализ данных о клиентах |
Процесс сбора и анализа данных о клиентах компании с целью изучения их потребительского поведения и предпочтений с целью выработки стратегических и тактических решений в бизнесе. |
Анализ конкурентов (Competitor analysis) |
Технология всесторонней оценки сильных и слабых сторон действующих и потенциальных конкурентов. В основе технологии лежит профилирование конкурентов и различные методы анализа данных. |
Анализ отклонений (Deviation detection) Определение выбросов |
Поиск в данных редких, нетипичных объектов или наблюдений, которые не соответствуют логике поведения анализируемого бизнес-процесса или модели описывающих его данных, и генерация правил, объясняющих причины их появления. |
Анализ рисков (Risk Analisys) |
В бизнес-аналитике — комплекс методов для выявления и оценки факторов, которые могут поставить под угрозу достижение бизнес-целей. Технологии анализа данных предоставляют мощные средства анализа рисков. |
Анализ рыночной корзины (Market Basket Analysis) Ассоциативные правила |
Задача выявления устойчивых наборов товаров, приобретаемых клиентами в супермаркете по одному чеку. В Data Mining в широком смысле — поиск устойчивых групп событий, происходящих совместно, в некоторой предметной области. |
Анализ с помощью характеристической кривой (ROC-analisys) ROC-анализ |
Графический метод оценки качества работы бинарного классификатора и выбора дискриминационного порога для разделения классов. Отражает связь между вероятностью ложной тревоги и вероятностью правильного обнаружения. |
Аналитика реального времени (Real Time Analytics) RTA |
Направление в бизнес-аналитике, в котором новые данные, поступающие из различных источников, анализируются в режиме реального времени. Это позволяет оперативно отслеживать изменения и проблемы в бизнесе и своевременно принимать соответствующие решения. |
Аналитика самообслуживания (Self-service analytics) |
Направление в бизнес-аналитике, в рамках которого бизнес-пользователи могут получать доступ к данным и анализировать их без помощи ИТ-специалистов или профессиональных аналитиков данных. |
Аналитическая платформа (Analytical platform) Аналитическая система |
Специализированное программное обеспечение для извлечения скрытых зависимостей и закономерностей из больших массивов данных. Позволяет создавать законченные аналитические решения — от извлечения данных до формирования отчетности. |
Аналитический CRM (Analytical CRM) |
Направление в области управления взаимоотношениями с клиентами, характеризуемое систематическим анализом данных о клиентах и совершаемых ими транзакциях. Активно использует технологии анализа данных. |
Аналитический модуль (Analytical module) |
Компонент информационной системы, который решает задачи анализа данных. При этом сама система предназначена для решения иных задач — например, управления запасами, цепочками поставок или отношениями с клиентами. |
Андеррайтинг (Underwriting) |
В кредитования — процесс проверки платежеспособности клиента, обратившегося за кредитом. Одной из распространенных технологий такого анализа является аппликационный скоринг. |
Ансамбль моделей (Ensemble of models) Комитет моделей, Ensemble learning |
В статистике и машинном обучении — комбинация нескольких алгоритмов обучения, которые, работая вместе, позволяют построить более эффективную и точную модель, чем любая из моделей, построенная с помощью отдельного алгоритма. |
Антифрод (Antifraud) Система борьбы с мошенничествами, Fraud Management System |
Система борьбы с мошенничествами. Интегрируется в информационную систему компании для сбора и анализа данных. В функцию может входить автоматическое принятие мер против мошенничества — блокировка банковского счета, отключение абонента и т.п. |
Апостериорная вероятность (Posterior probability) Послеопытная вероятность, Условная вероятность |
Вероятность события A при условии, что произошло событие B. Принцип максимума апостериорной вероятности лежит в основе работы простого байесовского классификатора. |
Аппликационный скоринг (Application scoring) |
Оценка платежеспособности заемщика с целью минимизации рисков кредитной организации. Метод основан на вычислении скорингового балла, исходя из анкетных данных заемщика, и сравнении его с пороговым значением. |
Аппроксимация (Approximation) |
Математический метод, который сводит задачу исследования характеристик объекта к изучению более простых или более удобных объектов. Например, неизвестная функция, описывающая реальные наблюдения, заменяется известным уравнением. |
Априорная вероятность (Prior probability) Безусловная вероятность |
В теории вероятностей — степень уверенности в том, что событие произошло, в отсутствие любой другой информации, связанной с этим событием. Необходима для вычисления апостериорных вероятностей. |
Артефакт (Artifact) |
Явление, процесс, предмет или свойство, возникновение которого в наблюдаемых условиях невозможно или маловероятно. Служит признаком целенаправленного вмешательства в процесс или наличия неучтенных факторов. |
Ассортиментная матрица (Assortment matrix) |
Сформированный и утвержденный перечень ассортиментных позиций или SKU, которые будут предлагаться клиентам в конкретной точке продаж. |
Ассоциативное правило (Association Rule) |
Зависимость, характеризующая вероятность наступления одного события вместе с другим — например, совместного выбора товаров покупателем. Широко используется в маркетинге, мерчендайзинге, прогнозировании аварийных ситуаций. |
Атомарные данные (Atomic data) Атомарный атрибут |
Атрибут, который хранит неделимое значение и не является ни списком, ни множеством. Понимание, какие атрибуты являются атомарными, важно при организации баз и хранилищ данных. |
Атрибут (Attribute) Признак, Показатель, Фактор |
Признак, характеризующий определенное свойство исследуемого объекта или процесса. При построении аналитических моделей атрибуты используются в качестве зависимых (выходных) или независимых (входных) переменных. |