Название/Синоним Описание
А/Б-тестирование (A/B testing) Bucket tests, Split-run testing, Раздельное тестирование Проверка значимости различия двух реализаций случайной переменной. Часто применяется в маркетинге для оценки влияния какого-либо признака на результат — скажем, разных вариантов дизайна сайта на конверсию клиентов.
Автозаказ (Auto Order) Автоматический заказ Комплекс процессов автоматического управления запасами и заказами, а также реализующая их электронная система. В основном применятся в розничной торговле и дистрибуции.
Автокорреляционная функция (Autocorrelation function) АКФ, ACF Автокорреляционная функция показывает степень линейной статистической связи между значениями временного ряда. Представляет собой последовательность коэффициентов корреляции между исходным рядом, и его копией, сдвинутой на заданное число интервалов ряда. Позволяет обнаруживать во временных рядах тенденции и циклические компоненты,
Автокорреляция (Autocorrelation) Мера статистической связи между функцией и ее копией, сдвинутой на некоторый интервал, называемый лагом. В анализе данных автокорреляция широко используется для анализа и моделирования временных рядов.
Автоматизация (Automation) Технология построения производственных, бизнес- и других процессов с минимальным вмешательством человека или вообще без него. Одно из важнейших направлений — автоматизация процессов сбора и анализа данных для поддержки принятия управленческих решений.
Авторегрессионная модель (Autoregressive model) Авторегрессивная модель Модель временного ряда, в которой его текущее значение линейно зависит от предыдущих (ретроспективных) значений. Основное назначение — прогнозирование, выявление тенденций и других особенностей.
Агрегатный взрыв (Aggregate explosion) Многократное возрастание объема данных в хранилище или базе данных за счет хранения вместе с детализированными данными различных агрегированных значений. Риску агрегатного взрыва больше подвержены многомерные хранилища.
Агрегирование (Aggregation) Обобщение, укрупнение, объединение Приведение детализированных данных к некоторому обобщенному представлению. Заключается в вычислении агрегатов — значений, получаемых преобразованием исходного набора данных, например, суммы, среднего, медианы, максимального или минимального значений.
Адаптивная модель прогнозирования (Adaptive model of forecasting) Адаптивное прогнозирование Самонастраивающаяся рекуррентная модель, способная давать достаточно точные оценки будущих значений временного ряда даже в условиях его высокой изменчивости. Актуальна для динамичных бизнес-процессов, фондовых и товарно-сырьевых рынков.
Активационная функция нейрона (Activation function) Функция активации нейрона, Передаточная функция нейрона В теории нейронных сетей — функция, где аргумент — взвешенная сумма входов, а значение — выход нейрона. От вида и формы активационной функции зависит выбор алгоритма обучения сети.
Активный прогноз (Conditional prediction) Условный прогноз Прогноз, при построении которого предполагается, что лицо, принимающее решение, может осуществлять воздействие на исследуемые показатели. Применение активных прогнозов позволяет повышать эффективность принятия решений.
Алгоритм Apriori (Apriori algorithm) Алгоритм поиска ассоциативных правил, которые генерируются на основе всех обнаруженных частых предметных наборов и удовлетворяют заданному уровню поддержки и достоверности. Позволяет сократить пространства поиска благодаря свойству антимонотонности множеств.
Алгоритм AQ (AQ algorithm) Разновидность алгоритмов покрытия. Формирует классификатор, состоящий из набора правил вида «если, то». В машинном обучении строится на основе обучения с учителем.
Алгоритм C4.5 (Algorithm C4.5) Улучшенная модификация алгоритма ID3 для построения деревьев решений. Использует критерий информационной энтропии, или прироста информации. Способен работать с непрерывными и дискретными атрибутами и обучаться на данных, содержащих пропуски.
Алгоритм CART (CART algorithm) Classification and Regression Tree Популярный алгоритм построения деревьев решений. Может работать с дискретной и непрерывной выходной переменной, т.е. решать задачи и классификации, и регрессии. Выбирает такое разбиение из всех возможных, чтобы дочерние узлы были максимально однородными.
Алгоритм ID3 (ID3 algorithm) Iterative Dichotomizer-3 Наиболее популярный алгоритм обучения деревьев решений. Основан на рекурсивном разбиении обучающего множества на подмножества с помощью решающих правил. Целью является получение компактного, простого, но достаточно точного дерева.
Алгоритм обратного распространения ошибки (Back propagation algorithm) Алгоритм BackProp, Алгоритм Back Propagation, BackProp Один из наиболее известных алгоритмов машинного обучения и обучения нейронных сетей. Использует выходную ошибку нейронной сети для вычисления величин коррекции весов нейронов в ее скрытых слоях.
Алгоритм последовательного покрытия (Sequential covering algorithm) Алгоритм, генерирующий набор классифицирующих правил, которые последовательно разделяют обучающее множество на подмножества до тех пор, пока в каждом из них не останутся объекты только одного класса.
Анализ ABC (ABC-analysis) ABC-анализ Метод разделения ресурсов (товаров, клиентов, партнеров) на три категории — самые ценные (А), промежуточные (В) и наименее ценные (С). В основе лежит принцип Парето — 20% ресурсов дают 80% результата.
Анализ RFM (RFM-analysis) RFM-анализ Анализ клиентов компании с целью их сегментации по ценности для бизнеса. Широко используется в маркетинге, директ-маркетинге и, особенно, в розничной торговле и сфере услуг.
Анализ XYZ (XYZ analysis) XYZ-анализ Метод классификации ресурсов компании в зависимости от стабильности потребления и точности его прогнозирования, устойчивости спроса, подверженности спроса сезонным колебаниям или случайного характера спроса.
Анализ ассортимента (Assortment analysis) Процесс изучения состава и структуры ассортимента товаров и услуг компании с целью оценки его соответствия текущим и перспективным условиям рынка для формирование обоснованных выводов о том, какие продукты и услуги компании приносят наибольшую прибыль, а от каких следует отказаться. По результатам анализа проводится оптимизация ассортимента.
Анализ клиентской базы (Customer Database Analysis) Customer Data Analysis, Анализ данных о клиентах Процесс сбора и анализа данных о клиентах компании с целью изучения их потребительского поведения и предпочтений с целью выработки стратегических и тактических решений в бизнесе.
Анализ конкурентов (Competitor analysis) Технология всесторонней оценки сильных и слабых сторон действующих и потенциальных конкурентов. В основе технологии лежит профилирование конкурентов и различные методы анализа данных.
Анализ отклонений (Deviation detection) Определение выбросов Поиск в данных редких, нетипичных объектов или наблюдений, которые не соответствуют логике поведения анализируемого бизнес-процесса или модели описывающих его данных, и генерация правил, объясняющих причины их появления.
Анализ рисков (Risk Analisys) В бизнес-аналитике — комплекс методов для выявления и оценки факторов, которые могут поставить под угрозу достижение бизнес-целей. Технологии анализа данных предоставляют мощные средства анализа рисков.
Анализ рыночной корзины (Market Basket Analysis) Ассоциативные правила Задача выявления устойчивых наборов товаров, приобретаемых клиентами в супермаркете по одному чеку. В Data Mining в широком смысле — поиск устойчивых групп событий, происходящих совместно, в некоторой предметной области.
Анализ с помощью характеристической кривой (ROC-analisys) ROC-анализ Графический метод оценки качества работы бинарного классификатора и выбора дискриминационного порога для разделения классов. Отражает связь между вероятностью ложной тревоги и вероятностью правильного обнаружения.
Аналитическая платформа (Analytical platform) Аналитическая система Специализированное программное обеспечение для извлечения скрытых зависимостей и закономерностей из больших массивов данных. Позволяет создавать законченные аналитические решения — от извлечения данных до формирования отчетности.
Аналитический CRM (Analytical CRM) Направление в области управления взаимоотношениями с клиентами, характеризуемое систематическим анализом данных о клиентах и совершаемых ими транзакциях. Активно использует технологии анализа данных.
Аналитический модуль (Analytical module) Компонент информационной системы, который решает задачи анализа данных. При этом сама система предназначена для решения иных задач — например, управления запасами, цепочками поставок или отношениями с клиентами.
Андеррайтинг (Underwriting) В кредитования — процесс проверки платежеспособности клиента, обратившегося за кредитом. Одной из распространённых технологий такого анализа является аппликационный скоринг.
Аномальное значение (Outlier value) Выброс, Аномалия Значения, которые не укладываются в общую модель поведения анализируемого процесса. Могут быть вызваны ошибками измерений, некорректным вводом данных или результатом их сильной изменчивости.
Ансамбль моделей (Ensemble of models) Комитет моделей, Ensemble learning В статистике и машинном обучении — комбинация нескольких алгоритмов обучения, которые, работая вместе, позволяют построить более эффективную и точную модель, чем любая из моделей, построенная с помощью отдельного алгоритма.
Антифрод (Antifraud) Система борьбы с мошенничествами, Fraud Management System Система борьбы с мошенничествами. Интегрируется в информационную систему компании для сбора и анализа данных. В функцию может входить автоматическое принятие мер против мошенничества — блокировка банковского счета, отключение абонента и т.п.
Апостериорная вероятность (Posterior probability) Послеопытная вероятность, Условная вероятность Вероятность события A при условии, что произошло событие B. Принцип максимума апостериорной вероятности лежит в основе работы простого байесовского классификатора.
Аппликационный скоринг (Application scoring) Оценка платежеспособности заемщика с целью минимизации рисков кредитной организации. Метод основан на вычислении скорингового балла, исходя из анкетных данных заемщика, и сравнении его с пороговым значением.
Аппроксимация (Approximation) Математический метод, который сводит задачу исследования характеристик объекта к изучению более простых или более удобных объектов. Например, неизвестная функция, описывающая реальные наблюдения, заменяется известным уравнением.
Априорная вероятность (Prior probability) Безусловная вероятность В теории вероятностей — степень уверенности в том, что событие произошло, в отсутствие любой другой информации, связанной с этим событием. Необходима для вычисления апостериорных вероятностей.
Артефакт (Artifact) Явление, процесс, предмет или свойство, возникновение которого в наблюдаемых условиях невозможно или маловероятно. Служит признаком целенаправленного вмешательства в процесс или наличия неучтенных факторов.
Ассортиментная матрица (Assortment matrix) Сформированный и утверждённый перечень ассортиментных позиций или SKU, которые будут предлагаться клиентам в конкретной точке продаж.
Ассоциативное правило (Association Rule) Зависимость, характеризующая вероятность наступления одного события вместе с другим — например, совместного выбора товаров покупателем. Широко используется в маркетинге, мерчендайзинге, прогнозировании аварийных ситуаций.
Атомарные данные (Atomic data) Атомарный атрибут Атрибут, который хранит неделимое значение и не является ни списком, ни множеством. Понимание, какие атрибуты являются атомарными, важно при организации баз и хранилищ данных.
Атрибут (Attribute) Признак, Показатель, Фактор Признак, характеризующий определенное свойство исследуемого объекта или процесса. При построении аналитических моделей атрибуты используются в качестве зависимых (выходных) или независимых (входных) переменных.