Название/Синоним Описание
F-test (Критерий Фишера) F-критерий Статистический критерий для оценки значимости различия дисперсий двух случайных выборок. В Data Mining применяется для оценки значимости регрессионных моделей.
Fact (Факт) Мера, Показатель, Measure В многомерном моделировании данных — показатель, количественно описывающий исследуемый процесс или объект — например, цена, количество, сумма, остаток на складе и т.д. Факты являются основой для построения многомерных OLAP-кубов.
Factor (Фактор) Источник воздействия, приводящего к изменению значений переменных модели некоторой системы. В факторном анализе — линейная суперпозиция переменных, которые сильно коррелируют между собой, при том что сами факторы не коррелируют.
Factorial analysis (Факторный анализ) Направление математической статистики, помогающее обнаружить наиболее важные факторы, которые влияют на исследуемые процессы или объекты. Это позволяет строить аналитические модели с небольшим числом независимых переменных.
Fast Analysis of Shared Multidimensional Information (Тест FASMI) Быстрый анализ разделяемой многомерной информации, FASMI Определение понятия OLAP в виде пяти критериев, которым должны удовлетворять попадающие в эту категорию программные продукты. Альтернатива 13-ти правилам Кодда.
Feature engineering (Выделение признаков) Конструирование признаков, Генерация признаков, Feature extruction В машинном обучении преобразование сырых, неструктурированных данных к виду, пригодному для признакового описания наблюдений.
Feature selection (Отбор признаков) Отбор переменных, Отбор атрибутов, Отбор факторов, Отбор предикторов, Генерализация, Variable selection, Attribut selection В статистике и машинном обучении отбор признаков исходного набора данных, на основе которых будет строится аналитическая модель. Целью при этом является снижение размерности пространства поиска за счет выбора наиболее информативных признаков и исключения избыточных.
FIAS (ФИАС) Федеральная информационная адресная система Российский государственный информационный ресурс, содержащий сведения о существующих почтовых адресах, изменении и аннулировании адресов. Находится в ведении Федеральной налоговой службы.
Filter (Фильтр) В анализе данных — инструмент, выделяющий из исходного набора данных некоторую часть с заданными свойствами. Входит в состав большинства аналитических платформ. Распространены фильтр строк, сглаживающий фильтр, экстраполирующий фильтр.
Financial ratios (Финансовые коэффициенты) Величины, отражающие результаты финансовой деятельности компании и рассчитываемые на основе данных финансовой отчетности.
Fisher's distribution (Распределение Фишера) F-распределение, Распределение Снедекора В теории вероятностей — двухпараметрическое семейство абсолютно непрерывных распределений. Применяется для проверки статистических гипотез, в частности, при оценке значимости регрессионных моделей.
Fitting criterion (Критерий согласия) Статистическое правило, по которому принимается или отвергается гипотеза о том, что исследуемая случайная величина подчиняется заданному эмпирическому закону распределения. Имеет важное значение при применении статистических методов анализа.
Focus group method (Метод фокус-групп) Технология маркетингового исследования, состоящая в проведении групповой дискуссии под руководством модератора. Позволяет на основе небольшой группы потребителей выявить мнение о компании, продукте и т.д. широкой целевой аудитории.
Forecast (Прогноз) Обоснованное суждение о возможном состоянии исследуемого процесса или объекта в будущем. Прогнозирование является одной из важнейших задач аналитических технологий Data Mining.
Forecast depth (Глубина прогноза) Глубина погружения В анализе данных — ретроспективный временной интервал, на основе наблюдений которого делается прогноз. Если мы хотим построить прогноз на VI квартал, используя данные за I, II и III кварталы, то глубина составит 3.
Forecasting (Прогнозирование) Предсказание будущих событий, явлений, состояний различных объектов и процессов. Является одной из задач Data Mining и одним из ключевых моментов при принятии решений.
Fourier transform (Преобразование Фурье) Интегральное преобразование, которое преобразует функцию с временной области в частотную. Является основой методов спектрального анализа, позволяющего упростить некоторые задачи анализа данных.
Fraud (Мошенничество) В анализе данных — обманные действия в области кредитования, банковских карт, телекоммуникациях и других сферах, где они могут быть выявлены с помощью аналитических методов.
Fraud detection (Выявление мошенничеств) Направление интеллектуального анализа данных, включающее методы выявления мошеннических действий в кредитно-финансовой сфере, телекоммуникациях и т.д. Использует методы Data Mining — нейронные сети, деревья решений и т.д.
Frequency array (Таблица частот) Frequency table Показывает, сколько раз каждое значение набора данных появляется в нем. Является простейший методом анализа категориальных переменных. Наиболее часто используется в рамках разведочного анализа данных.
Frequency domain (Частотная область) В обработке сигналов и анализе данных — область преобразований, в которой сигналы и данные обрабатываются как функции частоты. Используется для упрощения некоторых задач обработки, реализуемых с помощью спектрального анализа.
Frequent Itemset (Популярный набор) Частый предметный набор, Часто встречающееся множество Набор предметов (например, товаров, приобретаемых вместе), имеющий поддержку (частоту появления) выше некоторого порога. В аналитике данных термин относят к ассоциативным правилам и задаче анализа рыночной корзины.
Function extremum (Экстремум функции) Точка экстремума Максимальное или минимальное значение функции на заданном интервале. В машинном обучении подбор параметров моделей производится с целью достижения минимума функции ошибки обучения.
Fuzzy logic (Нечеткая логика) Форма многозначной логики, в которой истинные значения переменных могут быть любыми действительными числами от 0 до 1 включительно. Применяется во многих областях, от теории управления до искусственного интеллекта.