Квантование (Binning) Скачать в PDF
Синонимы: Дискретизация
Разделы: Алгоритмы
Loginom: Квантование (обработчик), Конечные классы (обработчик)
Процесс обработки данных, который преобразует непрерывные данные в дискретные путем замены значений отрезками, каждый из которых представляет некоторый диапазон.
Квантование может использоваться для сокращения размерности данных, а именно для уменьшения числа разнообразных значений признака.
При квантовании производится отображение всевозможных значений величины на дискретную область, состоящую из величин уровня квантования.
Например, если с точки зрения анализа нет разницы между числом новых посетителей в 15 и 17 тыс., то нет смысла рассматривать эти величины отдельно. В этом случае лучший результат даст квантование: оно позволяет представлять информацию в более компактном и удобном для анализа виде.
Различают два основных метода квантования:
- интервальный;
- квантильный.
При интервальном квантовании диапазон изменения значения признака разделяется на равные интервалы. Данный метод используется, если значения равномерно распределены по всему диапазону их изменения, т.е. в результате квантования не будет интервалов, в которых значения почти отсутствуют или заполнены очень плотно.
При квантильном методе ширина интервалов может быть различной. Ее выбирают таким образом, чтобы в каждый из них попало примерно одинаковое количество значений.