Нормирование нелинейное (Non-linear normalization) Скачать в PDF
Синонимы: Нормализация нелинейная
Нелинейное нормирование — это приведение исходного диапазона изменения величины, используемой в аналитической модели, к некоторому «нормальному» диапазону (например [0..1] или [-1..1]) с использованием нелинейной функции.
Необходимость нормирования обусловлена тем, что переменные, поступающие на вход аналитической модели, могут иметь различную физическую природу и быть представлены в разных шкалах. Например, при анализе перевозок могут использоваться такие показатели, как дальность перевозки (десятки и сотни километров), вес перевезенных грузов (тысячи тонн) и стоимость груза (миллионы и десятки миллионов рублей).
Очевидно, что размах вариации наблюдаемых значений этих переменных различается на порядки: для дальности это единицы и десятки, а для стоимости — миллионы. Если целью модели является определение влияния изменчивости входных переменных на изменчивость выходной (как, например, в регрессии), то окажется, что наибольшее влияние будет у входной переменной с большей вариативностью, даже если это противоречит реальной ситуации.
Для решения данной проблемы и используют нормирование — приведение входных переменных к одному диапазону. Для этого применяют специальную нормирующую функцию, которая «сжимает» или расширяет исходный диапазон к нормальному и которая может быть линейной или нелинейной. Соответственно, и нормирование будет называться линейным или нелинейным.
При нормировании нужно точно знать теоретически возможный максимальный диапазон изменения величины. Однако, если он неизвестен, то в качестве исходного диапазона приходится использовать разность между наблюдаемыми минимумом и максимумом.
В случае нелинейной нормализации различные интервалы исходного диапазона «сжимаются» с различной степенью, что в некоторых случаях позволяет добиться наилучшего результата, подбирая параметры, управляющие формой нормирующей функции.
Наиболее распространенными нелинейными нормирующими функциями являются сигмоиды — логистическая и гиперболический тангенс. Первая приводит значения к диапазону [0..1], а вторая — [-1..1].
Пусть — -е входное значение -го примера в исходных шкалах набора данных. — соответствующие им нормализованное входное значение.
Тогда переход от исходных значений к нормализованным с использованием нелинейной нормализации осуществляется с использованием логистической функции, определяется выражением:
,
где — центр нормализуемого интервала, — параметр крутизны функции.
Сигмоидальные функции используются для нормирования выходов нейронов в нейронных сетях.