Многослойный персептрон (Multilayered perceptron) Скачать в PDF

Синонимы: MLP, Многослойный персептрон Румельхарта

Loginom: Нейросеть (классификация) (обработчик), Нейросеть (регрессия) (обработчик)

Многослойный персептрон — это класс искусственных нейронных сетей прямого распространения, состоящих как минимум из трех слоев: входного, скрытого и выходного. За исключением входных, все нейроны использует нелинейную функцию активации.

При обучении MLP используется обучение с учителем и алгоритм обратного распространения ошибки.

Многослойный персептрон Румельхарта

В качестве активационных функций нейронов используются сигмоидальные: логистическая или гиперболический тангенс.

MLP показали возможность находить приближенные решения для чрезвычайно сложных задач. В частности, они являются универсальным аппроксиматором функций, поэтому с успехом используются в построении регрессионных моделей. Поскольку классификацию можно рассматривать как частный случай регрессии, когда выходная переменная категориальная, на основе MLP можно строить классификаторы.

Пик популярности MLP в машинном обучении пришелся на 1980-е годы в таких областях, как распознавание речи и изображений, системах машинного перевода. Однако позднее они столкнулись с конкуренцией с другими технологиями машинного обучения, такими, как машины опорных векторов. Интерес к многослойным персептронам вернулся благодаря успехам глубокого обучения.

Впервые многослойный персептрон был предложен Ф. Розенлаттом. Однако в том виде, в котором он используется в настоящее время, многослойный персептрон был разработан Д. Румельхартом.

Персептрон Румельхарта отличается от персептрона Розенблатта по следующим свойствам:

  • использование нелинейной активационной функции;
  • число скрытых слоев более одного (обычно не более трех);
  • входные сигналы не бинарные, а кодируются десятичными числами, нормированными к интервалу [0,1];
  • выходная ошибка сети определяется не как число ошибочно распознанных примеров, а как некоторое значение невязки;
  • обучение производится не до минимизации ошибки, а до стабилизации весов сети, что позволяет избежать переобучения.

В настоящее время многослойные персептроны по-прежнему являются популярными инструментом анализа данных и входят в большинство платформ бизнес-аналитики.