Многослойный персептрон (Multilayered perceptron) Скачать в PDF
Синонимы: MLP, Многослойный персептрон Румельхарта
Loginom: Нейросеть (классификация) (обработчик), Нейросеть (регрессия) (обработчик)
Многослойный персептрон — это класс искусственных нейронных сетей прямого распространения, состоящих как минимум из трех слоев: входного, скрытого и выходного. За исключением входных, все нейроны использует нелинейную функцию активации.
При обучении MLP используется обучение с учителем и алгоритм обратного распространения ошибки.
В качестве активационных функций нейронов используются сигмоидальные: логистическая или гиперболический тангенс.
MLP показали возможность находить приближенные решения для чрезвычайно сложных задач. В частности, они являются универсальным аппроксиматором функций, поэтому с успехом используются в построении регрессионных моделей. Поскольку классификацию можно рассматривать как частный случай регрессии, когда выходная переменная категориальная, на основе MLP можно строить классификаторы.
Пик популярности MLP в машинном обучении пришелся на 1980-е годы в таких областях, как распознавание речи и изображений, системах машинного перевода. Однако позднее они столкнулись с конкуренцией с другими технологиями машинного обучения, такими, как машины опорных векторов. Интерес к многослойным персептронам вернулся благодаря успехам глубокого обучения.
Впервые многослойный персептрон был предложен Ф. Розенлаттом. Однако в том виде, в котором он используется в настоящее время, многослойный персептрон был разработан Д. Румельхартом.
Персептрон Румельхарта отличается от персептрона Розенблатта по следующим свойствам:
- использование нелинейной активационной функции;
- число скрытых слоев более одного (обычно не более трех);
- входные сигналы не бинарные, а кодируются десятичными числами, нормированными к интервалу [0,1];
- выходная ошибка сети определяется не как число ошибочно распознанных примеров, а как некоторое значение невязки;
- обучение производится не до минимизации ошибки, а до стабилизации весов сети, что позволяет избежать переобучения.
В настоящее время многослойные персептроны по-прежнему являются популярными инструментом анализа данных и входят в большинство платформ бизнес-аналитики.