Решающее правило (Decision Rule) Скачать в PDF
Синонимы: Классифицирующее правило, Classification rule
Разделы: Алгоритмы
Решающие правила в машинном обучении и анализе данных — это правила вида «если, то», определяющие принадлежность объекта к заданному классу. Применяются при решении задачи классификации с использованием деревьев решений и алгоритмов последовательного покрытия.
В левой части решающего правила (слева от «то») размещается выражение, в котором значение атрибута сравнивается с некоторым порогом. В правой части помещается значение переменной класса, к которому должны быть отнесены все наблюдения, для которых значение атрибута удовлетворяет правилу.
Например, при классификации заемщиков по уровню кредитного рейтинга на «Высокий», «Средний» и «Низкий» с использованием атрибута «Доход» возможно правило:
Если «Доход» > 40 000, то «Высокий»
Фактически решающее правило присваивает метку класса всем наблюдениям, удовлетворяющим ему. Последовательное применение несколько решающих правил, использующих различные атрибуты и пороговые значения, присваивает всем наблюдениям метки классов.
Если атрибут, на котором строится правило, не является числовым (т.е. является категориальным или логическим), то в условии значение атрибута сравнивается с другими его значениями, упорядоченными некоторым образом, например в ординальной шкале или по какой-либо мере расстояния, например, Левенштейна.
Решающие правила формируются в процессе обучения классификатора на основе обучения с учителем. Чем больше наблюдений набора данных удовлетворяют правилу, тем выше его значимость. Малозначимые правила, которым удовлетворяет всего несколько наблюдений, как правило, отбрасываются классификатором, поскольку только усложняют модель, не внося существенного вклада в решение задачи классификации.