Решающее правило (Decision Rule)

Синонимы: Классифицирующее правило, Classification rule

Разделы: Алгоритмы

Решающие правила в машинном обучении и анализе данных — это правила вида «если, то», определяющие принадлежность объекта к заданному классу. Применяются при решении задачи классификации с использованием деревьев решений и алгоритмов последовательного покрытия.

В левой части решающего правила (слева от «то») размещается выражение, в котором значение атрибута сравнивается с некоторым порогом. В правой части помещается значение переменной класса, к которому должны быть отнесены все наблюдения, для которых значение атрибута удовлетворяет правилу.

Например, при классификации заемщиков по уровню кредитного рейтинга на «Высокий», «Средний» и «Низкий» с использованием атрибута «Доход» возможно правило:

Если «Доход» > 40 000, то «Высокий»

Фактически решающее правило присваивает метку класса всем наблюдениям, удовлетворяющим ему. Последовательное применение несколько решающих правил, использующих различные атрибуты и пороговые значения, присваивает всем наблюдениям метки классов.

Если атрибут, на котором строится правило, не является числовым (т.е. является категориальным или логическим), то в условии значение атрибута сравнивается с другими его значениями, упорядоченными некоторым образом, например в ординальной шкале или по какой-либо мере расстояния, например, Левенштейна.

Решающие правила формируются в процессе обучения классификатора на основе обучения с учителем. Чем больше наблюдений набора данных удовлетворяют правилу, тем выше его значимость. Малозначимые правила, которым удовлетворяет всего несколько наблюдений, как правило, отбрасываются классификатором, поскольку только усложняют модель, не внося существенного вклада в решение задачи классификации.