Дерево решений (Decision Trees)

Синонимы: Дерево классификаций, Classification Tree

Разделы: Алгоритмы

Классификатор, полученный из обучающего множества, содержащего объекты и их характеристики, на основе обучения.

Дерево состоит из листьев, указывающих на класс, и узлов. Оно может использоваться для классификации объектов, не вошедших в обучающее множество. Поиск начинается с корня, пока не будет обнаружен класс, соответствующий объекту.

В интеллектуальном анализе данных, деревья решений могут быть использованы в качестве математических и вычислительных методов, чтобы помочь описать, классифицировать и обобщить набор данных, которые могут быть записаны следующим образом:

Среди прочих методов Data Mining, метод дерева принятия решений имеет несколько достоинств:

  • Прост в понимании и интерпретации.
  • Не требует подготовки данных.
  • Способен работать как с категориальными, так и с интервальными переменными.
  • Использует модель «белого ящика».
  • Позволяет оценить модель при помощи статистических тестов. Это даёт возможность оценить надёжность модели.
  • Является надёжным методом. Метод хорошо работает даже в том случае, если были нарушены первоначальные предположения, включённые в модель.
  • Позволяет работать с большим объёмом информации без специальных подготовительных процедур.

В машинном обучении популярными алгоритмами построения деревьев решений являются: ID3, C4.5, CART, CHAID и другие.

results matching ""

    No results matching ""