Класс (Class)

Разделы: Алгоритмы

В статистике и анализе данных классом называют группу объектов или явлений, обладающих общими свойствами. Понятие класса играет важную роль в технологиях обнаружения и представление знаний. Например, среди заемщиков банка можно выделить классы добросовестных (которые не допускают просрочки) и недобросовестных (допускают). Также клиентов можно разбить на классы по уровню их активности (активный, пассивный) и т.д.

Классы определяются некоторыми условиями, которым должны удовлетворять объекты, чтобы стать членами класса. Правила, используемые для проверки соответствия объектов этим условиям, называются классифицирующими правилами. Задача выявления классифицирующих правил и их применения для отнесения объектов к классам называется задачей классификации, а сам процесс распределения объектов по классам — классификацией. Выявление таких условий и проверка объектов на соответствие им с целью отнесения к определенному классу также входит в задачу классификации.

В отличие от кластеров, которые формируются в процессе кластеризации, классы должны быть определены заранее. Поэтому обучение классификаторов — это задача обучения с учителем.

Классы бывают:

  • непересекающиеся — одно наблюдение может одновременно принадлежать только одному классу;
  • пересекающиеся — одно и то же наблюдение может принадлежать нескольким классам одновременно;
  • нечеткими — наблюдение принадлежит к классу с некоторой степенью принадлежности (обычно степень принадлежности задается в интервале от 0 до 1).