Валидация (Validation)

Loginom: Валидация моделей

В анализе данных термин валидация (от лат. validus — здоровый, крепкий, сильный) может использоваться в двух значениях.

  1. Валидация данных — процесс проверки того, что перед анализом данных была выполнена их очистка и предобработка, в результате которых был обеспечен достаточный уровень качества данных. Процесс валидации может применяться не только к собственно данным, но и к системам их ввода и регистрации.

  2. Валидация моделей — проверка правильности работы (предсказательной способности, точности) аналитической модели, построенной на основе машинного обучения. Проводится на независимом (т.е. не использовавшемся для обучения и тестирования) валидационном множестве после обучения и тестирования модели.