Диаграмма рассеяния (Scatter diagram)

Разделы: Визуализация

Визуализатор для оценивания точности работы регрессионных моделей. Представляет собой график, на котором по горизонтальной оси откалываются целевые значения обучающих примеров, а по вертикальной – значения, оцененные моделью. Тогда каждая пара целевого и оцененного значений может быть представлена на диаграмме в виде точки.

Множество точек, для которых оцененное значение будет равно реальному, образует так называемую линию идеальных значений, для каждой точки которой выполняется равенство . Остальные точки, образованные примерами, на которых модель допустила ошибку, будут рассеяны вдоль линии.

По степени их рассеяния можно оценить точность модели. Если большая их часть расположена достаточно близко к линии, а значительные отклонения редки или совсем отсутствуют, то модель работает хорошо. Если разброс точек велик, то ее точность низкая.

На практике при визуализации диаграммы обычно строят две линии, соответствующие допустимому уровню ошибки (пунктирные линии на рисунке). Если большая часть точек лежит в пределах установленного ими «коридора», то можно утверждать, что модель работает хорошо (левый рисунок). Если точки имеют значительный разброс и большая их часть расположена вне «коридора», то точность модели низкая (правый рисунок).

Допустимая ошибка определяется аналитиком, исходя из особенностей решаемой задачи.

results matching ""

    No results matching ""