Выборочный метод (Sampling method)

Разделы: Алгоритмы

Выборочными называются методы математической статистики, в которых свойства генеральной совокупности изучаются на основе исследования свойств ее части, полученной с помощью определенного алгоритма выборки (сэмплинга), который обычно носит случайный характер.

Необходимость применения таких методов обусловлена либо невозможностью, либо нецелесообразностью исследования всей генеральной совокупности, что может быть связано с очень большим ее объемом, сложностью сбора данных и т.д.

Корректное применение выборочных методов является важным условием качественного анализа на основе любого статистического исследования и во многом определяется особенностями предмета анализа.

Среди оцениваемых с помощью выборочных методов характеристик чаще всего фигурируют:

Главной проблемой выборочного метода является оценка того, насколько уверенно можно по свойствам выборки судить о свойствах генеральной совокупности в целом. Всякая подобная оценка неизбежно имеет вероятностный характер, и задача сводится к тому, чтобы вероятность правильных выводов (точности статистических оценок) была бы максимальной.

Особенно широко выборочные методы применяются в демографических и социологических исследованиях, выборочном контроле качества изделий и других предметных областях, где специалисту приходится иметь дело с огромным количеством объектов или наблюдений.

Большинство методов Data Mining (нейронные сети, деревья решений и др.) используют этот подход, поскольку построение и обучение аналитических моделей всегда производится на ограниченной выборке данных, в то время как закономерности, обнаруженные моделью, должны распространяться на всю генеральную совокупность.

Выборочный метод реализуется в Loginom с помощью обработчика сэмплинг. Сэмплинг является одним из этапов выборочного метода и осуществляет различные способы отбора записей в выборку из исходного набора данных для дальнейшего наблюдения за поведением тех или иных характеристик.