Структурированные данные (Structured data)

Структурированными называются данные, отражающие отдельные факты предметной области и упорядоченные определенным образом с целью обеспечения возможности применения к ним различных методов обработки. В этом случае подразумевается, что данные упорядочены по вертикали в типизированные столбцы, называемые полями, а по горизонтали — в строки, называемые записями.

При этом все записи должны содержать один и тот же набор полей, а все поля — один и тот же набор записей. Обычно, каждое поле представляет собой атрибут атрибут (признак), а строка — единицу наблюдения. В качестве примера структурированных данных можно привести таблицу

ID Клиента Фамилия Имя Отчество Пол
1 Иванов Иван Иванович М
2 Иванова Людмила Андреевна Ж
3 Сидоров Андрей Анатольевич М
4 Сидорова Юлия Ивановна Ж
5 Петров Аркадий Алексеевич М
6 Петрова Анна Александровна Ж

Большинство алгоритмов машинного обучения, статистического и интеллектуального анализа данных работают только со структурированными данными. Loginom — платформа для решения широкого спектра бизнес-задач, требующих обработки больших объемов структурированных данных, реализацией их очистки, предобработки, связывания и т.д. Для оценки функционала анализа можно воспользоваться бесплатной версией для некоммерческого использования Loginom Community Edition.