Структурированные данные (Structured data) Скачать в PDF
Структурированными называются данные, отражающие отдельные факты предметной области и упорядоченные определенным образом с целью обеспечения возможности применения к ним различных методов обработки. В этом случае подразумевается, что данные упорядочены по вертикали в типизированные столбцы, называемые полями, а по горизонтали — в строки, называемые записями.
При этом все записи должны содержать один и тот же набор полей, а все поля — один и тот же набор записей. Обычно, каждое поле представляет собой атрибут атрибут (признак), а строка — единицу наблюдения. В качестве примера структурированных данных можно привести таблицу
ID Клиента | Фамилия | Имя | Отчество | Пол |
---|---|---|---|---|
1 | Иванов | Иван | Иванович | М |
2 | Иванова | Людмила | Андреевна | Ж |
3 | Сидоров | Андрей | Анатольевич | М |
4 | Сидорова | Юлия | Ивановна | Ж |
5 | Петров | Аркадий | Алексеевич | М |
6 | Петрова | Анна | Александровна | Ж |
Большинство алгоритмов машинного обучения, статистического и интеллектуального анализа данных работают только со структурированными данными. Loginom — платформа для решения широкого спектра бизнес-задач, требующих обработки больших объемов структурированных данных, реализацией их очистки, предобработки, связывания и т.д. Для оценки функционала анализа можно воспользоваться бесплатной версией для некоммерческого использования Loginom Community Edition.