Источники данных

Название/Синоним Описание
База знаний (Knowledge base) Технология для хранения сложной структурированной и неструктурированной информации в компьютерных системах. Содержит факты окружающего мира, а механизм вывода использует различные формы логики для получения новых знаний.
Веб-сервис (Web-service) Веб-служба Обладающая уникальным веб-адресом (URL) программная система, построенная на базе открытых протоколов/стандартов и использующаяся для обмена данными между приложениями или системами.
Витрина данных (Data Mart) Киоск данных, Секция данных Предметно-ориентированная база данных, содержащая данные по одному из направлений деятельности компании. В витрине информация хранится оптимизированно с точки зрения решения конкретных задач.
КЛАДР Классификатор адресов Онлайн-классификатор адресов ФНС России. Может использоваться для очистки персональных данных от ошибок, допускаемых при внесении адресной информации. В настоящее время заменен на ФИАС.
Колоночная база данных (Columnar database) Column-oriented database База данных, в которой данные группируются не по строкам, а по столбцам. Важное свойство — высокая скорость и гибкость выполнения сложных запросов, из-за чего колоночные СУБД предпочтительнее для OLAP-систем и больших данных.
Концентратор данных (Data Hub) Разновидность корпоративной информационной архитектуры, обеспечивающая консолидацию и централизованное хранение всех данных компании, и поддерживающей обмен ими с другими системами, например бизнес-аналитики и интеллектуального анализа данных.
Мастер-данные (Master data) Основные данные, Справочная информация, Нормативно-справочная информация, НСИ, Reference data Корпоративные данные, которые носят информационно-справочный характер. Содержат информацию о бизнес-объектах организации — клиентах, сотрудниках, поставщиках, материалах, оборудовании и т.д. Создают контекст для бизнес-операций
Многомерная база данных (Multi-dimensional Database) СУМБД, Многомерное хранилище данных, СУБД с изменяемой размерностью База данных, в которой данные организованы в виде упорядоченных многомерных массивов. В многомерных СУБД информация является логически целостной. Многомерные СУБД интенсивно внедряются с развитием OLAP-технологий.
Озеро данных (Data Lake) Метод хранения структурированной, полуструктурированной и неструктурированной информации, а также организации больших объемов «сырых» данных, поступающих из различных источников.
Оперативный склад данных (Operatonal Data Store) ОСД, ODS Разновидность систем хранения, обеспечивающая оперативные анализ и отчетность, а также поддержку работы централизованного хранилища данных.
Платформа клиентских данных (Customer Data Platform) CDP Совокупность программных средств для сбора данных о клиентах из различных источников, их обработки, консолидации, хранения и использования для профилирования, сегментации, улучшения таргетинга и повышения эффективности маркетинговых кампаний.
Платформа управления данными (Data management platform) ПУД, DMP Программная платформа для сбора, хранения, анализа и использования данных. В бизнес-аналитике используется для управления клиентскими данными с целью формирования целевых сегментов и повышения эффективности маркетинговых кампаний.
Программный интерфейс ODBC (Open Database Connectivity) Программный интерфейс (API) доступа к базам данных, разработанный Microsoft. Позволяет использовать один интерфейс доступа к данным, не беспокоясь о тонкостях взаимодействия с несколькими источниками.
Реляционная база данных (Relational database) База данных, в основе которой лежит реляционная модель. Данные в ней организованы в виде набора таблиц, состоящих из столбцов и строк. Каждая строка — это набор связанных значений, относящихся к одному объекту.
Сетка данных (Data mesh) Подход к построению архитектуры корпоративных данных, в рамках которого производится децентрализация аналитических данных на основе предметно-ориентированной модели.
Справочные данные (Reference data) Нормативно-справочная информация, НСИ Медленно меняющиеся данные, содержащие заранее определенный набор значений или категорий, которые могут быть стандартизированы в рамках организации и обеспечивают контекст для основных данных.
Схема Звезда (Star scheme) Логическая модель данных, используемая в многомерном хранилище данных. В ней используется таблица фактов, расположенная в центре, и несколько таблиц измерений, образующих лучи.
Схема Снежинка (Snowflake scheme) Вид логической структуры реляционного хранилища данных, которая использует единственную таблицу фактов и несколько таблиц измерений. Основная особенность схемы — возможность хранения иерархических измерений.
Транзакционная база данных (Database of transactions) База данных транзакций, Transactional database База данных, каждая запись которой представляет собой транзакцию. Формируется с помощью систем оперативной обработки транзакций (OLTP) в банках, торговых сетях, телекоммуникационных компаниях и т.д.
ФИАС (FIAS) Федеральная информационная адресная система Российский государственный информационный ресурс, содержащий сведения о существующих почтовых адресах, изменении и аннулировании адресов. Находится в ведении Федеральной налоговой службы.
Хранилище данных (Data Warehouse) Предметно-ориентированный, интегрированный, неизменчивый и поддерживающий хронологию набор данных. Позволяет эффективнее, быстрее и качественнее предоставлять данные для систем аналитической обработки, чем обычные СУБД.
Эталонные данные (Ground truth) Основная истина, Фундаментальная истина В машинном обучении под эталонными понимают специально отбираемые и помечаемые данные, корректность и достоверность которых считается не подлежащей сомнению. Наборы эталонных данных обычно формируются экспертами предметной области и используются для повышения и контроля точности ML-моделей.
Язык SQL (Structured Query Language) Язык структурированных запросов, SQL Предметно-ориентированный язык программирования для управления данными в реляционных базах данных. Стандарт Американского национального института стандартов (ANSI) и Международной организации по стандартизации (ISO).