База знаний (Knowledge base) |
Технология для хранения сложной структурированной и неструктурированной информации в компьютерных системах. Содержит факты окружающего мира, а механизм вывода использует различные формы логики для получения новых знаний. |
Веб-сервис (Web-service) Веб-служба |
Обладающая уникальным веб-адресом (URL) программная система, построенная на базе открытых протоколов/стандартов и использующаяся для обмена данными между приложениями или системами. |
Витрина данных (Data Mart) Киоск данных, Секция данных |
Предметно-ориентированная база данных, содержащая данные по одному из направлений деятельности компании. В витрине информация хранится оптимизированно с точки зрения решения конкретных задач. |
КЛАДР Классификатор адресов |
Онлайн-классификатор адресов ФНС России. Может использоваться для очистки персональных данных от ошибок, допускаемых при внесении адресной информации. В настоящее время заменен на ФИАС. |
Колоночная база данных (Columnar database) Column-oriented database |
База данных, в которой данные группируются не по строкам, а по столбцам. Важное свойство — высокая скорость и гибкость выполнения сложных запросов, из-за чего колоночные СУБД предпочтительнее для OLAP-систем и больших данных. |
Концентратор данных (Data Hub) |
Разновидность корпоративной информационной архитектуры, обеспечивающая консолидацию и централизованное хранение всех данных компании, и поддерживающей обмен ими с другими системами, например бизнес-аналитики и интеллектуального анализа данных. |
Мастер-данные (Master data) Основные данные, Справочная информация, Нормативно-справочная информация, НСИ, Reference data |
Корпоративные данные, которые носят информационно-справочный характер. Содержат информацию о бизнес-объектах организации — клиентах, сотрудниках, поставщиках, материалах, оборудовании и т.д. Создают контекст для бизнес-операций |
Многомерная база данных (Multi-dimensional Database) СУМБД, Многомерное хранилище данных, СУБД с изменяемой размерностью |
База данных, в которой данные организованы в виде упорядоченных многомерных массивов. В многомерных СУБД информация является логически целостной. Многомерные СУБД интенсивно внедряются с развитием OLAP-технологий. |
Озеро данных (Data Lake) |
Метод хранения структурированной, полуструктурированной и неструктурированной информации, а также организации больших объемов «сырых» данных, поступающих из различных источников. |
Оперативный склад данных (Operatonal Data Store) ОСД, ODS |
Разновидность систем хранения, обеспечивающая оперативные анализ и отчетность, а также поддержку работы централизованного хранилища данных. |
Платформа клиентских данных (Customer Data Platform) CDP |
Совокупность программных средств для сбора данных о клиентах из различных источников, их обработки, консолидации, хранения и использования для профилирования, сегментации, улучшения таргетинга и повышения эффективности маркетинговых кампаний. |
Платформа управления данными (Data management platform) ПУД, DMP |
Программная платформа для сбора, хранения, анализа и использования данных. В бизнес-аналитике используется для управления клиентскими данными с целью формирования целевых сегментов и повышения эффективности маркетинговых кампаний. |
Программный интерфейс ODBC (Open Database Connectivity) |
Программный интерфейс (API) доступа к базам данных, разработанный Microsoft. Позволяет использовать один интерфейс доступа к данным, не беспокоясь о тонкостях взаимодействия с несколькими источниками. |
Реляционная база данных (Relational database) |
База данных, в основе которой лежит реляционная модель. Данные в ней организованы в виде набора таблиц, состоящих из столбцов и строк. Каждая строка — это набор связанных значений, относящихся к одному объекту. |
Сетка данных (Data mesh) |
Подход к построению архитектуры корпоративных данных, в рамках которого производится децентрализация аналитических данных на основе предметно-ориентированной модели. |
Справочные данные (Reference data) Нормативно-справочная информация, НСИ |
Медленно меняющиеся данные, содержащие заранее определенный набор значений или категорий, которые могут быть стандартизированы в рамках организации и обеспечивают контекст для основных данных. |
Схема Звезда (Star scheme) |
Логическая модель данных, используемая в многомерном хранилище данных. В ней используется таблица фактов, расположенная в центре, и несколько таблиц измерений, образующих лучи. |
Схема Снежинка (Snowflake scheme) |
Вид логической структуры реляционного хранилища данных, которая использует единственную таблицу фактов и несколько таблиц измерений. Основная особенность схемы — возможность хранения иерархических измерений. |
Транзакционная база данных (Database of transactions) База данных транзакций, Transactional database |
База данных, каждая запись которой представляет собой транзакцию. Формируется с помощью систем оперативной обработки транзакций (OLTP) в банках, торговых сетях, телекоммуникационных компаниях и т.д. |
ФИАС (FIAS) Федеральная информационная адресная система |
Российский государственный информационный ресурс, содержащий сведения о существующих почтовых адресах, изменении и аннулировании адресов. Находится в ведении Федеральной налоговой службы. |
Хранилище данных (Data Warehouse) |
Предметно-ориентированный, интегрированный, неизменчивый и поддерживающий хронологию набор данных. Позволяет эффективнее, быстрее и качественнее предоставлять данные для систем аналитической обработки, чем обычные СУБД. |
Эталонные данные (Ground truth) Основная истина, Фундаментальная истина |
В машинном обучении под эталонными понимают специально отбираемые и помечаемые данные, корректность и достоверность которых считается не подлежащей сомнению. Наборы эталонных данных обычно формируются экспертами предметной области и используются для повышения и контроля точности ML-моделей. |
Язык SQL (Structured Query Language) Язык структурированных запросов, SQL |
Предметно-ориентированный язык программирования для управления данными в реляционных базах данных. Стандарт Американского национального института стандартов (ANSI) и Международной организации по стандартизации (ISO). |