База знаний (Knowledge base)

Разделы: Источники данных

В современном понимании база знаний — это технология, используемая для хранения сложной структурированной и неструктурированной информации, используемой в компьютерных системах. Первоначальное использование этого термина было связано с экспертными системами, которые были первыми системами, основанными на знаниях.

Первоначально термин «база знаний» (наряду с подсистемой логического вывода) понимался как составляющая систем, основанных на знаниях (экспертных систем). В системах, основанных на знаниях, базы знаний содержит факты окружающего мира, а механизма вывода производит рассуждения об этих фактах и использует правила вывода и другие формы логики для получения новых знаний.

Термин «база знаний» был введен с целью отличить эту форму хранилища знаний от более распространенных и широко используемых терминологических баз данных. В то время (1970-е годы) практически все крупные информационные системы хранили данные в какой-либо иерархической или реляционной базе данных. На этом этапе развития информационных технологий различие между базой данных и базой знаний было четким и недвусмысленным.

Основными свойствами обычных баз данных являлось содержание больших объемов «долгоживущих» данных, хранение информации в «плоских» таблицах, поддержка многопользовательского режима и обработки транзакций. В то же время, первые системы, основанные на знаниях, предъявляли прямо противоположные требования к организации хранения данных. Экспертная система требует структурированных данных. Нужны были не только таблицы с полями и строками, но и указатели и ссылки на другие объекты, которые, в свою очередь, имеют дополнительные указатели.

Идеальным представлением для базы знаний является объектная модель (часто называемая в литературе по искусственному интеллекту онтологией) с классами, подклассами и экземплярами.

Ранние экспертные системы мало нуждались в многопользовательском режиме или обработке транзакций. Данные в ранних экспертных системах использовались для получения конкретного ответа, такого как медицинский диагноз, конструкция молекулы или реакция на чрезвычайную ситуацию. Как только решение проблемы становилось известным, потребность хранить большие объемы связанных с ним данных исчезала.

Требования к объему баз знаний также отличались от обычной базы данных. База знаний должна содержать факты окружающего мира. Например, чтобы представить утверждение «Все люди смертны». По мере того как экспертные системы переходили от прототипов к реальным системам, развернутым в корпоративных средах, требования к их хранилищу данных быстро начали совпадать со стандартными требованиями к базе данных для нескольких распределенных пользователей с поддержкой транзакций.

Дальнейшая эволюция термина «база знаний» связана интернетом, развитие которого сделало критически важным поддержку документов, гипертекста и мультимедиа для любой корпоративной базы данных. Уже недостаточно простой поддержки больших таблиц данных или относительно небольших объектов, которые существовали главным образом в памяти компьютера. В современных базах знаний последние могут быть представлены в виде правил, онтологий, фреймов, продукционных моделей, семантических карт и дескрипционных логик.