Обработка естественного языка (Natural language processing)

Синонимы: NLP

Разделы: Бизнес-задачи

Обработка естественного языка — это направление на стыке информационных технологий и искусственного интеллекта, связанное с решением следующих задач:

  • организация взаимодействия между компьютерами и человеком на естественном языке;
  • разработка средств анализа больших объемов данных, представленных на естественном языке;
  • распознавание речи и понимание естественного языка компьютерными системами;
  • генерация естественного языка.

Считается, что начало развития данного направление было положено в 1950-х годах на основе идей и работ А. Тьюринга. На ранних этапах развития систем обработки естественного языка они строились, главным образом, на основе программирования правил. С 1980-х годов начали активно использоваться машинное обучение и статистический вывод.

С помощью машинного обучения автоматически происходит генерация правил на основе анализа больших массивов реальных текстов. При этом используются такие методы, как нейронные сети и деревья решений, а также кластеризация и др.