Модель авторегрессии скользящего среднего (ARIMA) Скачать в PDF
Синонимы: Модель Бокса-Дженкинса, АРИСС, Методология Бокса-Дженкинса, Autoregressive Integrated Moving Average, Box-Jenkins model
Разделы: Алгоритмы
Модель авторегрессии скользящего среднего и систематический подход к ее построению был предложен в 1970-х годах Джорджем Боксом и Гвилимом Дженкинсом. Она предназначена для анализа стационарных временных рядов на основе оценки линейной зависимости прогнозируемых значений от исторических.
Для использования модели временной ряд должен быть стационарным, т.е. его среднее и дисперсия должны быть постоянны.
Модель Бокса-Дженкинса предполагает, что временной ряд содержит три составляющие: авторегресионную, интегрированную и скользящее среднее, которые в модели обозначены , и соответственно:
- Величина называется порядком авторегрессии. Она позволяет ответить на вопрос, будет ли очередной элемент ряда близок к значению , если к нему были близки предыдущих значений.
- Величину называют порядком интегрирования. Она показывает, насколько элемент ряда близок по значению к предыдущим значениям, если разность между ними минимальна.
- Параметр — порядок скользящего среднего. Позволяет установить погрешность модели как линейную комбинацию наблюдавшихся ранее значений ошибок.
Авторегрессия — это составляющая модели временного ряда, в которой его прогнозируемое значение может быть выражено в виде линейной комбинации исторических значений этого же ряда и случайной ошибки.
Обычно модель упоминается, как , где , и — целые неотрицательные числа, характеризующие порядок для частей модели (соответственно авторегрессионной, интегрированной и скользящего среднего).
Для временного ряда модель может быть записана в виде:
,
где
- — оператор разности порядка (последовательное взятие раз разностей первого порядка — сначала от самого ряда, затем от полученных разностей первого порядка, затем от второго порядка и т. д.);
- — коэффициенты авторегрессионной части модели, — значения ошибки (полагаются независимыми одинаково распределенными случайными величинами из нормального распределения с нулевым средним);
- — коэффициенты скользящего среднего.
Существует также расширенная модель ARIMAX, которая учитывает внешние факторы при построении прогноза.
Модель Бокса-Дженкинса широко применяются при прогнозировании временных рядов. Основная задача при этом заключается в оценке параметров модели. Методология построения ARIMA-модели исследуемого временного ряда включает следующие основные этапы:
- построение пробной модели;
- оценивание параметров модели и проверка адекватности модели;
- использование модели для прогнозирования.
В Loginom модель ARIMA реализована как отдельный обработчик, который позволяет производить прогнозирование временных рядов. Временным рядом могут быть любые данные в разрезе времени, например, продажи товаров, количество заказов, поток клиентов и т.д.
Построение модели в Loginom для прогноза объема продаж сезонных товаров зимнего спорта по месяцам подробно описано в статье «Пример использования ARIMA для прогноза продаж».