Эконометрика временных рядов. Шпаргалка: Модели стационарных временных рядов и их индефикация Системы эконометрических уравнений

Глава 6. Эконометрика временных рядов

6.1. Модели стационарных и нестационарных временных рядов, их идентификация

Пусть Рассмотрим временной ряд X(t). Пусть сначала временной ряд принимает числовые значения. Это могут быть, например, цены на батон хлеба в соседнем магазине или курс обмена доллара на рубли в ближайшем обменном пункте. Обычно в поведении временного ряда выявляют две основные тенденции - тренд и периодические колебания.

При этом под трендом понимают зависимость от времени линейного, квадратичного или иного типа, которую выявляют тем или иным способом сглаживания (например, экспоненциального сглаживания) либо расчетным путем, в частности, с помощью метода наименьших квадратов. Другими словами, тренд - это очищенная от случайностей основная тенденция временного ряда.

Временной ряд обычно колеблется вокруг тренда, причем отклонения от тренда часто обнаруживают правильность. Часто это связано с естественной или назначенной периодичностью, например, сезонной или недельной, месячной или квартальной (например, в соответствии с графиками выплаты заплаты и уплаты налогов). Иногда наличие периодичности и тем более ее причины неясны, и задача эконометрика - выяснить, действительно ли имеется периодичность.

Элементарные методы оценки характеристик временных рядов обычно достаточно подробно рассматриваются в курсах "Общей теории статистики" (см., например, учебники ), поэтому нет необходимости подробно разбирать их здесь. (Впрочем, о некоторых современных методах оценивания длины периода и самой периодической составляющей речь пойдет ниже.)

Характеристики временных рядов . Для более подробного изучения временных рядов используются вероятностно-статистические модели. При этом временной ряд X(t) рассматривается как случайный процесс (с дискретным временем) основными характеристиками являются математическое ожидание X(t) , т.е.

дисперсия X(t) , т.е.

и автокорреляционная функция временного ряда X(t)

т.е. функция двух переменных, равная коэффициенту корреляции между двумя значениями временного ряда X(t) и X(s).

В теоретических и прикладных исследованиях рассматривают широкий спектр моделей временных рядов. Выделим сначала стационарные модели. В них совместные функции распределения для любого числа моментов времени k , а потому и все перечисленные выше характеристики временного ряда не меняются со временем . В частности, математическое ожидание и дисперсия являются постоянными величинами, автокорреляционная функция зависит только от разности t-s . Временные ряды, не являющиеся стационарными, называются нестационарными.

Линейные регрессионные модели с гомоскедастичными и гетероскедастичными, независимыми и автокоррелированными остатками. Как видно из сказанного выше, основное - это "очистка" временного ряда от случайных отклонений, т.е. оценивание математического ожидания. В отличие от простейших моделей регрессионного анализа, рассмотренных в главе 5, здесь естественным образом появляются более сложные модели. Например, дисперсия может зависеть от времени. Такие модели называют гетероскедастичными, а те, в которых нет зависимости от времени - гомоскедастичными. (Точнее говоря, эти термины могут относиться не только к переменной "время", но и к другим переменным.)

Далее, в главе 5 предполагалось, что погрешности независимы между собой. В терминах настоящей главы это означало бы, что автокорреляционная функция должна быть вырожденной - равняться 1 при равенстве аргументов и 0 при их неравенстве. Ясно, что для реальных временных рядов так бывает отнюдь не всегда. Если естественный ход изменений наблюдаемого процесса является достаточно быстрым по сравнению с интервалом между последовательными наблюдениями, то можно ожидать "затухания" автокорреляции" и получения практически независимых остатков, в противном случае остатки будут автокоррелированы.

Идентификация моделей. Под идентификацией моделей обычно понимают выявление их структуры и оценивание параметров. Поскольку структура - это тоже параметр, хотя и нечисловой (см. главу 8), то речь идет об одной из типовых задач эконометрики - оценивании параметров.

Проще всего задача оценивания решается для линейных (по параметрам) моделей с гомоскедастичными независимыми остатками. Восстановление зависимостей во временных рядах может быть проведено на основе методов наименьших квадратов и наименьших модулей, рассмотренных в главе 5 моделей линейной (по параметрам) регрессии. На случай временных рядов переносятся результаты, связанные с оцениванием необходимого набора регрессоров, в частности, легко получить предельное геометрическое распределение оценки степени тригонометрического полинома.

Однако на более общую ситуацию такого простого переноса сделать нельзя. Так, например, в случае временного ряда с гетероскедастичными и автокоррелированными остатками снова можно воспользоваться общим подходом метода наименьших квадратов, однако система уравнений метода наименьших квадратов и, естественно, ее решение будут иными. Формулы в терминах матричной алгебры, о которых упоминалось в главе 5, будут отличаться. Поэтому рассматриваемый метод называется "обобщенный метод наименьших квадратов (ОМНК)" (см., например, ).

Замечание. Как уже отмечалось в главе 5, простейшая модель метода наименьших квадратов допускает весьма далекие обобщения, особенно в области системам одновременных эконометрических уравнений для временных рядов. Для понимания соответствующей теории и алгоритмов необходимо профессиональное владение матричной алгеброй. Поэтому мы отсылаем тех, кому это интересно, к литературе по системам эконометрических уравнений и непосредственно по временным рядам , в которой особенно много интересуются спектральной теорией, т.е. выделением сигнала из шума и разложением его на гармоники. Подчеркнем в очередной раз, что за каждой главой настоящей книги стоит большая область научных и прикладных исследований, вполне достойная того, чтобы посвятить ей много усилий. Однако из-за ограниченности объема книги мы вынуждены изложение сделать конспективным.

Предыдущая

Характеристики временных рядов. Для более подробного изучения временных рядов используются вероятностно-статистические модели. При этом временной ряд X(t) рассматривается как случайный процесс (с дискретным временем) основными характеристиками являются математическое ожидание X(t), т.е.

дисперсия X(t), т.е.

и автокорреляционная функция временного ряда X(t)

т.е. функция двух переменных, равная коэффициенту корреляции между двумя значениями временного ряда X(t) и X(s).

В теоретических и прикладных исследованиях рассматривают широкий спектр моделей временных рядов. Выделим сначала стационарные модели. В них совместные функции распределения для любого числа моментов времени k, а потому и все перечисленные выше характеристики временного ряда не меняются со временем. В частности, математическое ожидание и дисперсия являются постоянными величинами, автокорреляционная функция зависит только от разности t-s. Временные ряды, не являющиеся стационарными, называются нестационарными.

Под временным рядом понимают упорядоченную во времени последовательность значений одной или конечного множества случайных величин. В первом случае говорят об одномерном временном ряде, во втором - о многомерном временном ряде. Здесь будут рассматриваться только одномерные временные ряды. Одномерный временной ряд называется стационарным, если его вероятностные характеристики постоянны. Временной ряд называется нестационарным, если хотя бы одна из вероятностных характеристик непостоянна. Последовательность случайных величин у 1 , у 2 , . . . или у -1 , у 0 , у 1 , . . называется случайным процессом с дискретным параметром времени.

Поскольку важна последовательность во времени появления следующего значения временного ряда, а не конкретное значение времени появления, то во временных рядах в качестве аргумента используют номер отсчета значения временного ряда. Например:

x(1), x(2), ... ,x(k), ...

где x(k) - значение временного ряда в k-том по порядку наблюдении; k - номер наблюдения.

В большинстве практических приложений рассматривают стационарные и нестационарные по математическому ожиданию временные ряды с нормальным законом распределения значений ряда. Это означает, что:

стационарный ряд: x(k) є (µ, у 2) , µ = const, у 2 = const;

нестационарный ряд: x(k) є (µ, у 2) , µ = var, у 2 = const.

Ниже приведена реализация стационарного временного ряда:

Прогнозируемость временного ряда.

Для прогнозирования временного ряда необходимо построить его модель. Прогнозируемость ряда возможна лишь тогда, когда существует вероятностная (аналитическая) связь последующих значений ряда от предыдущих. Прогнозируемость стационарного временного ряда определяется с помощью автокорреляционной функции (АКФ):

с(m) = M[(x(k) - µ)*(x(k + m) - µ)]/у 2

где: с(m) - значение автокорреляционной функции на сдвиге m временного ряда x(k)

Оценки АКФ ряда имеют вид:

Очевидно, что с(0) = 1, поскольку это корреляция временного ряда на самого себя.

Стационарный временной ряд прогнозируем, если m>0 существует с(m) ? 0.

Стационарный временной ряд непрогнозируем, если для любого m>0 с(m) = 0. Такой ряд называют "белым шумом".

Поскольку, АКФ это значения коэффициентов корреляции, то она является функцией неслучайных значений.

Оценивание АКФ осуществляется по реализации временного ряда. Если реализация содержит n значений, то оценка автокорреляционной функции имеет вид:

где: r(m) - оценка АКФ; x - среднее значение реализации временного ряда; S 2 - оценка дисперсии реализации временного ряда.

При проверке прогнозируемости временного ряда длина реализации должна быть не менее 20 - 30 наблюдений.

Следует обратить внимание, что прогнозирование временных рядов рассмотренным методом предполагает выполнение двух условий:

  • 1. Случайная величина е(k) "белого шума", как составляющая моделей, должна подчиняться нормальному закону распределению с нулевым математическим ожиданием и конечной дисперсией у е 2 .
  • 2. Дисперсия "белого шума" у е 2 должна быть величиной постоянной.

Формула вычисления прогноза имеет вид:

x(k) = 27,2661 - 0,900766*

где x(k) - прогноз по модели k-го значения временного ряда.

Идентификация модели стационарного временного ряда

Идентификация модели. Для прогнозирования будущих показателей на основе имеющихся временных рядов необходимо идентифицировать модель, которая наилучшим образом описывает процесс порождения выборочного временного ряда. Для идентификации такой модели можно воспользоваться расчетной автокорреляционной функцией. Из множества моделей для описания динамики временных рядов чаще всего используются три: модель белого шума, авторегрессионная модель первого порядка и авторегрессионная модель второго порядка. Если расчетная автокорреляционная функция представляет собой совокупность незначимых автокорреляций, это явное указание на то, что изменчивость данного времени n-ого ряда лучше всего охарактеризовать как "белый шум", или случайные флуктуации.

Основная идея, лежащая в основе идентификации модели временного ряда, остается одной и той же и для простых, и для сложных моделей: соответствие структуры наблюдаемых данных известной структуре, связываемой с определенным классом моделей. После того как модель предварительно идентифицирована, производится оценка ее параметров.

Диагностическая проверка. Так как в основе идентификации модели временного ряда лежит до некоторой степени субъективная процедура, иногда рекомендуется оценить адекватность идентифицированной модели путем проверки значимости автокорреляционной функции остатков данной модели. Это целесообразно, поскольку остатки модели временного ряда не являются автокоррелированными.

Однако автокорреляционная функция стационарного временного ряда не позволяет однозначно идентифицировать модель ряда. Это возможно с использованием второй дополнительной функции - частной автокорреляционной функции (ЧАКФ). Значения ЧАКФ - это значение m-го коэффициента в представлении временного ряда процессом авторегрессии порядка m. Пусть имеется стационарный временной ряд x(k). Рассмотрим следующие представления временного ряда через процесс авторегрессии:

x(k) - м = a 11 *

x(k) - м = a 12 * + a 22 *

x(k) - м = a 13 * + a 23 * + a 33 *

... ... ... ... ... ... ... ... ...

x(k) - м = a 1 * + a 2 * + a 33 * + ... + a mm *

Значениями ЧАКФ для сдвигов 1, 2, 3, ..., m являются значения коэффициентов: a 11 , a 22 , a 33 , ..., a mm . График ЧАКФ может иметь вид:

После оценивания ЧАКФ необходимо для каждого m проверить гипотезу о равенстве нулю соответствующего коэффициента частной автокорреляции. В программах статистической обработки данных для каждого из коэффициентов вычисляются критические значения, которые на графике оценки ЧАКФ приобретают вид контрольных границ.

При идентификации модели как правило пользуются следующими правилами:

  • 1. Если h первых значений АКФ отличны от нуля, а ЧАКФ по модулю асимптотически стремится к нулю, то имеет место процесс АРСС(0,h) - скользящего среднего порядка h.
  • 2. Если h первых значений ЧАКФ отличны от нуля, а АКФ по модулю асимптотически стремится к нулю, то имеет место процесс АРСС(h,0) - авторегрессии порядка h.
  • 3. Если значения АКФ и ЧАКФ по модулю асимптотически стремятся к нулю, то имеет место смешанный процесс АРСС(p,q).

ВВЕДЕНИЕ

Существующие модели временных рядов широко используются в процессе изучения динамики реальных явлений различной природы. Они зачастую применяются в исследованиях динамики грузо - и пассажиропотоков, товарных и складских запасов, миграционных процессов, анализе химических процессов, моделировании разнообразных природных событий. Наиболее активно модели временных рядов применяются в анализе финансовых рынков, при оценке изменений финансовых показателей, прогнозировании цен на различные товары, курсов акций, соотношений курсов валют и т. п.

Широкий круг реальных общественных и естественных процессов обычно может быть представлен набором последовательных значений оцениваемого показателя у 1 , у 2 ,..., у t ,..., у Т, которые фиксируются в определенные моменты времени t=1,2,... Т, так что интервал (t, t+1) является постоянным. Указанный набор значений у t , t=1,2,... обычно называется временным рядом (временной серией). Такой ряд представляет собой дискретный временной процесс.

Изменения значений у t во времени в реальной жизни обычно происходят под воздействием каких-либо причин, факторов. Однако их многообразие, сложность измерения, неопределенность в предположениях о существовании взаимосвязей с переменной у значительно затрудняет обоснование и построение «подходящей» для описания процесса у t , t=1,2,... многофакторной эконометрической модели классического типа. Поэтому часто выдвигается предположение о том, что совокупное влияние этих факторов формирует внутренние закономерности в отношении процесса у t .

Такое предположение направлено на применение для описания реальных временных процессов эконометрических моделей из специфического класса моделей временных рядов.

МОДЕЛИ СТАЦИОНАРНЫХ ВРЕМЕННЫХ РЯДОВ

Особенности стационарных временных рядов и тесты на стационарность

Все модели временных рядов имеют общее свойство, которое основано на предположении значительной зависимости текущего значения уровня показателя y t от его предыстории. Иными словами уровень показателя y t генерируется значениями y t-1 , y t-2 ,... на базе характерных для данного временного ряда закономерностях.

Указанное допущение выражается общим уравнением:

y t = f(y t-1 , y t-2 , …) + t (1.1)

где t - ошибка модели в момент t.

Здесь функция f отражает характер взаимосвязей, существующих в рассматриваемом временном ряду у t , t=1,2,... Удачный подбор функции f обусловливает высокую степень приближения правой «детерминированной» части выражения (1.1) к реальным значениям ряда. Степень этого приближения обычно характеризуется оценками и свойствами ошибки ряда t , t=1,2,... в данном случае имеется в виду, прежде всего минимальная дисперсия, соответствие белому шуму и т. п.

Для широкого круга процессов функция f имеет линейный вид. Например,

y t = а 1 y t-1 + а n y t-n + t .

Линейные модели временных рядов применяются, как правило, для описания стационарных процессов, при этом имеются в виду стационарные процессы второго порядка. У стационарного процесса n-го порядка значения всех своих моментов порядка n и ниже на всех временных отрезках, входящих в интервал t=1,2,..., Т отличаются постоянством. Строго стационарные процессы отличаются тем, что у них моменты всех порядков постоянны. Из сказанного следует, что для любых двух интервалов времени (Т 1 , Т 2) и (Т 3 , Т 4) для стационарного процесса второго порядка у t должны выполняться условия:

равенство математических ожиданий;

Равенство дисперсий;

Равенство однопорядковых коэффициентов автокорреляций.

Математически данные условия выражаются соотношениями:


где - оценки математических ожиданий;

D 1 (y), D 2 (y) - оценки дисперсий;

Оценки коэффициентов автокорреляции i-го порядка процесса у t на 1-ом и на 2-ом интервалах соответственно;

Среднее значение процесса (оценка математического ожидания) на интервале (1,Т);

D(y) - оценка дисперсии процесса на интервале (1,Т).

При реальном изучении стационарных временных рядов равенства (1.2)-(1.4) рассматриваются в статистическом смысле. Это дает основания утверждать, что даже при неполном соответствии равенство гипотеза о постоянстве математического ожидания процесса у t может быть принята в случае удовлетворения значений и определенному статистическому критерию.

С целью проверки соответствия временного ряда у t , t=1,2,... стационарному процессу и выполнимости условий (1.2)-(1.4) применяются различные тесты. Если результаты одного из них не дают возможности утверждать об истинности или ложности выдвинутой гипотезы, то может возникнуть необходимость использовать несколько тестов для проверки одного и того же условия.

Всю совокупность тестов на стационарность временных рядов можно разделить на три основные группы: непараметрические, полупараметрические и параметрические тесты.

Непараметрические тесты не выдвигают заранее каких-либо сведений о законе распределения тестируемого временного ряда, его параметрах. Они основаны на изучении взаимосвязей между порядками следования образующих его значений, позволяют выявить наличие или отсутствие закономерностей в продолжительности и (или) чередовании их серий, образованных, например, последовательностями единиц совокупности с одинаковыми знаками, сменой знаков у этих единиц и т.п.

В полупараметрических тестах используются относительно слабые предположения о характере распределения значений временного ряда. Они отражают общие свойства функции распределения приростов значений ряда - симметричности, расположения квантилей.

При использовании методов этой группы оценки параметров распределения оцениваются по порядковым статистикам: среднее по медиане, среднеквадратическое отклонение - по размаху уровней ряда и т. п.

Параметрические тесты используют при относительно строгих предположениях о законе распределения временного ряда и его параметров. Данные тесты позволяют оценить степень приближенности эмпирических (наблюдаемых) характеристик распределения временного ряда к рассчитанным теоретическим уровням.

Именно эта степень приближенности позволяет принять или отвергнуть гипотезу о соответствии свойств рассматриваемого ряда стационарному процессу.

Можно сформулировать цели статистического анализа временного ряда следующим образом:

по имеющейся траектории x(1), x(2), …x(N) анализируемого временного ряда x(t) требуется:

1) определить, какие из неслучайных функций (соответствующих трендовому, сезонному и циклическому компонентам) при­сутствуют в разложении , т. е. определить значения индика­торов  i в разложении

2) построить «хорошие» оценки для тех неслучайных функций, которые присутствуют в разложении;

3) подобрать модель, адекватно описывающую поведение «случай­ных остатков u(t), и статистически оценить параметры этой модели.

Успешное решение перечисленных задач является основой для достиже­ния конечных прикладных целей исследования и, в первую очередь, для решения задачи кратко- и среднесрочного прогноза значений временного ряда.

Автоковариационная и автокорреляционная функции

Для идентификации временных рядов удобно использовать специальные функции: автоковариационную и автокорреляционную.

Автоковариационная функция

Из предположения о строгой стационарности временного ряда x(t) ковариация между значениями x(t) и x(t  ) будет зависеть только от величины «сдвига по времени»  (и не будет зависеть от t). Эта ковариация называется автоковариацией (поскольку измеряет ковариацию для различных значений одного и того же временного ряда x(t) и определяется соотношением:

При анализе величины () в зависимости от значения  принято говорить об автоковариационной функции (). Значения автоковариационной функции могут быть статистически оценены по имеющимся наблюдениям временного ряда по формуле

, где =1,2, … N-1. Очевидно

(0)=  2 =М;

()=cov(x(t+), x(t)) = cov(x(t), x(t+)) = cov(x(t), x(t-));

()= cov(x(t), x(t-))= (-).

Автокорреляционная функция

Одно из главных отличий последовательности наблюдений, образующих временной ряд, от случайной выборки заключается в том, что члены временного ряда являются, вообще говоря, статистически взаимозависмыми. Степень тесноты статистической связи между двумя случайными величинами может быть измерена парным коэффициентом корреляции. Так что степень статистической связи между двумя наблюдениями временного ряда, «разнесенными» (по времени) на  единиц, определится величиной коэффициента корреляции

Коэффициент корреляции r() измеряет корреляцию, существующую между членами одного и того же временного ряда, поэтому его принято называть коэффициентом автокорреляции. При анализе изменения величиныr() в зависимости от значенияпринято говорить об автокорреляционной функцииr(). График автокорреляционной функции называют коррелограммой. Автокорреляционная функция, в отличие от автоковариационной, безразмерна. Ее значения могут колебаться в пределах от –1 до +1. Очевидно, чтоr() =r(-), а(0) =1.

Поиск модели, адекватно описывающей поведение случайных остат­ков u(t) анализируемого временного ряда x(t), производят, как правило, в рамках некоторого специального класса случайных временных последовательностей - класса стационар­ных временных рядов. На интуитивном уровне стационарность временно­го ряд а мы связываем с требованием, чтобы он имел постоянное сред­нее значение и колебался вокруг этого среднего с постоянной дисперсией . В некоторых случаях временные последовательности этого класса могут воспроизводить и поведение самого анализируемого временного ряда x(t).

Ряд x(t) называется строго стационар­ным (или стационарным в узком смысле), если совместное распреде­ление вероятностей m наблюдений x(t 1), x(t 2), …, x(t m) такое же, как и для m наблюдений x(t 1 +), x(t 2 +), …x(t m +), при любых m, t 1 , t 2 , …, t m и .

Другими словами, свойства строго стационарного временного ряда не меняются при изменении начала отсчета времени. В частности, при m= 1 из предположения о строгой стационарности временного ряда x(t) следует, что закон распределения вероятностей случайной величины x(t) не зависит от t, а значит, не зависят от t и все его основные числовые характеристики, в том числе: среднее значение М(x(t)) =  и дисперсия D(x(t))= М(x(t) –) 2 =  2 .

Очевидно, значение μ определяет постоянный уровень, относитель­но которого разбросаны значения анализируемого временного ряда x(t), а посто­янная величина  2 характеризует размах этого разброса. Поскольку закон распределения вероятностей случайной величины x(t) одинаков при всех t, то он сам и его основные числовые характеристики могут быть оценены по наблюдени­ям x(1), x(2), …x(N). В частности:

-оценка среднего значения,

- оценка дисперсии.

Под методами сглаживания временного ряда понимается выделение неслучайной составляющей . Предположим, что известен общий вид неслучайной составляющей F(t) для ряда x(t)=F(t,)+ u(t). Это может быть полином, ряд Фурье и т.д. Тогда возникает задача оценки параметров . В такой постановке задачи используются аналитические методы.

Если вид неслучайной составляющей неизвестен F(t), то используются алгоритмические методы. К таким методам относится метод скользящего среднего, лежащий в основе более сложных процедур сглаживания.

Временным рядом (динамическим рядом ) называется набор значений какого-либо показателя за несколько последовательных моментов или периодов времени. Отдельные наблюдения называются уровнями ряда .

В общем виде при исследовании экономических процессов временного ряда выделяются несколько составляющих:

y t = u t + v t + c t + ε t (t= 1, 2, …, n),

где u t – тренд, v t – сезонная компонента, c t – циклическая компонента, ε t – случайная компонента.

Стационарные временные ряды.

Важное значение в анализе временных рядов имеют стационарные временные ряды, вероятностные свойства которых не изменяются во времени. Временной ряд y t (t= 1, 2, …, n ) называется строго стационарным , если совместное распределение вероятностей n наблюдений y 1 , y 2 ,…, y n такое же, как и n наблюдений y 1+τ , y 2+τ ,…, y n +τ при любых n, t, и τ . Таким образом, свойства строго стационарных рядов не зависят от момента времени t .

Степень тесноты связи между последовательностями наблюдений временного ряда y 1 , y 2 , …, y n и y 1+τ , y 2+τ , …, y n +τ можно оценить с помощью выборочного коэффициента корреляции r(τ) :

Так как он оценивает корреляцию между уровнями одного и того же ряда, его называют коэффициентом автокорреляции .

Функция r(τ) называется выборочной автокорреляционной функцией , а ее график - коррелограммой .

Кроме автокорреляционной функции при исследовании стационарных временных рядов рассматривают частную автокорреляционную функцию. Статистической оценкой частного коэффициента корреляции является выборочный частный коэффициент корреляции (или просто частный коэффициент корреляции ):

где r ij , r ik r jk – выборочные коэффициенты корреляции.

Так, выборочный частный коэффициент автокорреляции 1-го порядка между членами временного ряда y t и y t +2 при устранении влияния y t +1 определяется по формуле:

где r(1), r(1,2), r(2) – выборочные коэффициенты автокорреляции между y t и y t +1 , y t +1 и y t +2 , и y t и y t +2 соответственно.

Наиболее распространенным приемом устранения автокорреляции во временных рядах является подбор соответствующей модели: авторегрессионной АР(p ), скользящей средней СС(q ) или авторегрегрессионной модели скользящей средней АРСС(p,q ) для остатков модели (в литературе можно встретить англоязычные названия моделей: авторегрессионной – АR(p ), скользящей средней – MA(q ) и авторегрегрессионной модели скользящей средней АRMA(p,q ).)

Идентификацией временного ряда называется построение для ряда остатков адекватной АРСС-модели, в которой остатки представляют собой белый шум, а все регрессоры значимы. Такое представление, как правило, не единственное, и один и тот же ряд может быть идентифицирован и с помощью АР-модели, и с помощью СС-модели.



y t = β 0 + β 1 y t -1 + β 2 y t -2 +…+ β p y t - p +ε t , (t= 1, 2, …, n),

где β 0 , β 1 ,… β p – некоторые константы.

Если исследуемый процесс y t в момент t определяется его значениями только в преды-дущий период t-1 , то получаем авторегрессионную модель 1-го порядка (или модель АР(1)).

y t = β 0 + β 1 y t -1 +ε t , (t= 1, 2, …, n),

Наряду с авторегрессионными моделями временных рядов в эконометрике рассматриваются также модели скользящей средней. В них моделируемая величина задается линейной функцией от возмущений (остатков) в предыдущие моменты времени. Модель скользящей средней порядка q (модель СС(q )) имеет вид:

y t = ε t – γ 1 ε t-1 – γ 2 ε t-2 –…– γ q ε t- q (t= 1, 2, …, n).

Нередко используются и комбинированные модели временных рядов АР и СС, которые имеют вид:

y t = β 0 + β 1 y t -1 + β 2 y t -2 +…+ β p y t - p + ε t – γ 1 ε t-1 – γ 2 ε t-2 –…– γ q ε t- q .

Если все значения выборочной частной автокорреляционной функции порядка выше p незначимо отличаются от нуля, временной ряд следует идентифицировать с помощью модели, порядок авторегрессии которой не выше p .

Если все значения выборочной автокорреляционной функции порядка выше q незначимо отличаются от нуля, временной ряд следует идентифицировать с помощью модели скользящей средней, порядок которой не выше q .

Нестационарные временные ряды.

Пусть имеется временной ряд

y t = ρy t -1 + ξ t .

Предположим, что ошибки ξ t независимы и одинаково распределены, т.е. образуют белый шум. Перейдем к разностным величинам:

Δy t = λy t -1 + ξ t ,

где Δy t = y t – y t -1 , λ= ρ-1.

Если ряд Δy t является стационарным, то исходный нестационарный ряд y t называется интегрируемым (или однородным ).

Нестационарный ряд y t называется интегрируемым (однородным) k-го порядка , если после k -кратного перехода к приращениям

d k y t = d k-1 y t – d k-1 y t-1 ,

где d 1 y t = Δy t , получается стационарный ряд d k y t .

Если при этом стационарный ряд d k y t корректно идентифицируется как АРСС(p,q ), то нестационарный ряд y t обозначается как АРПСС(p,k,q ). Это означает модель авторегрессии – проинтегрированной скользящей средней (другое обозначение - ARIMA(p,k,q )) порядков p , k , q, которая известна как модель Бокса-Дженкинса. Процедура подбора такой модели реализована во многих эконометрических пакетах.

Модели с распределенными лагами.

При исследовании экономических процессов приходится моделировать ситуации, когда значение результативного признака в текущий момент времени t формируется под воздействием ряда факторов, действовавших в прошлые моменты времени. Величину l , характеризующую запаздывание в воздействии фактора на результат, называют лагом , а временные ряды самих факторных переменных, сдвинутые на один или более моментов времени, - лаговыми переменными . Модели, содержащие не только текущие, но и лаговые значения факторных переменных, называют моделями с распределенными лагами :

В случае конечной величины максимального лага модель имеет вид:

y t = a + b 0 x t + b 1 x t-1 + … + b l x t-l +ε t .

Коэффициент b 0 характеризует среднее абсолютное изменение y t при изменении x t на 1 ед. своего измерения в некоторый фиксированный момент времени t , без учета воздействия лаговых значений фактора x . Этот коэффициент называется краткосрочным мультипликатором .

Долгосрочный мультипликатор вычисляется по формуле:

b = b 0 + b 1 + … + b l .

Он показывает абсолютное изменение в долгосрочном периоде t+l результата y под влиянием изменения на 1 ед. фактора x .

Величины β j =b j /b (j = 0,…,l ) называются относительными коэффициентами модели с распределенным лагом.

Средний лаг определяется по формуле средней арифметической взвешенной:

и представляет собой средний период, в течение которого будет происходить изменение результата под воздействием изменения фактора в момент времени t . Небольшая величина среднего лага свидетельствует об относительно быстром реагировании результата на изменение фактора. Высокое его значение говорит о том, что воздействие фактора на результат будет сказываться в течение длительного периода времени.

Медианный лаг (l Me) – представляет собой период времени, в течение которого будет реализована половина общего воздействия фактора на результат и определяется следующим соотношением:

Оценка модели с распределенными лагами зависит от того, конечное или бесконечное число лагов она содержит.

Метод Алмон.

Предполагается, что веса текущих и лаговых значений объясняющих переменных подчиняются полиномиальному закону распределения:

b j = c 0 + c 1 ·j + c 2 ·j 2 + … + c k ·j k . (5.1)

Уравнение регрессии примет вид:

y t = a + c 0 ·z 0 + c 1 ·z 1 + c 2 ·z 2 + … + c k ·z k + ε t , (5.2)

где , i = 1,…,k ; j =0,…,l . (5.3)

Схема расчета параметров модели:

1. устанавливается максимальная величина лага l ;

2. определяется степень полинома k , описывающего структуру лага;

3. по соотношениям (5.3) рассчитываются значения переменных z 0 , z 1 ,…, z k ;

4. обычным методом наименьших квадратов определяются
параметры уравнения линейной регрессии y t от z i (5.2);

5. рассчитываются параметры исходной модели по формулам (5.1).

Метод Койка.

Предполагается, что коэффициенты при лаговых значениях переменной убывают в геометрической прогрессии:

, j = 1, 2, … 0 < λ < 1. (5.4)

Уравнение регрессии преобразуется к виду:

y t = a + b 0 x t + b 0 ·λ x t-1 + b 0 ·λ 2 x t-2 +… +ε t .

После ряда преобразований получается уравнение авторегрессии первого порядка:

y t = a·(1 – λ) + b 0 ·x t + (1 – λ) y t-1 + u t ,

где u t = ε t λ ε t-1 .

Определив параметры данной модели, находятся λ и оценки параметров a и b 0 исходной модели. Далее из соотношения (5.4) определяются параметры модели b 1 , b 2 ,… .

Величина среднего лага в модели Койка определяется формулой:

Пример 5. По данным о динамике товарооборота (Y , млрд. руб.) и доходах населения (X , млрд. руб.) была получена следующая модель с распределенными лагами:

Y t = 0,50∙X t + 0,25∙X t -1 + 0,13∙X t -2 + 0,13∙X t -3 + ε t .

(0,06) (0,04) (0,04) (0,06)

В скобках указаны значения стандартных ошибок для коэффициентов регрессии. Значение R 2 = 0,98.

Задание:

1. Проанализируйте полученные результаты регрессионного анализа.

2. Дайте интерпретацию параметров модели: определить краткосрочный и долгосрочный мультипликаторы.

3. Определите величину среднего лага и медианного лага.

Решение.

1. Проверка значимости отдельных коэффициентов модели дает следующие расчетные значения t-статистики для коэффициентов:

t b 0 = 0,50/0,06 = 8,33; t b 1 = 0,25/0,04 = 6,25;

t b 2 = 0,13/0,04 = 3,25; t b 3 = 0,13/0,06 = 2,17.

Таким образом, все коэффициенты оказываются значимыми, и выбор величины лага l =3 является оправданным. Об адекватности полученной модели свидетельствует и высокое значение коэффициента детерминации.

2. Краткосрочный мультипликатор в модели равен b 0 = 0,50. Он показывает, что увеличение доходов на 1 млрд. руб. ведет в среднем к росту товарооборота на 0,5 млрд. руб. в том же периоде.

Долгосрочный мультипликатор для полученной модели составит:

b = b 0 + b 1 + b 2 + b 3 = 0,50 + 0,25 + 0,13 + 0,13 = 1,01.

Получаем, что увеличение доходов на 1 млрд. руб. в настоящий момент времени в долгосрочной перспективе (через 3 месяца) приведет к росту товарооборота на 1,01 млрд. руб.

Рассчитаем относительные коэффициенты модели:

β 0 = 0,50/1,01 = 0,495; β 1 = 0,25/1,01 = 0,248;

β 2 = 0,13/1,01 = 0,129; β 3 = 0,13/1,01 = 0,129.

Следовательно, 49,5% общего увеличения товарооборота, вызванного ростом доходов населения, происходит в текущий момент времени; 24,8% - в момент времени (t +1); 12,9% - в моменты времени (t +2) и (t +3).

3. Средний лаг в модели определяется следующим образом:

Величина среднего лага меньше месяца, что подтверждает, что эффект роста доходов населения на объем товарооборота проявляется сразу же.

Медианный лаг для данной модели составляет чуть более 1 месяца. ¨

Характерной чертой адаптивных методов прогнозирования является их способность непрерывно учитывать эволюцию динамических характеристик изучаемых процессов, «адаптироваться» к этой эволюции, придавая тем больший вес, тем более высокую информационную ценность имеющимся наблюдениям, чем ближе они к текущему моменту прогнозирования.

В основе процедуры адаптации лежит метод проб и ошибок. По модели делается прогноз на один интервал по времени. Через один шаг моделирования анализируется результат: насколько он далек от фактического значения. Затем в соответствии с моделью происходит корректировка. После этого процесс повторяется. Таким образом, адаптация осуществляется рекуррентно с получением каждой новой фактической точки ряда.

Методы экспоненциального сглаживания. Модель Брауна.

Пусть анализируемый временной ряд x(t) представлен в виде:

x(t) = a 0 + ε(t) ,

где a 0 – неизвестный параметр, не зависящий от времени, ε(t) - случайный остаток со средним значением, равным нулю, и конечной дисперсией.

В соответствии с методом Брауна прогноз x*(t+τ) для неизвестного значения x(t+τ) по известной до момента времени t траектории ряда x(t) строится по формуле:

x*(t; τ) = S(t),

где значение экспоненциально взвешенной скользящей средней S (t ) определяется по рекуррентной формуле:

S(t) = αx(t) + (1-α) S(t-1).

Коэффициент сглаживания α можно интерпретировать как коэффициент дисконтирования , характеризующий меру обесценивания информации за единицу времени. Из формулы следует, что экспоненциально взвешенная скользящая средняя является взвешенной суммой всех уровней ряда x(t) , причем веса уменьшаются экспоненциально по мере удаления в прошлое.

В качестве S (0) берется, как правило, среднее значение ряда динамики или среднее значение нескольких начальных уровней ряда.

Случай линейного тренда: x(t) = a 0 + a 1 t + ε(t) .

В этом случае прогноз x*(t; τ) будущего значения определяется соотношением:

x*(t; τ) = ,

а пересчет коэффициентов осуществляется по формулам:

Начальные значения коэффициентов берутся из оценки тренда линейной функцией.

Модель Хольта.

В модели Хольта введено два параметра сглаживания α 1 и α 2 (0< α 1 , α 2 <1). Прогноз x*(t;l) на l

x*(t; τ) = ,

а пересчет коэффициентов осуществляется по формулам:

Модель Хольта-Уинтерса.

Эта модель помимо линейного тренда учитывает и сезонную составляющую. Прогноз x*(t;τ) на τ шагов по времени определяется формулой:

x*(t;τ) = ,

где f(t) – коэффициент сезонности, а T – число временных тактов (фаз), содержащихся в полном сезонном цикле.

Видно, что в данной модели сезонность представлена мультипликативно . Формулы обновления коэффициентов имеют вид:

Модель Тейла-Вейджа.

Если исследуемый временной ряд имеет экспоненциальную тенденцию с мульти-пликативной сезонностью, то после логарифмирования обеих частей уравнения получается модель с линейной тенденцией и аддитивной сезонностью или модель Тейла-Вейджа.

Имеется модель:

x(t) = a 0 (t) + g(t) + δ(t),

a 0 (t) = a 0 (t-1) + a 1 (t).

Здесь a 0 (t) – уровень процесса после устранения сезонных колебаний, a 1 (t) – аддитивный коэффициент роста, ω(t) – аддитивный коэффициент сезонности и δ(t) – белый шум.

Прогноз x*(t;τ) на τ шагов по времени определяется формулой:

x*(t;τ) = .

Коэффициенты вычисляются рекуррентным способом по формулам:

Для определения оптимальных значений параметров адаптации перебирают различные наборы их значений и сравнивают получающиеся при этом среднеквадратические ошибки прогнозов.