Графический метод обнаружения автокорреляции остатков. Виды и методы определения автокорреляции остатков. Суть и причины автокорреляции

Автокорреляция остатков обычно встречается в регрессионном анализе при использовании данных временных рядов. Поэтому в дальнейших выкладках вместо символа i используется символ t, отражающий момент наблюдения, объем выборки при этом будем обозначать символом T. В экономических задачах значительно чаще встречается так называемая положительная автокорреляция (), нежели отрицательная автокорреляция ().

В большинстве случаев положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов.

Среди основных причин, вызывающих появление автокорреляции, можно выделить ошибки спецификации, инерцию в изменении экономических показателей, эффект паутины, сглаживание данных.

Последствия автокорреляции в определенной степени сходны с последствиями гетероскедастичности. Среди них при применении МНК обычно выделяют следующие:

1. Оценки параметров, оставаясь линейными и несмещенными, перестают быть эффективными. Следовательно, они перестают обладать свойствами наилучших линейных несмещенных оценок (BLUE-оценок).

2. Дисперсии оценок являются смещенными. Часто дисперсии, вычисляемые по стандартным формулам, являются заниженными, что влечет за собой увеличение -статистик. Это может привести к признанию статистически значимыми объясняющие переменные, которые в действительности таковыми могут и не являться.

3. Оценка дисперсии регрессии является смещенной оценкой истинного значения , во многих случаях занижая его.

4. В силу вышесказанного выводы по - и -статистикам, определяющим значимость коэффициентов регрессии и коэффициента детерминации, возможно, будут неверными. Вследствие этого ухудшаются прогнозные качества модели.

В силу неизвестности значений параметров уравнения регрессии неизвестными будут также и истинные значения отклонений . Поэтому выводы об их независимости осуществляются на основе оценок , полученных из эмпирического уравнения регрессии. Рассмотрим возможные методы определения автокорреляции.

1) Графический метод.

Существует несколько вариантов графического определения автокорреляции. Один из них, увязывающий отклонения с моментами их получения (их порядковыми номерами ), приведен на рис. 5.5. Это так называемые последовательно-временные графики. В этом случае по оси абсцисс обычно откладываются либо время (момент) получения статистических данных, либо порядковый номер наблюдения, а по оси ординат – отклонения (либо оценки отклонений ).

Рис. 5. 5

Естественно предположить, что на рис. 5.5, а-г имеются определенные связи между отклонениями, т.е. автокорреляция имеет место. Отсутствие зависимости на рис. 5.5,д скорее всего свидетельствует об отсутствии автокорреляции.

Например, на рис. 5.5,б отклонения вначале в основном отрицательные, затем положительные, потом снова отрицательные. Это свидетельствует о наличии между отклонениями определенной зависимости. Более того, можно утверждать, что в этом случае имеет место положительная автокорреляция остатков. Она становится весьма наглядной, если график 5.5,б дополнить графиком зависимости от (рис. 5.6).

Рис. 5. 6

Подавляющее большинство точек на этом графике расположено в I и III четвертях декартовой системы координат, подтверждая положительную зависимость между соседними отклонениями.

Следует заметить, что в современных компьютерных прикладных программах для решения задач по эконометрике аналитическое выражение регрессии дополняется графическим представлением результатов. На график реальных колебаний зависимой переменной накладывается график колебаний переменной по уравнению регрессии. Сопоставив эти два графика, можно выдвинуть гипотезу о наличии автокорреляции остатков. Если эти графики пересекаются редко, то можно предположить наличие положительной автокорреляции остатков.

2) метод рядов.

Этот метод достаточно прост: последовательно определяются знаки отклонений . Например,

(-----)(+++++++)(---)(++++)(-),

т.е. 5 «-», 7 «+», 3 «-», 4 «+», 1 «-» при 20 наблюдениях.

Ряд определяется как непрерывная последовательность одинаковых знаков. Количество знаков в ряду называется длиной ряда .

Визуальное распределение знаков свидетельствует о неслучайном характере связей между отклонениями. Если рядов слишком мало по сравнению с количеством наблюдений , то вполне вероятна положительная автокорреляция. Если же рядов слишком мало, то вероятна отрицательная автокорреляция. Для более детального анализа предлагается следующая процедура. Пусть

– объем выборки;

общее количество знаков «+» при наблюдениях (количество положительных отклонений );

– общее количество знаков «-» при наблюдениях (количество положительных отклонений );

– количество рядов.

При достаточно большом количестве наблюдений () и отсутствии автокорреляции СВ имеет асимптотически нормальное распределение с

Тогда, если , то гипотеза об отсутствии автокорреляции не отклоняется.

Для небольшого числа наблюдений () Свед и Эйзенхарт разработали таблицы критических значений количества рядов при наблюдениях. Суть таблиц в следующем.

На пересечении строки и столбца определяются нижнее и верхнее значения при уровне значимости .

При установлении автокорреляции необходимо в первую очередь

проанализировать правильность спецификации модели.Если после ряда

усовершенсвований регрессии автокорреляция по-прежнему имеет место, то возможны определенные преобразования, устраняющие автокорреляцию. Среди них выделяется авторегрессионная схема первого порядка AR(1).

Контрольные вопросы:

1. В чем суть гетероскедастичности?

2. Приведите аргументы в пользу графического теста, теста Парка и теста Глейзера.

3. Приведите схему теста Голдфельда-Квандта.

4. В чем суть метода взвешенных наименьших квадратов (ВНК)?

5. Что такое автокорреляция?

6. Назовите основные причины автокорреляции.

7. Перечислите основные методы обнаружения автокорреляции.

8. Каковы последствия автокорреляции?




Определение автокорреляции Автокорреляция (последовательная корреляция) – это корреляция между наблюдаемыми показателями во времени (временные ряды) или в пространстве (перекрестные данные). Автокорреляция остатков характеризуется тем, что не выполняется предпосылка 3 0 использования МНК:




Причины чистой автокорреляции 1. Инерция. Трансформация, изменение многих экономических показателей обладает инерционностью. 2. Эффект паутины. Многие экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом) 3. Сглаживание данных. Усреднение данных по некоторому продолжительному интервалу времени.














Пример влияния автокорреляции на случайную выборку Рассмотрим выборку из 50 независимых нормально распределенных с нулевым средним значений i. С целью ознакомления с влиянием автокорреляции будем вводить в нее положительную, а затем отрицательную автокорреляцию.


















Dependent Variable: LGHOUS Method: Least Squares Sample: Included observations: 45 ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C LGDPI LGPRHOUS ============================================================ R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criter Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) ============================================================ АВТОКОРРЕЛЯЦИЯ ПРИМЕР Зависимость расходов на жилье от располагаемого дохода и индекса цен на жилье











Последствия автокорреляции 1. Истинная автокорреляция не приводит к смещению оценок регрессии, но оценки перестают быть эффективными. 2. Автокорреляция (особенно положительная) часто приводит к уменьшению стандартных ошибок коэффициентов, что влечет за собой увеличение t-статистик. 3. Оценка дисперсии остатков S e 2 является смещенной оценкой истинного значения e 2, во многих случаях занижая его. 4. В силу вышесказанного выводы по оценке качества коэффициентов и модели в целом, возможно, будут неверными. Это приводит к ухудшению прогнозных качеств модели.






Автокорреляционная функция AutocorrelationPartial CorrelationAC PAC Q-Stat Prob. |*******. |******* |******|. |. | |******|. |. | |***** |. |. | |***** |. |. | |**** |. |. | |**** |. |. | |*** |. |. | |*** |. |. | |*** |. |. | |** |. |. | |** |. |. | |*. |. |. | |*. |. |. | |. |. |. | |. |. |. | |. |. |. | *|. |. |. | *|. |. |. | *|. |. |. |





Dependent Variable: LGHOUS Method: Least Squares Sample: Included observations: 45 ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C LGDPI LGPRHOUS ============================================================ R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criter Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) ============================================================ 3 Расходы на жилье в зависимости от доходов и реальных цен














14 Противоположный эффект в 1960 to Расходы на жилье в зависимости от доходов и реальных цен




Критерий знаков Проверяемая гипотеза: H0: автокорреляция отсутствует Последовательность проведения критерия 1.Вычислить остатки 2.Приписать каждому остатку знак (+/-) 3.Построить ряд знаков При истинности гипотезы ряд должен носить случайный характер распределения 4.Подсчитать общее количество серий (последовательностей постоянного знака) - (n) 5.Подсчитать длину самой длинной серии - (n) 6.Сравнить полученные значения с критическими


Критерий знаков Проверяемая гипотеза: H0: автокорреляция отсутствует Приблизительный критерий проверки гипотезы на уровне значимости 2,5% 5,0% : При истинности гипотезы должна выполняться система неравенств: подробности см. в учебнике Айвазян, Мхитарян «Прикладная статистика и основы эконометрики»




Критерий восходящих и нисходящих серий Проверяемая гипотеза: H0: автокорреляция отсутствует Последовательность проведения критерия 1.Вычислить остатки 2.Вычислить разницу между соседними остатками, t =e t+1 -e t 3.Приписать каждой разнице у знак (+/-) 4.Построить ряд знаков При отсутствии автокорреляции ряд должен носить случайный характер 5.Подсчитать общее количество серий (последовательностей постоянного знака) - (n) 6.Подсчитать длину самой длинной серии - (n) 7.Сравнить полученные значения с критическими






Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует Последовательность проведения критерия 1.Вычислить остатки 2.Вычислить следующие статистики: 3.Сравнить полученные значения (n) с критическим – при нулевой гипотезе (n)> * При n> * При n>60 кр"> * При n>60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):"> * При n>60 кр" title="Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует Последовательность проведения критерия 1.Вычислить остатки 2.Вычислить следующие статистики: 3.Сравнить полученные значения (n) с критическим – при нулевой гипотезе (n)> * При n>60 кр"> title="Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует Последовательность проведения критерия 1.Вычислить остатки 2.Вычислить следующие статистики: 3.Сравнить полученные значения (n) с критическим – при нулевой гипотезе (n)> * При n>60 кр">


60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):" title="Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует 3.Сравнить полученные значения с критическими При n>60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):" class="link_thumb"> 56 Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует 3.Сравнить полученные значения с критическими При n>60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона): 60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):"> 60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):"> 60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):" title="Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует 3.Сравнить полученные значения с критическими При n>60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):"> title="Критерий Аббе Проверяемая гипотеза: H0: автокорреляция отсутствует 3.Сравнить полученные значения с критическими При n>60 критическая точка уровня рассчитывается по формуле (u - критическая точка стандартного нормального закона):">




Тест Дарбина-Уотсона. Ограничения Ограничения: 1. Тест не предназначен для обнаружения других видов автокорреляции (более чем первого) и не обнаруживает ее. 2. В модели должен присутствовать свободный член. 3. Данные должны иметь одинаковую периодичность (недолжно быть пропусков в наблюдениях). 4. Тест не применим к авторегрессионным моделям, содержащих в качестве объясняющей переменной зависимую переменную с единичным лагом:






Критические точки распределения Дарбина-Уотсона Для более точного определения, какое значение DW свидетельствует об отсутствии автокорреляции, а какое – о ее наличии, построена таблица критических точек распределения Дарбина-Уотсона. По этой таблице для заданного уровня значимости, числа наблюдений n и количества объясняющих переменных m определяются два значения: d l – нижняя граница, d u – верхняя граница




Расположение критических точек распределения Дарбина-Уотсона При положительной корреляции: При отрицательной корреляции: При отсутствии корреляции: 24 0 dLdL dUdU d crit Положительная автокорреляция Отрицательная автокорреляция Отсутствие автокорреляции d crit 4-d L 4-d U






Dependent Variable: LGHOUS Method: Least Squares Sample: Included observations: 45 ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C LGDPI LGPRHOUS ============================================================ R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criter Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) ============================================================ Как и следовало ожидать- имеем положительную автокорреляцию остатков ТЕСТ ДАРБИНА-УОТСОНА ДЛЯ ПРОЦЕССА AR(1) dLdL dUdU (n = 45, k = 3, 1% level)




Устранение автокорреляции первого порядка. Обобщения Рассмотренное авторегрессионное преобразование может быть обобщено на: 1) Произвольное число объясняющих переменных 2) Преобразования более высоких порядков AR(2), AR(3) и т.д.: Однако на практике значения коэффициента автокорреляции обычно неизвестны и его необходимо оценить. Существует несколько методов оценивания.






Итеративная процедура Кохрейна-Оркатта (на примере парной регрессии) 1. Определение уравнения регрессии и вектора остатков: 2. В качестве приближенного значения берется его МНК-оценка: 3. Для найденного * оцениваются коэффициенты 0 1: 4. Подставляем в (*) и вычисляем Возвращаемся к этапу 2. Критерий остановки: разность между текущей и предыдущей оценками * стала меньще заданной точности.


Итеративная процедура Хилдрета-Лу (поиск по сетке) 1. Определение уравнения регрессии и вектора остатков: 2. Оцениваем регрессию для каждого возможного значения [ 1,1] с некоторым достаточно малым шагом, например 0,001; 0,01 и т.д. 3. Величина *, обеспечивающая минимум стандартной ошибки регрессии принимается в качестве оценки автокорреляции остатков.


Итеративные процедуры оценивания коэффициента. Выводы 1. Сходимость процедур достаточно хорошая. 2. Метод Кохрейна-Оркатта может «попасть» в локальный (а не глобальный) минимум. 3. Время работы процедуры Хилдрета-Лу значительно сокращается при наличии априорной информации об области возможных значений. Процедура Дарбина представляет собой традиционный МНК снелинейными ограничениями типа равенств: Способы решения: 1. Решать задачу нелинейного программирования. 2. Двухшаговый МНК Дарбина (полученный коэффициент автокорреляции используется в поправке Прайса-Винстена). 3. Итеративная процедура расчета. Процедура Дарбина (на примере парной регрессии)


Процедура Дарбина Ограничения на коэффициенты записываются в явном виде ============================================================ Dependent Variable: LGHOUS Method: Least Squares Sample(adjusted): LGHOUS=C(1)*(1-C(2))+C(2)*LGHOUS(-1)+C(3)*LGDPI-C(2)*C(3) *LGDPI(-1)+C(4)*LGPRHOUS-C(2)*C(4)*LGPRHOUS(-1) ============================================================ Coefficient Std. Error t-Statistic Prob. ============================================================ C(1) C(2) C(3) C(4) ============================================================ R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criter Sum squared resid Schwarz criterion Log likelihood Durbin-Watson stat ============================================================


Dependent Variable: LGHOUS Method: Least Squares Sample(adjusted): Included observations: 44 after adjusting endpoints Convergence achieved after 21 iterations ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C LGDPI LGPRHOUS AR(1) ============================================================ R-squared Mean dependent var Adjusted R-squared S.D. dependent var S.E. of regression Akaike info criter Sum squared resid Schwarz criterion Log likelihood F-statistic Durbin-Watson stat Prob(F-statistic) ============================================================ Либо в список регрессоров включается авторегриссионный член 1 порядка AR(1) Процедура Дарбина


Dependent Variable: LGHOUS LGHOUS=C(1)*(1-C(2))+C(2)*LGHOUS(-1)+C(3)*LGDPI-C(2)*C(3) *LGDPI(-1)+C(4)*LGPRHOUS-C(2)*C(4)*LGPRHOUS(-1) ============================================================ Coefficient Std. Error t-Statistic Prob. ============================================================ C(1) C(2) C(3) C(4) ============================================================ Variable Coefficient Std. Error t-Statistic Prob. ============================================================ C LGDPI LGPRHOUS AR(1) ============================================================ Процедура Дарбина


Итеративная процедура метода Дарбина 1. Считается регрессия и находятся остатки. 2. По остаткам находят оценку коэффициента автокорреляции остатков. 3. Оценка коэффициента автокорреляции используется для пересчета данных и цикл повторяется. Процесс останавливается, как только обеспечивается достаточная точность (результаты перестают существенно улучшаться).


Обобщенный метод наименьших квадратов. Замечания 1. Значимый коэффициент DW может указывать просто на ошибочную спецификацию. 2. Последствия автокорреляции остатков иногда бывают незначительными. 3. Качество оценок может снизиться из-за уменьшения числа степеней свободы (нужно оценивать дополнительный параметр). 4. Значительно возрастает трудоемкость расчетов. Не следует применять обобщенный МНК автоматически



3 Проверка автокорреляции остатков

При наличии автокорреляции в остатках et оценки коэффициентов регрессии модели, полученные МНК, не будут иметь оптимальные статистические свойства (стандартная ошибка уравнения регрессии и построенные на ее основе доверительные интервалы ненадежны). Автокорреляция в остатках свидетельствует о неудачном подборе модели, о ее несовершенстве. Классические методы математической статистики лишь тогда применимы, когда отдельные члены статистического ряда независимы (некоррелированы). Но и при предпосылке нормального распределения и отсутствия автокорреляции в генеральной совокупности, из которой временной ряд взят, нельзя, к сожалению, разработать точной проверки автокорреляции при малых выборках. Ниже рассмотрены три приема проверки автокорреляции.

1. Один из возможных путей приближенной оценки автокорреляции основывается на использовании первого эмпирического нециклического коэффициента автокорреляции . К сожалению, распределение этого коэффициента для выборок из нормально распределенной, не автокоррелированной генеральной совокупности неизвестно. Поэтому мы пользуемся введенным Р.Л. Андерсоном циклическим коэффициентом автокорреляции, который определяется следующим образом:


(4.14)

Циклическим коэффициентом автокорреляции для сдвига является коэффициент автокорреляции между рядами и . При этом мы предполагаем, что временной ряд повторяется, т.е. что за последним членом xn снова следуют члены x1,x2,... Для циклический коэффициент автокорреляции первого порядка будет коэффициентом корреляции между рядами и x2 ,x3 ,...,xn , x1 . Для больших выборок циклический коэффициент автокорреляции и нециклический коэффициент автокорреляции практически совпадают, для малых выборок их равенство приблизительно. Расчетное значение сравнивается при данной численности наблюдений n с граничными значениями (табл. П.5 Приложения). При положительной автокорреляции оно признается существенным для , если выполняется неравенство > , в противном случае, если , она отсутствует. При отрицательной автокорреляции оно признается существенным, если < , а несущественной - при . Изложенный выше метод может быть использован и для проверки автокорреляции остатков . В последнем случае автокорреляционная функция принимает более простой вид:

(4.15)

2. Для проверки значимости автокорреляции чаще всего используют критерий Дарбина-Уотсона (иногда его обозначают DW). Построенный на основе гипотезы о существовании автокорреляции первого порядка: (4.16)

Где n - длина временного ряда. Величина d имеет симметрическое распределение со средней, равный 2. При отсутствии автокорреляции значение , при полной положительной - d=0 , при полной отрицательной - d=4 .
Расчетное значение d сравнивают с граничными его значениями dL и dU , при этом возможны следующие случаи:

Таблица 4.3


Значение d

Суждение

0 £ d < dL

имеется положительная автокорреляция



неопределенность
автокорреляция отсутствует
неопределенность
имеется отрицательная автокорреляция

Значения dL и dU табулированы (табл. П.7 Приложения) для значений n в интервале 7-100. В этой таблице v означает число независимых переменных в уравнении регрессии. Для функции вида xt =x (t) , v=1 .

3. Иногда вместо статистики Дарбина-Уотсона используется средняя Неймана Q:
(4.17)

(4.18)

(4.19)

Если вычисленное по формуле (4.17) значение Q меньше некоторого критического для данного числа наблюдений n значения (для ), то мы говорим о положительной автокорреляции остатков, если больше значения - то об отрицательной автокорреляции. Эти значения приводятся в табл. П.8 Приложения.

Пример 20. Проверим наличие автокорреляции остатков, полученных в результате моделирования временного ряда примера 1 (см. пример 18).
Прием 1. (через циклический коэффициент автокорреляции).
Первый эмпирический нециклический коэффициент автокорреляции рассчитываем по следующим данным:

1
2
3
4
5
6
7

9
10
11
12
13
14
15

12,051
10,977
-4,097
0,829
-8,245
-6,319
-1,393

8,541
-2,615
4,311
1,237
2,163

Задание . Приведены данные за 15 лет по темпам прироста заработной платы Y(%), производительности труда X 1 (%), а также по уровню инфляции X 1 (%).
Постройте уравнение линейной регрессии прироста заработной платы от производительности труда и уровня инфляции. Проверьте качество построенного уравнения регрессии с надежностью 0,95. Проведите проверку наличия в модели автокорреляции на уровне значимости 0,05.

Решение находим с помощью калькулятора .
Уравнение множественной регрессии может быть представлено в виде:
Y = f(β , X) + ε
где X = X(X 1 , X 2 , ..., X m) - вектор независимых (объясняющих) переменных; β - вектор параметров (подлежащих определению); ε - случайная ошибка (отклонение); Y - зависимая (объясняемая) переменная.
теоретическое линейное уравнение множественной регрессии имеет вид:
Y = β 0 + β 1 X 1 + β 2 X 2 + ... + β m X m + ε
β 0 - свободный член, определяющий значение Y, в случае, когда все объясняющие переменные X j равны 0.

Прежде чем перейти к определению нахождения оценок коэффициентов регрессии, необходимо проверить ряд предпосылок МНК.
Предпосылки МНК.
1. Математическое ожидание случайного отклонения ε i равно 0 для всех наблюдений (M(ε i) = 0).
2. Гомоскедастичность (постоянство дисперсий отклонений). Дисперсия случайных отклонений ε i постоянна: D(ε i) = D(ε j) = S 2 для любых i и j.
3. отсутствие автокорреляции.
4. Случайное отклонение должно быть независимо от объясняющих переменных: Y eixi = 0.
5. Модель является линейное относительно параметров.
6. отсутствие мультиколлинеарности. Между объясняющими переменными отсутствует строгая (сильная) линейная зависимость.
7. Ошибки ε i имеют нормальное распределение. Выполнимость данной предпосылки важна для проверки статистических гипотез и построения доверительных интервалов.

Эмпирическое уравнение множественной регрессии представим в виде:
Y = b 0 + b 1 X 1 + b 1 X 1 + ... + b m X m + e
Здесь b 0 , b 1 , ..., b m - оценки теоретических значений β 0 , β 1 , β 2 , ..., β m коэффициентов регрессии (эмпирические коэффициенты регрессии); e - оценка отклонения ε.
При выполнении предпосылок МНК относительно ошибок ε i , оценки b 0 , b 1 , ..., b m параметров β 0 , β 1 , β 2 , ..., β m множественной линейной регрессии по МНК являются несмещенными, эффективными и состоятельными (т.е. BLUE-оценками).

Для оценки параметров уравнения множественной регрессии применяют МНК.
1. Оценка уравнения регрессии .
Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор s получается из выражения:
s = (X T X) -1 X T Y
Матрица X

1 3.5 4.5
1 2.8 3
1 6.3 3.1
1 4.5 3.8
1 3.1 3.8
1 1.5 1.1
1 7.6 2.3
1 6.7 3.6
1 4.2 7.5
1 2.7 8
1 4.5 3.9
1 3.5 4.7
1 5 6.1
1 2.3 6.9
1 2.8 3.5

Матрица Y

9
6
8.9
9
7.1
3.2
6.5
9.1
14.6
11.9
9.2
8.8
12
12.5
5.7

Матрица X T

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
3.5 2.8 6.3 4.5 3.1 1.5 7.6 6.7 4.2 2.7 4.5 3.5 5 2.3 2.8
4.5 3 3.1 3.8 3.8 1.1 2.3 3.6 7.5 8 3.9 4.7 6.1 6.9 3.5

Умножаем матрицы, (X T X)


Находим обратную матрицу (X T X) -1
0.99 -0.12 -0.1
-0.12 0.0246 0.00393
-0.1 0.00393 0.0194

Вектор оценок коэффициентов регрессии равен
s = (X T X) -1 X T Y =

y(x) =
0,99 -0,12 -0,1
-0,12 0,0246 0,00393
-0,1 0,00393 0,0194
*
133,5
552,41
659,84
=
0,27
0,53
1,48

Уравнение регрессии (оценка уравнения регрессии)
Y = 0.27 + 0.53X 1 + 1.48X 2
Проверка на наличие автокорреляции остатков .
Важной предпосылкой построения качественной регрессионной модели по МНК является независимость значений случайных отклонений от значений отклонений во всех других наблюдениях. Это гарантирует отсутствие коррелированности между любыми отклонениями и, в частности, между соседними отклонениями.
Автокорреляция (последовательная корреляция) определяется как корреляция между наблюдаемыми показателями, упорядоченными во времени (временные ряды) или в пространстве (перекрестные ряды). Автокорреляция остатков (отклонений) обычно встречается в регрессионном анализе при использовании данных временных рядов и очень редко при использовании перекрестных данных.
В экономических задачах значительно чаще встречается положительная автокорреляция , нежели отрицательная автокорреляция . В большинстве случаев положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов.
Отрицательная автокорреляция фактически означает, что за положительным отклонением следует отрицательное и наоборот. Такая ситуация может иметь место, если ту же зависимость между спросом на прохладительные напитки и доходами рассматривать по сезонным данным (зима-лето).
Среди основных причин, вызывающих автокорреляцию , можно выделить следующие:
1. Ошибки спецификации. Неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводят к системным отклонениям точек наблюдения от линии регрессии, что может обусловить автокорреляцию.
2. Инерция. Многие экономические показатели (инфляция, безработица, ВНП и т.д.) обладают определенной цикличностью, связанной с волнообразностью деловой активности. Поэтому изменение показателей происходит не мгновенно, а обладает определенной инертностью.
3. Эффект паутины. Во многих производственных и других сферах экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом).
4. Сглаживание данных. Зачастую данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его интервалам. Это может привести к определенному сглаживанию колебаний, которые имелись внутри рассматриваемого периода, что в свою очередь может служить причиной автокорреляции.
Последствия автокорреляции схожи с последствиями гетероскедастичности : выводы по t- и F-статистикам, определяющие значимость коэффициента регрессии и коэффициента детерминации, возможно, будут неверными.
Обнаружение автокорреляции
1. Графический метод
Есть ряд вариантов графического определения автокорреляции. Один из них увязывает отклонения ε i с моментами их получения i. При этом по оси абсцисс откладывают либо время получения статистических данных, либо порядковый номер наблюдения, а по оси ординат – отклонения ε i (либо оценки отклонений).
Естественно предположить, что если имеется определенная связь между отклонениями, то автокорреляция имеет место. Отсутствие зависимости скорее всего будет свидетельствовать об отсутствии автокорреляции.
Автокорреляция становится более наглядной, если построить график зависимости ε i от ε i-1
2. Коэффициент автокорреляции .

Если коэффициент автокорреляции r ei 3. Критерий Дарбина-Уотсона .
Этот критерий является наиболее известным для обнаружения автокорреляции.
При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки: условия статистической независимости отклонений между собой. При этом проверяется некоррелированность соседних величин e i .

y y(x) e i = y-y(x) e 2 (e i - e i-1) 2
9 8.77 0.23 0.053 0
6 6.18 -0.18 0.0332 0.17
8.9 8.17 0.73 0.53 0.83
9 8.26 0.74 0.55 0.000109
7.1 7.52 -0.42 0.18 1.35
3.2 2.69 0.51 0.26 0.88
6.5 7.67 -1.17 1.37 2.83
9.1 9.12 -0.0203 0.000412 1.32
14.6 13.58 1.02 1.05 1.09
11.9 13.53 -1.63 2.65 7.03
9.2 8.41 0.79 0.63 5.86
8.8 9.07 -0.27 0.0706 1.12
12 11.93 0.0739 0.00546 0.12
12.5 11.69 0.81 0.66 0.54
5.7 6.92 -1.22 1.49 4.13
9.53 27.27

Для анализа коррелированности отклонений используют статистику Дарбина-Уотсона :

DW = 27.27/9.53 = 2.86
Критические значения d 1 и d 2 определяются на основе специальных таблиц для требуемого уровня значимости α, числа наблюдений n = 15 и количества объясняющих переменных m=1.
Автокорреляция отсутствует, если выполняется следующее условие:
d 1 Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5 2.5, то автокорреляция остатков присутствует .
Для более надежного вывода целесообразно обращаться к табличным значениям.
По таблице Дарбина-Уотсона для n=15 и k=1 (уровень значимости 5%) находим: d 1 = 1.08; d 2 = 1.36.
Поскольку 1.08 присутствует.

Автокорреляция – это корреляционная зависимость между текущими значениями некоторой переменной и значениями этой же переменной, сдвинутыми на несколько периодов времени назад. Автокорреляция случайной составляющей e модели – это корреляционная зависимость текущих и предыдущих значений случайной составляющей модели. Величина l называется запаздыванием , сдвигом во времени или лагом .

Автокорреляция случайных возмущений модели нарушает одну из предпосылок регрессионного анализа: условие

не выполняется.

Автокорреляция может быть вызвана несколькими причинами, имеющими различную природу. Во-первых, иногда она связана с исходными данными и вызвана наличием ошибок измерения в значениях результирующей переменной. Во-вторых, в ряде случаев причину автокорреляции следует искать в формулировке модели. Модель может не включать фактор, оказывающий существенное воздействие на результат, влияние которого отражается на возмущениях, вследствие чего последние могут оказаться автокоррелированными. Очень часто этим фактором является фактор времени t : автокорреляция обычно встречается при анализе временных рядов.

Постоянная направленность воздействия не включенных в модель переменных является наиболее частой причиной так называемой положительной автокорреляции .

Иллюстрацией положительной автокорреляции может служить следующий пример.

Пример 5.2. Пусть исследуется спрос Y на прохладительные напитки в зависимости от дохода X по ежемесячным и сезонным наблюдениям. Зависимость, отражающая увеличение спроса с ростом дохода, может быть представлена линейной функцией регрессии y = ax + b , изображенной вместе с результатами наблюдений на рис. 5.2.

Рис. 5.2. Положительная автокорреляция

На величину спроса Y оказывают влияние не только доход X (учтенный фактор), но и другие факторы, которые не учтены в модели. Одним из таких факторов является время года.

Положительная автокорреляция означает постоянное в одном направлении действие неучтенных факторов на результирующую переменную. Так спрос на прохладительные напитки всегда выше линии регрессии летом (т.е. для летних наблюдений e > 0) и ниже зимой (т.е. для зимних наблюдений e < 0) (рис. 5.2). g

Аналогичная картина может иметь место в макроэкономическом анализе с учетом циклов деловой активности.

Отрицательная автокорреляция означает разнонаправленное действие неучтенных в модели факторов на результат: за положительными значениями случайной составляющей e в одних наблюдениях следуют, как правило, отрицательные в следующих, и наоборот. Графически это выражается в том, что результаты наблюдений y i «слишком часто» «перескакивают» через график уравнения регрессии. Возможная схема рассеяния наблюдений в этом случае представлена на рис. 5.3.


Рис. 5.3. Отрицательная автокорреляция

Последствия автокорреляции в определенной степени сходны с последствиями гетероскедастичности. Среди них при применении МНК обычно выделяют следующие.

1. МНК-оценки параметров, оставаясь несмещенными и линейными, перестают быть эффективными. Следовательно, они перестают обладать свойствами наилучших линейных несмещенных оценок.

2. Стандартные ошибки коэффициентов регрессии будут рассчитываться со смещением. Часто они являются заниженными, что влечет за собой увеличение t -статистик. Это может привести к признанию статистически значимыми объясняющих переменных, которые в действительности таковыми не являются. Смещенность возникает вследствие того, что выборочная остаточная дисперсия (m – число объясняющих переменных модели), которая используется при вычислении указанных величин (см. формулы (2.18) и (2.19)), является смещенной. Во многих случаях она занижает истинное значение дисперсии возмущений s 2 .

Вследствие вышесказанного все выводы, получаемые на основе соответствующих t - и F - статистик, а также интервальные оценки будут ненадежными. Следовательно, статистические выводы, получаемые при проверке качества оценок (параметров модели и самой модели в целом), могут быть ошибочными и приводить к неверным заключениям по построенной модели.