Таблицы распределения дарбина уотсона для 5 вероятности. Тест дарбина-уотсона на наличие автокорреляции остатков. Смотреть что такое "Критерий Дарбина-Уотсона" в других словарях

Методы численного интегрирования

ОСНОВЫ ЧИСЛЕННЫХ МЕТОДОВ

Лекция-5

Замечание.

Операторы

use linear_operators

означают подключение библиотек стандартных подпрограмм dfimsl и
linear_operators, соответственно.

В библиотеке linear_operators возможно использовать стандартную подпрограмму определения собственных чисел и векторов eig в виде:

lambda=eig(a,v=y),

a – исходная матрица (двумерный массив nxn ),

lambda – вектор собственных чисел (одномерный массив длиной n ),

y – матрица собственных векторов, расположенных по столбцам (двумерный массив nxn ).

Перечисленные массивы должны быть объявлены в программе.

Пусть требуется вычислить определенный интеграл вида

Для многих функций первообразные представляют собой достаточно сложные комбинации элементарных функций, либо вовсе не выражаются через них. В таких случаях использование формулы Ньютона-Лейбница на практике не представляется возможным. Во многих практических случаях достаточно получить значение интеграла с заданной точностью . Для вычисления приближенного значения интеграла существуют формулы численного интегрирования. Суть построения формул численного интегрирования состоит в следующем.

Разобьем отрезок на частей. Для простоты изложения положим эти части одинаковой длины :

Пронумеруем точки разбиения так, как показано на рис. 2.5.1. Имеем:

Рис. 2.5.1. К вопросу о численном интегрировании.

Исходный интеграл (2.5.1) может быть представлен в виде суммы интегралов по полученным в результате разбиения «малым» отрезкам:

. (2.5.2)

Интегралы

вычисляются по приближенным формулам.

Простейшие формулы для приближенного вычисления интегралов по отрезку называются квадратурными формулами . Рассмотрим некоторые из них ниже, а также изучим вопросы их точности. Порядок точности квадратурной формулы определяется степенью полинома (многочлена), для которой эта квадратурная формула точна.

2.5.2. Формула прямоугольников (формула «средних»).

Заменим на i -ом участке интегрируемую функцию постоянной величиной, например, равной ее значению в средней точке (рис. 2.5.2):

Рис. 2.5.2. К интегрированию по формуле прямоугольников.

, где . (2.5.4)

Тогда интеграл на отрезке заменяется площадью прямоугольника, т.е.

, (2.5.5)

и вычисление исходного интеграла сводится к вычислению суммы

. (2.5.6)

Кроме того, часто из практических соображений в качестве в формуле (2.5.6) берется , либо . В результате получаем:

(2.5.7)


– квадратурная формула «левых» прямоугольников;

(2.5.8)

– квадратурная формула «правых» прямоугольников.

Формулы (2.5.7) и (2.5.8) менее точные, чем (2.5.6), но иногда более удобные, например, при численном решении дифференциальных уравнений.

Точность вычисления . Как следует из построения квадратурные формулы прямоугольников дают точный результат интегрирования для функций, постоянных на i -ом участке (). Квадратурная формула «средних» прямоугольников дает точный результат также и для линейных на i -ом отрезке функций. Это утверждение достаточно проверить для простейшей линейной функции .

При точном интегрировании получаем:

,

а при интегрировании по формуле «средних» прямоугольников

Как видно, результаты точного и численного интегрирования совпадают.

1. Постановка задачи.

В прикладных исследованиях часто возникает необходимость вычисления значения определенного интеграла

Этот интеграл может выражать площадь, объем, работу переменной силы и

Если функция непрерывна на отрезке и ее первообразную удается выразить через известные функции, то для вычисления интеграла (13.1) можно воспользоваться формулой Ньютона-Лейбница:

К сожалению, в подавляющем большинстве случаев получить значение определенного интеграла с помощью формулы (13.2) или других аналитических методов не удается.

Пример 13.1. Интеграл широко используется при исследовании процессов теплообмена и диффузии, в статистической физике и теории вероятностей. Однако его значение может быть выражено в виде конечной комбинации элементарных функций.

Заметим, что даже в тех случаях, когда удается получить первообразную функцию в аналитической форме, значительные усилия, затраченные на это, часто оказываются чрезмерно высокой платой за окончательный результат. Добавим еще, что вычисления интеграла в этих случаях по формуле (13.2), как правило, приводят к громоздким (а часто - и приближенным) вычислениям. Следует отметить также, что зачастую найти точное значение интеграла (13.1) просто невозможно. Например, это имеет место, когда функция задается таблицей своих значений.

Обычно для вычисления значения определенного интеграла применяют специальные численные методы. Наиболее широко используют на практике квадратурные формулы - приближенные равенства вида

Здесь некоторые точки из отрезка узлы квадратурной формулы; числовые коэффициенты, называемые весами квадратурной формулы; целое число. Сумма которая принимается за приближенное значение интеграла, называется квадратурной суммой Величина называется погрешностью (или остаточным членом) квадратурной формулы.

Будем говорить, что квадратурная формула (13.3) точна для многочленов степени если для любого многочлена степени не выше эта формула дает точное значение интеграла, т.е.

При оценке эффективности квадратурных формул часто исходят из того, что наиболее трудоемкой операцией при вычислении по формуле (13.3) является нахождение значения функции Поэтому среди двух формул, позволяющих вычислить интеграл с заданной точностью более эффективной считается та, в которой используется меньшее число узлов.

Выведем простейшие квадратурные формулы, исходя из наглядных геометрических соображений. Будем интерпретировать интеграл (13.1) как площадь криволинейной трапеции, ограниченной графиком функции осью абсцисс и прямыми (рис. 13.1, а).

Разобьем отрезок на элементарные отрезки точками Интеграл I разобьется при этом на сумму элементарных интегралов:

где что соответствует разбиению площади исходной криволинейной трапеции на сумму площадей элементарных криволинейных трапеций (рис. 13.1, б).

Введем обозначения: где середина элементарного отрезка. Для простоты шаг будем считать постоянным.

2. Формула прямоугольников.

Заменим приближенно площадь элементарной криволинейной трапеции площадью прямоугольника, основанием которого является отрезок а высота равна значению (на рис. 13.2, а через обозначена точка с координатами Так мы приходим к элементарной квадратурной формуле прямоугольников:

Производя такую замену для всех элементарных криволинейных трапеций, получаем составную квадратурную формулу прямоугольников?

Эта формула соответствует приближенной замене площади исходной криволинейной трапеции площадью ступенчатой фшуры, изображенной на рис. 13 2. б.

Замечание. Иногда используют формулы

называемые соответственно составными квадратурными формулами левых и правых прямоугольников. Геометрические иллюстрации приведены на рис. 13.3, а и б. В соответствии с этим формулу (13.6) иногда называют составной квадратурной формулой центральных прямоугольников.

3. Формула трапеций.

Соединив отрезком точки на графике функции получим трапецию (рис 13.4, а). Заменим теперь приближенно площадь элементарной криволинейной трапеции площадью построенной фигуры. Тогда получим элементарную квадратурную формулу трапеций:

Пользуясь этой формулой при выводим составную квадратурную формулу трапеций:

Эта формула соответствует приближенной замене площади исходной

(кликните для просмотра скана)

криволинейной трапеции площадью фигуры, ограниченной ломаной линией, проходящей через точки (рис. 13.4, 6).

4. Формула Симпсона.

Если площадь элементарной криволинейной трапеции заменить площадью фигуры, расположенной под параболой, проходящей через точки (рис. 13.5, а), то получим приближенное равенство Здесь интерполяционный многочлен второй степени с узлами Как нетрудно убедиться, верна формула

Ее интегрирование приводит к равенству

Таким образом, выведена элементарная квадратурная формула Симпсона:

Применяя эту формулу на каждом элементарном отрезке, выводим составную квадратурную формулу Симпсона:

Замечание 1. Учитывая геометрическую интерпретацию формулы Симпсона, ее иногда называют формулой парабол. Замечание 2. В случае, когда число элементарных отрезков разбиения четно в формуле Симпсона можно использовать лишь узлы с целыми индексами:

При выводе этой формулы роль элементарного отрезка играет отрезок длины

5. Оценка погрешности.

Оценим погрешность выведенных квадратурных формул в предложении, что подынтегральная функция достаточно гладкая. Как и в предыдущих главах, будем использовать обозначение

Теорема 13.1. Пусть функция дважды непрерывно дифференцируема на отрезке Тогда для составных квадратурных формул прямоугольников и трапеций справедливы следующие оценки погрешности:

Выведем сначала оценку (13.13). Представим погрешность формулы прямоугольников в виде

Используя формулу Тейлора

где имеем

Так как то Замечая, что , приходим к оценке (13.13).

Для вывода оценки (13.14) воспользуемся тем, что отрезок, соединяющий точки представляет собой график интерполяционного многочлена первой степени Поэтому для элементарной формулы трапеций верно равенство

Используя оценку (11.28) погрешности линейной интерполяции, имеем

где ρ 1 - коэффициент автокорреляции первого порядка.

В случае отсутствия автокорреляции ошибок d = 2 , при положительной автокорреляции d стремится к нулю, а при отрицательной стремится к 4:

На практике применение критерия Дарбина-Уотсона основано на сравнении величины d с теоретическими значениями d L и d U для заданного числа наблюдений n , числа независимых переменных модели k и уровня значимости α .

  1. Если d < d L , то гипотеза о независимости случайных отклонений отвергается (следовательно присутствует положительная автокорреляция);
  2. Если d > d U , то гипотеза не отвергается;
  3. Если d L < d < d U , то нет достаточных оснований для принятия решений.

Когда расчетное значение d превышает 2, то с d L и d U сравнивается не сам коэффициент d , а выражение (4 − d ) .

Также с помощью данного критерия выявляют наличие коинтеграции между двумя временными рядами . В этом случае проверяют гипотезу о том, что фактическое значение критерия равно нулю. С помощью метода Монте-Карло были получены критические значения для заданных уровней значимости. В случае, если фактическое значение критерия Дарбина-Уотсона превышает критическое, то нулевую гипотезу об отсутствии коинтеграции отвергают .

Недостатки

h-критерий Дарбина

Критерий h Дарбина применяется для выявления автокорреляции остатков в модели с распределёнными лагами :

  • где n - число наблюдений в модели;
  • V - стандартная ошибка лаговой результативной переменной.

При увеличении объёма выборки распределение h -статистики стремится к нормальному с нулевым математическим ожиданием и дисперсией , равной 1. Поэтому гипотеза об отсутствии автокорреляции остатков отвергается, если фактическое значение h -статистики оказывается больше, чем критическое значение нормального распределения .

Критерий Дарбина-Уотсона для панельных данных

Для панельных данных используется немного видоизменённый критерий Дарбина-Уотсона:

В отличие от критерия Дарбина-Уотсона для временных рядов в этом случае область неопределенности является очень узкой, в особенности, для панелей с большим количеством индивидуумов .

См. также

  • Метод рядов
  • Q-тест Льюнга-Бокса
  • Метод Кочрена-Оркатта

Примечания

Литература

  • Anayolyev S. Durbin–Watson statistic and random individual effects // Econometric Theory (Problems and Solutions) . - 2002-2003.

Ссылки


Wikimedia Foundation . 2010 .

Смотреть что такое "Критерий Дарбина-Уотсона" в других словарях:

    Критерий Дарбина Уотсона (или DW критерий) статистический критерий, используемый для тестирования автокорреляции первого порядка элементов исследуемой последовательности. Наиболее часто применяется при анализе временных рядов и… … Википедия

    Дарбина - Уотсона критерий - условный показатель, который применяется для выявления автокорреляции во временных рядах (обозначается d). Показатель d вычисляется по формуле где yt+1 и yt соответствующие уровни ряда. При отсутствии… … Экономико-математический словарь

    Дарбина-Уотсона критерий - Условный показатель, который применяется для выявления автокорреляции во временных рядах (обозначается d). Показатель d вычисляется по формуле: где yt+1 и yt соответствующие уровни ряда. При отсутствии автокорреляции в исследуемом ряде показатель … Справочник технического переводчика

    Автокорреляция статистическая взаимосвязь между случайными величинами из одного ряда, но взятых со сдвигом, например, для случайного процесса со сдвигом по времени. Данное понятие широко используется в эконометрике. Наличие… … Википедия

    Тест Бройша Годфри, называемый также LM тест Бройша Годфри на автокорреляцию (англ. Breusch Godfrey serial correlation LM test применяемая в эконометрике процедура проверки автокорреляции произвольного порядка в случайных… … Википедия

    Статистический критерий, предназначенный для нахождения автокорреляции временных рядов. Вместо тестирования на случайность каждого отдельного коэффициента, он проверяет на отличие от нуля сразу несколько коэффициентов автокорреляции: где n… … Википедия

    Статистический критерий, предназначенный для нахождения автокорреляции временных рядов. Вместо тестирования на случайность каждого отдельного коэффициента, он проверяет на отличие от нуля сразу несколько коэффициентов автокорреляции.… … Википедия

    Статистика Бокса Пирса статистический критерий, предназначенный для нахождения автокорреляции временных рядов. Вместо тестирования на случайность каждого отдельного коэффициента, он проверяет на отличие от нуля сразу несколько коэффициентов … Википедия

    Тест Льюнга Бокса статистический критерий, предназначенный для нахождения автокорреляции временных рядов. Вместо тестирования на случайность каждого отдельного коэффициента, он проверяет на отличие от нуля сразу несколько коэффициентов… … Википедия

    График 100 случайных величин со скрытой синусоидой. Автокорреляционная функция позволяет увидеть периодичность в ряде данных. Автокорреляция статистическая взаимосвязь между случайными величинами из одного ряда, но взятых со сдвигом,… … Википедия

Проверка адекватности трендовых моделей реальному процессу строится на основе анализа случайной компоненты. В расчетах случайная компонента заменяется остатками, представляющими собой разность фактических и расчетных значений

При правильном выборе тренда отклонения от него будут носить случайный характер. В случае если вид функции выбран неудачно, то последовательные значения остатков могут не обладать свойством независимости, т.е. они могут коррелировать между собой. В этом случае говорят, что имеет место автокорреляция ошибок.

Существует несколько приемов обнаружения автокорреляции. Наиболее распространенным является критерий Дарбина – Уотсона. Этот критерий связан с гипотезой о существовании автокорреляции первого порядка. Его значения определяются по формуле

. (2.29)

Для понимания смысла этой формулы преобразуем ее, сделав предварительное допущение, положив . Непосредственное преобразование формулы осуществляется следующим образом:

.

При достаточно большом сумма из слагаемых значительно превосходит сумму из двух слагаемых и поэтому отношением этих величин можно пренебречь. Кроме того, отношение в квадратных скобках в силу того, что , можно считать коэффициентном корреляции между и . Таким образом, критерий Дарбина – Уотсона записывается в виде

. (2.30)

Полученное представление критерия позволяет сделать вывод, что статистика Дарбина – Уотсона связывает с выборочным коэффициентом корреляции . Таким образом, и значение критерия может указывать на наличие или отсутствие автокорреляции в остатках. Причем, если , то . Если (положительная автокорреляция), то ; если (отрицательная автокорреляция), то .

Статистически значимая уверенность в наличии или отсутствии автокорреляции определяется с помощью таблицы критических точек распределения Дарбина – Уотсона. Таблица позволяет по заданному уровню значимости , числу наблюдений и количеству переменных в модели определить два значения: – нижняя граница и – верхняя граница.



Таким образом, алгоритм проверки автокоррелированности остатков по критерию Дарбина – Уотсона следующий:

1) Построение трендовой зависимости с помощью обычного МНК

2) Вычисление остатков

для каждого наблюдения ();

хорошо иллюстрируется графической схемой на рис. 3.1.

d

Рис. 2.1. Графическая схема проверки автокоррелированности остатков

Статистическая значимость коэффициентов регрессии и близкое к единице значение коэффициента детерминации R 2 не гарантируют высокое качество уравнения регрессии. Для иллюстрации этого факта весьма нагляден пример, в котором анализируется зависимость реального объема потребления CONS (млрд. $, в ценах 1982 года) от численности населения POP (млн. чел.) в США в 1931-1990 годах. Корреляционное поле статистических данных изображено на рис1.

Рис.1. Корреляционное поле статистических данных

Линейное уравнение регрессии, построенное по МНК по реальным статистическим данным, имеет вид: СONS =-1817,3 + 16,7РОР. Стандартные ошибки коэффициентов S b 0 = 84,7, S b 1 =0,46. Следовательно, их t-статистики t b 0 =-21,4 , t b 1 =36,8. Эти значения существенно превышают 3, что свидетельствует о статистической значимости коэффициентов. Коэффициент детерминации R 2 = 0,96 (т.е. уравнение «объясняет» 96% дисперсии объема потребления). Однако по расположению точек на корреляционном поле видно, что зависимость между POP и CONS не является линейной, а будет скорее экспоненциальной. Для качественного прогноза уровня потребления линейная функция, безусловно, не может быть использована. Таким образом, при весьма хороших значениях t-статистик и F-статистики предложенное уравнение регрессии не может быть признано удовлетворительным (отметим, что R =0,96, скорее всего, в силу того, что и CONS и POP имели временной тренд). Можно ли определить причину этого?

Нетрудно заметить, что в данном случае не выполняются необходимые предпосылки МНК об отклонениях e i точек наблюдений от линии регрессии. Эти отклонения явно не обладают постоянной дисперсией и не являются взаимно независимыми. Нарушение необходимых предпосылок делает неточными полученные оценки коэффициентов регрессии, увеличивая их стандартные ошибки, и обычно свидетельствует о неверной спецификации самого уравнения.

Поэтому следующим этапом проверки качества уравнения регрессии является проверка выполнимости предпосылок МНК.

Оценивая линейное уравнение регрессии, мы предполагаем, что реальная взаимосвязь переменных линейна, а отклонения от регрессионной прямой являются случайными, независимыми друг от друга величинами с нулевым математическим ожиданием и постоянной дисперсией. Если эти предположения не выполняются, то оценки коэффициентов регрессии не обладают свойствами несмещенности, эффективности и состоятельности, и анализ их значимости будет неточным.

Причинами, по которым отклонения не обладают перечисленными выше свойствами, могут быть либо нелинейный характер зависимости между рассматриваемыми переменными, либо наличие не учтенного в уравнении существенного фактора. Действительно, при нелинейной зависимости между переменными отклонения от прямой регрессии не случайно распределены вокруг нее, а обладают определенными закономерностями, которые зачастую выражаются в существенном преобладании числа пар соседних отклонений e i-1 и e i с совпадающими знаками над числом пар с противоположными знаками.

При статистическом анализе уравнения регрессии на начальном этапе часто проверяют выполнимость одной предпосылки, а именно: условия статистической независимости отклонений между собой. Поскольку значения e i теоретического уравнения регрессии Y=β 0 +β 1 x+e остаются неизвестными ввиду неопределенности истинных значений коэффициентов регрессии, то проверяется статистическая независимость их оценок - отклонений e i , i=1,2,...,n. При этом обычно проверяется их некоррелированность, являющаяся необходимым, но недостаточным условием независимости. Причем проверяется некоррелированность не любых, а только соседних величин e i . Соседними обычно считаются соседние во времени (при рассмотрении временных рядов) или по возрастанию объясняющей переменной X (в случае перекрестной выборки) значения е i

На практике для анализа коррелированности отклонений вместо коэффициента корреляции используют тесно с ним связанную статистику Дарбина- Уотсона DW, рассчитываемую по формуле:

Если e i = е i-1 , то r ei . e-1 =1 и DW = 0. Если е i =-е i-1 ; , то r ei . e-1 =-1 и DW = 4. Во всех других случаях 0 < DW < 4 .

К этому же результату можно подойти с другой стороны. Если каждое следующее отклонение e i приблизительно равно предыдущему, e i -1 , то каждое слагаемое (e 1 -e i -1) в числителе дроби близко к нулю. Тогда, очевидно, числитель дроби будет существенно меньше знаменателя и, следовательно, статистика DW окажется близкой к нулю.

Например, для зависимости CONS и POP (рис. 1) DW = 0,045, что очень близко к нулю и подтверждает наличие положительной автокорреляции остатков первого порядка (линейной зависимости между остатками).

В другом крайнем случае, когда точки наблюдений поочередно отклоняются в разные стороны от линии регрессии, случай отрицательной автокорреляции остатков первого порядка. При случайном поведении отклонений можно предположить, что в одной половине случаев знаки последовательных отклонений совпадают, а в другой - противоположны. Так как абсолютная величина отклонений в среднем предполагается одинаковой, то можно считать, что в половине случаев e i = е i-1 , а в другой е i =-е i-1 . Тогда DW =2

Таким образом, необходимым условием независимости случайных отклонений является близость к двойке значения статистики Дарбина-Уотсона. Это означает, что построенная линейная регрессия, вероятно, отражает реальную зависимость.

Возникает вопрос, какие значения DW можно считать статистически близкими к двум?

Для ответа на этот вопрос разработаны специальные таблицы критических точек статистики Дарбина-Уотсона, позволяющие при данном числе наблюдений n, количе­стве объясняющих переменных m и заданном уровне значимости α определять границы приемлемости (критические точки) наблюдаемой статистики DW. Для заданных α,n,m в таблице указываются два числа: d l - нижняя граница и d u - верхняя граница. Для проверки гипотезы об отсутствии автокорреляции остатков используется числовой отрезок, изображенный на рис. 2.

Рис.2. Числовой отрезок.

Выводы осуществляются по следующей схеме.

  1. Если DW
  2. Если DW>4-d l , то это свидетельствует об отрицательной автокорреляции остатков.
  3. При d u
  4. Если d l

Не обращаясь к таблице критических точек Дарбина-Уотсона, можно пользоваться «грубым» правилом и считать, что автокорреляция остатков отсутствует, если 1,5

При наличии автокорреляции остатков полученное уравнение регрессии обычно считается неудовлетворительным.

Пример. Анализируется объем S сбережений домохозяйства за 10 лет. Предполагается, что его размер St в текущем году t зависит от величины y t -\ располагаемого дохода Y в предыдущем году и от величины Zt реальной процентной ставки Z в рассматриваемом году. Статистические данные представлены в таблице:

Необходимо:

а) по МНК оценить коэффициенты линейной регрессии S =β 0 +β 1 Y+β 2 Z;

б) оценить статистическую значимость найденных эмпирических коэффициентов регрессии b 0 , b 1 , b 2 ;

в) построить 95% -е доверительные интервалы для найденных коэффициентов;

г) вычислить коэффициент детерминации R 2 и оценить его статистическую значимость при α = 0,05;

д) определить, какой процент разброса зависимой переменной объясняется данной регрессией (значимость R 2 по Фишеру);

е) вычислить статистику DW Дарбина-У отсона и оценить наличие автокорреляции;

ж) сделать выводы по качеству построенной модели;

з) спрогнозировать средний объем сбережений в 1991 году, если предполагаемый доход составит 270 тыс. у.е., а процентная ставка будет равна 5,5.

Расчет коэффициентов проводится по формулам: b 0 = 5,9619423; b 1 = 0,126189; b 2 = 3,24841/

Проанализируем статистическую значимость коэффициентов регрессии, предварительно рассчитав их стандартные ошибки. Стандартная ошибка регрессии S=1,7407. Следовательно, дисперсии и стандартные ошибки коэффициентов равны:

S b 0 = 1,8929; S b 1 = 0,0212; S b 2 = 1,0146.

Рассчитаем соответствующие t-статистики: t b 0 = 1,565; t b 1 = 5,858; t b 2 = 3,503.

На первый взгляд (используя «грубое» правило), только статистическая значимость свободного члена вызывает сомнения. Два других коэффициента имеют t-статистики, превышающие тройку, что является признаком их высокой статистической значимости. Однако убедимся в таком выводе на основе более детального анализа.

Для использования таблиц критических точек необходимо выбрать требуемый уровень значимости. Обычно это прерогатива исследователя.

Вопросы для повторения

1. Какая существует связь между линейным коэффициентом корреляции и коэффициентом регрессии?

2. Каким образом оценить точность полученной модели регрессии?

3. Какими критериями пользуются при оценке качества построенной регрессионной модели?

4. Как строятся доверительные интервалы для регрессионной модели?

5. Может ли регрессия нелинейная по параметрам быть приведена к линейному виду?

6. Как осуществляется прогноз показателей по регрессионной модели?