yandex rtb 1
ГоловнаЗворотній зв'язок
yande share
Главная->Економіка->Содержание->3.4. КОРРЕКЦИЯ СТАТИСТИЧЕСКИХ ВЫВОДОВ ПРИ НАЛИЧИИ ГЕТЕРОСКЕДАСТИЧНОСТИ (НЕОДНОРОДНОСТИ ДИСПЕРСИЙ ОШИБОК)

Эконометрика для начинающих

3.4. КОРРЕКЦИЯ СТАТИСТИЧЕСКИХ ВЫВОДОВ ПРИ НАЛИЧИИ ГЕТЕРОСКЕДАСТИЧНОСТИ (НЕОДНОРОДНОСТИ ДИСПЕРСИЙ ОШИБОК)

Пример. Для исследования вопроса о зависимости количества руководящих работников от размера предприятия были собраны статистические данные по 27 промышленным предприятиям. Далее обозначено:

 — численность персонала на i-м предприятии,

 — количество руководителей на i-м предприятии.

Оцениваем линейную модель наблюдений

Регрессионный анализ дает следующие результаты: R2= 0.776 и

Variable

Coefficient

Std. Error

t-Statistic

P-value.

1

14.448

9.562

1.511

0.1433

X

0.105

0.011

9.303

0.0000

Следующие два графика демонстрируют диаграмму рассеяния с подобранной прямой (левый график) и зависимость стандартизованных остатков  от значений (правый график).

 

Похоже, что имеет место тенденция линейного возрастания абсолютных величин остатков с ростом , соответствующая наличию приближенной зависимости вида  для дисперсий ошибок. Чтобы погасить такую неоднородность дисперсий, разделим обе части соотношения на :

т. е. перейдем к модели наблюдений

где

Если действительно выполняется соотношение , то тогда в преобразованной модели

т. е. неоднородность дисперсий ошибок преодолевается.

Результаты оценивания преобразованной модели:

Variable

Coefficient

Std. Error

t-Statistic

P-value.

1

0.121

0.009

13.445

0.0000

1/x

3.803

4.570

0.832

0.4131

В исходных переменных это соответствует модели линейной связи

Отметим уменьшение оцененных стандартных ошибок оценок обоих параметров  и. Именно на эти значения следует опираться при построении доверительных интервалов для этих параметров. Средними точками этих интервалов будут, соответственно,  и . Следующий график показывает характер зависимости стандартизованных остатков в преобразованной модели от .

На сей раз неоднородности дисперсий остатков (по крайней мере явной) не обнаруживается.

Рассмотрим внимательнее наши действия при оценивании преобразованной модели. Оценки коэффициентов, приведенные в последней таблице, получены применением метода наименьших квадратов к модели наблюдений т. е. путем минимизации суммы квадратов

которую, вспоминая, что обозначают переменные со звездочками, можно записать в виде

Обозначая теперь

получаем, что задача минимизации суммы квадратов отклонений в преобразованной модели равносильна задаче минимизации взвешенной суммы квадратов отклонений в исходной (непреобразованной) модели. Величина  интерпретируется в этом контексте как вес, приписываемый квадрату отклонения в - м наблюдении. Этот вес будет тем меньше, чем больше значение , которое в силу наших предположений пропорционально дисперсии случайной ошибки  в -м наблюдении. Следовательно, чем больше дисперсия случайной ошибки , тем меньше вес, с которым входит квадрат отклонения в -м наблюдении в минимизируемую сумму.

Имея в виду, что оценивание преобразованной модели наблюдений сводится к минимизации суммы

рассмотренный метод оценивания называют взвешенным методом наименьших квадратов (хотя точнее его следовало бы называть методом наименьших взвешенных квадратов).

Замечание. В некоторых руководствах по эконометрике и в некоторых пакетах статистического анализа данных (например, в пакете EVIEWS) используется несколько иное равносильное представление минимизируемой суммы квадратов в преобразованной модели наблюдений:

В этом случае вес приписывается не квадрату отклонения, а самому отклонению Разумеется, в рассмотренном примере при таком определении веса последний будет равен

На это обстоятельство следует обратить внимание при спецификации весов в процедурах, реализующих взвешенный метод наименьших квадратов.

Обратим теперь внимание на то, в каком виде выдается информация о результатах применения взвешенного метода наименьших квадратов на примере пакета EVIEWS. При этом используем данные из рассмотренного выше примера. Согласно сказанному в Замечании, при обращении к процедуре оценивания взвешенным методом наименьших квадратов в условиях нашего примера мы специфицируем веса как .

 

 

 

 

Протокол оценивания имеет следующий вид:

Dependent Variable: Y

Method: Least Squares

Date: Time:

Sample: 1 27

Included observations: 27

Weighting series: 1/X

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C

3.803296

4.569745

0.832277

0.4131

X

0.120990

0.008999

13.44540

0.0000

Weighted Statistics

 

 

 

 

R-squared

0.026960

Mean dependent var

74.04946

Adjusted R-squared

–0.011961

S. D. dependent var

13.08103

S. E. of regression

13.15902

Akaike info criterion

8.063280

Sum squared resid

4328.998

Schwarz criterion

8.159268

Log likelihood

-106.8543

F-statistic

180.7789

Durbin-Watson stat

2.272111

Prob (F-statistic)

0.000000

Unweighted Statistics

 

 

 

 

R-squared

0.758034

Mean dependent var

94.44444

Adjusted R-squared

0.748355

S. D. dependent var

45.00712

S. E. of regression

22.57746

Sum squared resid

12743.54

Durbin-Watson stat

2.444541

 

 

 

В этом протоколе приводятся значения двух видов статистик:

·      Weighted Statistics (взвешенные статистики) — это статистики, основанные на остатках, получаемых по взвешенным данным, т. е. на остатках  в преобразованной модели.

·      Unweighted Statistics (невзвешенные статистики) — это статистики, основанные на «остатках»  т. е. на отклонениях наблюдаемых значений объясняемой переменной  от значений, предсказываемых линейной моделью связи, в качестве параметров которой берутся их оценки  полученные в преобразованной модели.

Отметим весьма низкое (0.2696) значение коэффициента детерминации в преобразованной модели. Однако это обстоятельство не должно нас волновать — линейная связь в преобразованной модели значима, о чем говорит весьма высокое значение -статистики, равное 180.7789, и соответствующее ему -значение 0.0000 (см. Weighted Statistics).В конечном счете нас интересует значение , находящееся в части протокола, соответствующей невзвешенным статистикам, а это значение достаточно велико (0.7580).

Отметим еще, что приведенные в начале таблицы значения оценок параметров, их стандартных ошибок и -статистик, а также -значения соответствуют величинам, полученным на стадии оценивания преобразованной модели.

Заметим, наконец, что значение , указанное в числе невзвешенных статистик, отличается от значения , полученного нами при оценивании исходной (непреобразованной) модели наблюдений. Причина этого, разумеется, в том, что при вычислении значения  использовались остатки

где  — оценки наименьших квадратов параметров исходной модели, полученные без использования взвешивания отклонений.

Мы уже отмечали выше, что результатом неоднородности дисперсий случайных ошибок в модели наблюдений является смещение оценок дисперсий случайных величин . В то же время, наличие такого нарушения стандартных предположений оставляет оценки  несмещенными. В связи с этим, один из методов коррекции статистических выводов при неоднородности дисперсий ошибок состоит в использовании обычных оценок наименьших квадратов (OLS-оценок, Ordinary Least Squares estimates)  коэффициентов  вместе со скорректированными на гетероскедастичность оценками стандартных ошибок . Один из вариантов получения скорректированных на гетероскедастичность значений  был предложен Уайтом (White) и реализован в ряде пакетов статистического анализа данных, в том числе и в пакете EVIEWS. При этом удовлетворительные свойства оценки Уайта гарантируются только при большом количестве наблюдений. Мы не будем приводить здесь детали получения оценки Уайта, а просто воспользуемся пакетом EVIEWS для анализа данных из только что рассмотренного примера.

Пример. Используем данные из предыдущего примера, но применим для их анализа последнюю процедуру. Согласно этой процедуре, мы оцениваем коэффициенты  и обычным методом наименьших квадратов, так что в качестве оценок берутся значения  и . В качестве же оценок стандартных ошибок  и  вместо значений  и , полученных выше при оценивании модели обычным методом наименьших квадратов, берем значения оценок Уайта  и .

Бросающееся в глаза значительное различие оценок для параметра  при применении двух рассмотренных методов ( и ) в действительности не столь уж удивительно, поскольку оценки стандартной ошибки для, полученные каждым из двух методов довольно высоки (и , соответственно).

Избавиться от неоднородности дисперсий ошибок в ряде случаев позволяет переход к логарифмам объясняемой переменной.

Пример. По данным, использованным в двух предыдущих примерах, оценим модель наблюдений

График зависимости стандартизованных остатков, полученных при оценивании этой модели, от предсказанных значений  (левый график)

 

указывает на неправильную спецификацию модели, связанную с возможным пропуском квадратичной составляющей . Оценивание расширенной модели наблюдений, включающей дополнительную объясняющую переменную , приводит к остаткам, обнаруживающим существенно более удовлетворительное поведение (см. правый график). Результаты оценивания расширенной модели приведены в следующей таблице.

Variable

Coefficient

Std. Error

t-Statistic

P-value

1

2.851

0.157

18.205

0.0000

x

0.003

0.000399

7.803

0.0000

x2

-1.10E-06

2.24E-07

-4.925

0.0001

Таким образом, используя преобразования переменных, мы получили две альтернативные оцененные модели связи между переменными  и :

 и .

Первую из этих двух моделей можно предпочесть из соображений простоты интерпретации.

3.5. КОРРЕКЦИЯ СТАТИСТИЧЕСКИХ ВЫВОДОВ ПРИ АВТОКОРРЕЛИРОВАННОСТИ ОШИБОК

Пусть мы имеем дело с наблюдениями, производимыми последовательно через равные промежутки времени (ежедневные, еженедельные, ежеквартальные, ежегодные статистические данные) и выявляем по графику зависимости стандартизованных остатков  от  тенденцию сохранения знака соседних наблюдений. В таком случае мы можем подозревать нарушение условия независимости случайных ошибок  в принятой нами модели наблюдений

в форме положительной автокоррелированности ряда ошибок.

Простейшей моделью автокоррелированности ошибок является модель авторегрессии первого порядка:

где , а  — независимые в совокупности случайные величины, имеющие одинаковое нормальное распределение . Тогда гипотеза

соответствует (при нашем предположении о нормальности распределения случайных ошибок) независимости в совокупности случайных величин . В качестве альтернативной используем гипотезу

соответствующую положительной автокоррелированности случайных величин  (т. е. тенденции преимущественного сохранения знака случайной ошибки при переходе от - го наблюдения к -му). Если гипотеза  отклоняется критерием Дарбина-Уотсона в пользу альтернативной гипотезы то для получения правильных статистических выводов относительно коэффициентов модели необходима соответствующая коррекция.

Итерационная процедура Кохрейна-Оркатта (Cochrane-Orcutt).

Умножим обе части выражения для -го наблюдения на , так что

и вычтем обе части полученного выражения из соответствующих частей выражения для -го наблюдения:

Тем самым мы приходим к преобразованной модели наблюдений

где

Поскольку в принятой модели ошибок

то это означает, что ошибки  в преобразованной модели — независимые в совокупности случайные величины, имеющие одинаковое нормальное распределение .

Иными словами, случайные ошибки в преобразованной модели удовлетворяют стандартным предположениям. Следовательно, в рамках преобразованной модели никакой дополнительной коррекции обычных статистических выводов о коэффициентах модели не требуется. Проблема только в том, что используемое в процессе преобразования модели значение коэффициента  нам не известно. Поэтому реально провести указанное преобразование невозможно. Вместо этого можно пытаться заменить указаное преобразование какой-либо его аппроксимацией с заменой неизвестного значения  на его оценку по данным наблюдений. Конечно, при использовании такой аппроксимации мы уже не можем гарантировать, что  в преобразованной модели будут независимыми в совокупности случайными величинами, однако есть некоторая надежда на то, что эти ошибки все же будут обнаруживать меньшую автокоррелированность по сравнению с ошибками в исходной модели.

Описываемая здесь процедура Кохрейна-Оркатта использует для получения аппроксимации теоретического преобразования оценку для  в виде

где  — остатки, получаемые при оценивании исходной модели наблюдений. Аппроксимирующее преобразование определяется соотношениями

которые приводят к преобразованной модели

Если в последней модели автокоррелированность не проявляется, то полученные в рамках этой модели оценки параметров  можно принять в качестве уточненных оценок параметров . Если же в преобразованной модели еще остается выраженная автокоррелированность, то процесс преобразования применяют уже к преобразованной модели и еще раз уточняют значения параметров и т.д., пока последовательно уточняемые значения параметров не перестанут изменяться в пределах заданной точности.

Заметим, наконец, что обычно мы предполагаем, что. Соответственно, для первой объясняющей переменной получаем

так что фактически мы имеем преобразованную модель

с . Получив в этой модели оценку  для , мы можем оценить параметр  исходной модели, просто полагая

Пример. Проанализируем статистические данные о совокупных потребительских расходах (CONS) и денежной массе (MONEY) в США за 1952—1956 г. г. (квартальные данные, в млрд. долларов).

obs

MONEY

CONS

obs

MONEY

CONS

1952:1

159.3

214.6

1954:3

173.9

238.7

1952:2

161.2

217.7

1954:4

176.1

243.2

1952:3

162.8

219.6

1955:1

178.0

249.4

1952:4

164.6

227.2

1955:2

179.1

254.3

1953:1

165.9

230.9

1955:3

180.2

260.9

1953:2

167.9

233.3

1955:4

181.2

263.3

1953:3

168.3

234.1

1956:1

181.6

265.6

1953:4

169.7

232.3

1956:2

182.5

268.2

1954:1

170.5

233.7

1956:3

183.3

270.4

1954:2

171.6

236.5

1956:4

184.3

275.6

Результаты оценивания линейной модели наблюдений

в которой — значения объясняемой переменной CONS, а - значения объясняющей переменной MONEY, приведены в следующей таблице:

Variable

Coefficient

Std. Error

t-Statistic

Prob.

1

–154.719

19.850

-7.794

0.0000

X

2.300

0.114

20.080

0.0000

R-squared

0.957

Durbin-Watson stat

0.328

Хотя коэффициент детерминации весьма близок к единице, значение статистики Дарбина-Уотсона достаточно мало, и это дает возможность подозревать наличие положительной автокоррелированности ошибок в принятой модели наблюдений. Два следующих графика дают представление о рассеянии значений переменных и о поведении остатков.

Здесь наблюдаются серии остатков, имеющих одинаковые знаки, что как раз и характерно для моделей, в которых имеется положительная автокоррелированность ошибок.

Для подтверждения положительной автокоррелированности ошибок используем критерий Дарбина-Уотсона. По таблицам находим нижнюю границу для критического значения  при : . Полученное при оценивании модели значение  существенно меньше этой нижней границы, так что гипотеза  отвергается в пользу альтернативной гипотезы . Для коррекции статистических выводов используем процедуру Кохрейна-Оркатта.

Прежде всего находим оценку для неизвестного значения коэффициента :  Основываясь на этой оценке, переходим к преобразованной модели, оценивание которой дает следующие результаты:

Included observations: 19 after adjusting endpoints

Variable

Coefficient

Std. Error

t-Statistic

Prob.

1

-30.777

14.043

-2.192

0.0426

X’

2.795

0.609

4.593

0.0003

R-squared

0.554

Durbin-Watson stat

1.667

Хотя в преобразованной модели коэффициент детерминации существенно ниже, чем в непреобразованной модели, значение статистики Дарбина-Уотсона теперь превышает верхнюю границу  для критического значения , соответствующего . (В преобразованной модели наблюдений на единицу меньше, чем в исходной, так как при преобразовании используются запаздывающие значения обеих переменных). Поэтому гипотеза о независимости в совокупности ошибок в преобразованной модели не отвергается (в пользу гипотезы об их положительной автокоррелированности). Два следующих графика дают представление о рассеянии значений преобразованных переменных и о поведении остатков в преобразованной модели.

RESID: TRANSFORMED MODEL

 

Обратим внимание на существенно более нерегулярное поведение остатков по сравнению с исходной моделью.

Обращаясь к результатам оценивания коэффициентов в преобразованной модели, отметим значительное (более, чем в 5 раз!) возрастание оценки стандартной ошибки , что подтверждает сделанное ранее замечание о занижении стандартных ошибок при неучете имеющейся в действительности положительной автокорреляции случайных ошибок в модели наблюдений. Столь существенное возрастание значения  приводит к возрастанию более, чем в 5 раз, и ширины доверительного интервала для мультипликатора . Если при оценивании исходной линейной модели 95%-доверительный интервал для этого параметра имел вид , то при оценивании преобразованной модели мы получаем интервал .

Рассмотренный пример ясно демонстрирует опасность пренебрежения возможной неадекватностью построенной модели в отношении стандартных предположений об ошибках и необходимость обязательного проведения в процессе подбора подходящей модели связи между теми или иными экономическими факторами анализа остатков, полученных при оценивании выбранной модели.

Более того, используя преобразованную модель, можно получить улучшенную модель для прогнозирования объемов расходов на потребление при планируемых объемах денежной массы. Поясним это на примере простой линейной модели

Предполагая, что  и используя оценку  для коэффициента , переходим к преобразованной модели

c  и

и получаем в рамках этой модели оценки  и  параметров  и , так что оцененная модель линейной связи между преобразованными переменными имеет вид

В исходных переменных последние соотношения принимают вид

где , откуда получаем:

Если мы собираемся теперь прогнозировать будущее значение, соответствующее плановому значению  объясняющей переменной, то естественно воспользоваться полученным соотношением и предложить в качестве прогнозного длязначение

При таком способе вычисления прогнозного значения для учитывается тенденция сохранения знака остатков: если в последнем наблюдении наблюдавшееся значение  превышало значение  предсказываемое линейной моделью связи  то и последующее значение  прогнозируется с превышением значения  предсказываемого этой линейной моделью связи при . Если же значение меньше, чем  то тогда будущее значение  прогнозируется меньшим значения

Пример. Продолжим рассмотрение предыдущего примера. В этом примере , . Наблюдавшимся значениям  можно сопоставить:

·      наблюдавшиеся значения ;

·      значения

получаемые по модели, построенной без учета автокоррелированности ошибок;

·      значения

получаемые по модели, параметры которой скорректированы с учетом автокоррелированности ошибок;

·      значения

отличающиеся от значений, указанных в предыдущем пункте, учетом значения остатка в предшествующем наблюдении.

Ниже приведены графики значений , получаемых указанными тремя методами, и графики соответствующих им расхождений . Индексы 1, 2, 3 указывают на один из трех способов получения значений , в том порядке, в котором они были перечислены выше).

 

Сравним средние квадраты расхождений при использовании указанных трех методов вычисления значений . Эти средние квадраты равны, соответственно,

что говорит о большей гибкости прогноза, построенного по последнему (третьему) методу.

Рассмотрим еще одно важное следствие автокоррелированности ошибок в линейной модели

с  Преобразование

приводит к модели наблюдений

на основании которой получаем соотношение

Вспомним теперь о нашем предположении, что , и преобразуем последнее соотношение следующим образом:

или

Здесь ,  и . Второе слагаемое в правой части по-существу поддерживает «долговременную» линейную связь (тенденцию)

Если в момент  отклонение  от  положительно , то второе слагаемое будет отрицательным, действуя в сторону уменьшения приращения . Если же отклонение  от  отрицательно , то второе слагаемое будет положительным, действуя в сторону увеличения приращения .

Указанная модель коррекции приращений переменной  использует «истинные» значения параметров . Поскольку эти значения нам не известны, мы в состоянии построить только аппроксимацию такой модели, использующую оценки параметров. При этом естественно воспользоваться оценкой  и уточненными оценками , полученными на базе преобразованной модели.

В рассмотренном примере аппроксимирующая модель коррекции приращений принимает вид

 

23