ГоловнаЗворотній зв'язок
Главная->Різні конспекти лекцій->Содержание->6.1. Ошибки измерения факторов

Эконометрия

6.1. Ошибки измерения факторов

 

Пусть теперь нарушается гипотеза 2, и независимые факторы наблюдаются с ошибками (здесь используются обозначения первых двух форм уравнения регрессии):

                   z = z0 + e, или в разрезе наблюдений: Z = Z0 + e,

где z0 и e - n-вектора-строки истинных значений факторов и ошибок их измерений;

Z0 и e - соответствующие N´n-матрицы значений этих величин по наблюдениям.

Предполагается, что истинные значения и ошибки независимы друг от друга (по крайней мере, не скоррелированы друг с другом) и известны  их матрицы ковариации (одинаковые для всех наблюдений):

                       E(z0/,e) = 0E(z0/,z0) = M0,  E(e/e) = W.

Уравнение регрессии можно записать в следующей форме:

                        e - ea,

(т.е. остатки теперь не могут быть независимыми от факторов-регрессоров) и в рамках сделанных предположений доказать, что

                    E(M) = M0 + W,   E(a) = (M0 + W)-1M0a,

т.е. МНК-оценки теряют в такой ситуации даже свойство несмещенности. Как правило, они преуменьшены по сравнению с истинными значениями (в случае n = 1, ).

Существуют три подхода к оценке параметров регрессии в случае наличия ошибок измерения независимых факторов.

а) Простая регрессия. Если имеется оценка W ковариационной матрицы ошибок W и ошибки регрессоров взаимно независимы с изучаемой переменной, то можно использовать следующий оператор оценивания:

                          a = (M-W)-1m,

который обеспечивает несмещенность оценок.

б) Инструментальные переменные. Если имеется n факторов y, которые взаимно независимы как с ошибками уравнения e, так и ошибками основных факторов e, то оценка

                                    

несмещена.

Исторически первой в этом классе получена оценка Вальда для случая n = 1. Для получения этой оценки i-я компонента вектора-столбца Y принимается равной единице, если zi больше своей медианы, и минус единице, если - меньше медианы (при нечетном N среднее значение теряется). В результате получается, что                

где  - средние значения переменных по верхней части выборки,

 - их средние значения по нижней части выборки.

Такая оценка более эффективна, если исключить примерно треть “средних” наблюдений.

Позже эта оценка была обобщена: матрицу значений инструментальных переменных было предложено формировать столбцами рангов по наблюдениям соответствующих переменных z.

в) Ортогональная регрессия. Если ошибки факторов не зависят друг от друга и от ошибок в уравнениях (которые в этом случае интерпретируются как ошибки изучаемой переменной), их дисперсии одинаковы и равны дисперсии ошибки изучаемой переменной, а между истинными значениями переменных имеется линейная зависимость, то можно использовать ортогональную регрессию. Возвращаясь к обозначениям 3-го раздела,

                                          e и

                             (M - lIn)a = 0,   a/a = 1.

В этом случае матрица ковариации ошибок переменных имеет вид s2In. Если матрица ковариации ошибок есть s2W, то применяется регрессия в метрике W-1:

                      .

Для доказательства проводится преобразование в пространстве переменных с помощью матрицы C, такой, что , после которого матрица ковариации ошибок переменных приобретает вид s2In, и становится возможным применить обычную ортогональную регрессию.

Ортогональная регрессия при принятых гипотезах приводит к состоятельным оценкам параметров.

 

28