ГоловнаЗворотній зв'язок
Главная->Різні конспекти лекцій->Содержание->4.2. Основные гипотезы, свойства оценок

Эконометрия

4.2. Основные гипотезы, свойства оценок

 

1. Между переменными x и z существует зависимость x = za + b + e.

2. Переменные z детерминированы, наблюдаются без ошибок и линейно независимы (в алгебраическом смысле).

3. E(e) = 0, E(ee/) = s2IN.

4. В модели линейной регрессии математической статистики, в которой переменные z случайны, предполагается, что ошибки e не зависят от них и - по крайней мере - не скоррелированы с ними. В данном случае это предположение формулируется так: независимо от того, какие значения принимают переменные z, ошибки e удовлетворяют гипотезе 3.

В этих предположениях a относится к классу линейных оценок, т.к.

                                                a = LX,

где L =  - неслучайный (n+1)´(N+1)-оператор оценивания;

а также доказывается что

- a является несмещенной оценкой a, их матрица ковариации Ma равна (в обозначениях сокращенной формы уравнения регрессии это выражение давало бы - как показано в предыдущем пункте - матрицу ковариации коэффициентов регрессии при независимых факторах, а дисперсия свободного члена определялась бы по формуле ), и дисперсия любой их линейной комбинации минимальна на множестве линейных оценок, т.е. они относятся к классу BLUE - Best Linear Unbiased Estimators;

- несмещенной оценкой s2 является

                         = .

Для расчета коэффициента детерминации можно использовать следующую формулу:

                                ,

где ,

.

Если предположить, что e (и, следовательно,  их оценки e) распределены нормально:

                                   e,

то оценки a также будут иметь нормальное распределение:

                                                 ,

они совпадут с оценками максимального правдоподобия, будут несмещенными, состоятельными и эффективными.

В этом случае можно строить доверительные интервалы для оценок и использовать статистические критерии проверки гипотез.

(1-q)100-процентный доверительный интервал для aii =1,...,n+1 (an+1=b), строится следующим образом:

                                                 ,

где  - среднеквадратическое отклонение ai ( - ii-й элемент матрицы M-1);

tN-n-1,1-q - (1-q)100-процентный двусторонний квантиль tN-n-1-распределения.

Для проверки нулевой гипотезы ai = 0 применяется t-критерий. Гипотеза отвергается (влияние i-го фактора считается статистически значимым) с вероятностью ошибки (1-го рода) q, если

                                                      ,

т.к. при выполнении нулевой гипотезы величина  имеет tN-n-1-распределение. Эта величина называется t-статистикой (ti-статистикой) и ее фактическое значение обозначается в дальнейшем .

При использовании современных статистических пакетов программ не требуется искать нужные квантили t-распределения в статистических таблицах, поскольку в них (пакетах) рассчитывается уровень ошибки , с которой можно отвергнуть нулевую гипотезу, т.е. такой, что:

                                              ,

и, если он меньше желаемого значения либо равен ему, то нулевая гипотеза отвергается.

Для проверки нулевой гипотезы об отсутствии искомой связи  применяется  F-критерий. Если эта гипотеза верна, величина

                                      

имеет Fn,N-n-1-распределение. Данная величина называется F-статистикой и ее фактическое значение обозначается в дальнейшем Fc. Нулевая гипотеза отвергается (влияние z на x считается статистически значимым) с вероятностью ошибки (1-го рода) q, если

                                              ,

где Fn,N-n-1,1-q - (1-q)100-процентный (односторонний) квантиль Fn,N-n-1-распределения.

В современных статистических пакетах программ также рассчитывается уровень qс ошибки для Fc, такой, что

                                                .

Уместно отметить, что приведенные в разделе 2.1. сведения являются частным случаем рассмотренных здесь результатов при n=0.

 

 

20