ГоловнаЗворотній зв'язок
Главная->Різні конспекти лекцій->Содержание->6.2. Фиктивные переменные

Эконометрия

6.2. Фиктивные переменные

 

С помощью фиктивных или псевдопеременных, принимающих дискретные, обычно, целые значения, в регрессию включают качественные факторы.

Уточнение обозначений:

Z - N´n-матрица наблюдений за “обычными” независимыми факторами;

a - n-вектор-столбец параметров регрессии при этих факторах;

;

b0 = b.

В этих обозначениях уравнение регрессии записывается следующим образом:

                      e.

Пусть имеется один качественный фактор, принимающий два значения (например: “мужчина” и “женщина”, если речь идет о модели некоторой характеристики отдельных людей, или “годы войны” и “годы мира” - в модели, построенной на временных рядах наблюдений, которые охватывают периоды войны и мира, и т.д.). Ставится вопрос о том, влияет ли этот фактор на значение свободного члена регрессии.

´2-матрица наблюдений за качественным фактором (матрица фиктивных переменных):  равен единице, если фактор в i-м наблюдении принимает 1-е значение, и нулю в противном случае;  равен единице, если фактор в i-м наблюдении принимает 2-е значение, и нулю в противном случае.

 - 2-х компонентный вектор-столбец параметров при фиктивных переменных.

Исходная форма регрессии с фиктивными переменными:

               e.

Поскольку сумма столбцов матрицы  равна Z0, оценка параметров непосредственно по этому уравнению невозможна.

Проводится преобразование фиктивных переменных одним из двух способов.

а) В исходной форме регрессии исключается один из столбцов матрицы фиктивных переменных, в данном случае - первый.

 - матрица фиктивных переменных без первого столбца;

 = .

Тогда эквивалентная исходной запись уравнения имеет вид:

                  + e,

и после умножения матрицы справа на вектор параметров получается запись уравнения регрессии в которой отсутствует линейная зависимость между факторами-регрессорами:

                   e,

где .

После оценки этих параметров можно определить значения исходных параметров b0 и , предполагая, что сумма параметров при фиктивных переменных  (в данном случае b1 + b2) равна нулю, т.е. влияние качественного фактора приводит к колебаниям вокруг общего уровня свободного члена:

                           .

б) Предполагая, что сумма параметров при фиктивных переменных равна нулю, в исходной форме регрессии исключается один из этих параметров, в данном случае - первый.

b - вектор-стобец параметров при фиктивных переменных без первого элемента;

C .

Эквивалентная исходной запись уравнения принимает форму:

                           e,

и после умножения матрицы C слева на матрицу наблюдений за фиктивными переменными получается запись уравнения регрессии, в которой также отсутствует линейная зависимость между регрессорами:

                           e.

После оценки параметров этого уравнения недостающая оценка параметра b1 определяется из условия b1 = -b2.

Качественный фактор может принимать больше двух значений. Так, в классической модели выделения сезонных колебаний он принимает 4 значения в случае поквартальных наблюдений и 12 значений, если наблюдения проводились по месяцам. Матрица  в этой модели имеет размерность, соответственно, N´4 или N´12.

Пусть в общем случае качественный фактор принимает k значений. Тогда:

матрица  имеет размерность N´k, вектор-столбец - размерность k, матрицы  и ZF - N´ (k-1), вектора-столбцы и b - k-1;

k´(k+1) матрица , k´(k-1) матрица ; .

Можно показать, что

, или ,

где  - (k-1)´(k-1)-матрица, состоящая из единиц; и далее показать, что результаты оценки параметров уравнения с фиктивными переменными при использовании обоих указанных подходов к устранению линейной зависимости факторов-регрессоров одинаковы.

После оценки регрессии можно применить t-критерий для проверки значимости влияния качественного фактора на свободный член уравнения.

Если k слишком велико и приближается к N, то на параметры при фиктивных переменных накладываются более жесткие ограничения (чем равенство нулю их суммы). Так, например, если наблюдения проведены в последовательные моменты времени, и вводится качественный фактор “время”, принимающий особое значение в каждый момент времени, то , и обычно предполагается, что значение параметра в каждый момент времени (при фиктивной переменной каждого момента времени) больше, чем в предыдущий момент времени на одну и ту же величину. Тогда роль матрицы C играет N-вектор-столбец T, состоящий из чисел натурального ряда, начиная с 1, и , где bT  - скаляр. Уравнение регрессии с фактором времени имеет вид (эквивалентная исходной форма уравнения при использовании способа “б” исключения линейной зависимости фиктивных переменных):

                               e.

Метод фиктивных переменных можно использовать для проверки влияния качественного фактора на коэффициент регрессии при любом обычном факторе. Исходная форма уравнения, в которое вводится качественный фактор для параметра aj, имеет следующий вид:

                               e,

где -й столбец матрицы Z,

 -  k-вектор-столбец параметров влияния качественного фактора на aj;

в векторе a  j-я компонента теперь обозначается  - средний уровень параметра aj;

 - операция прямого произведения столбцов матриц.

Замечание

Прямое произведение матриц AÄB, имеющих размерность, соответственно, mA´nA и mB´nB есть матрица размерности (mAmB)´(nAnB) следующей структуры:

                               

Прямое произведение матриц обладает следующими свойствами:

                   (AÄB)(CÄD) = (AC)Ä(BD), если произведения AC и BD имеют смысл,

                   .

Прямое произведение столбцов матриц применимо к матрицам, имеющим одинаковое число строк, и осуществляется путем проведения операции прямого произведения последовательно с векторами-строками матриц.

Приоритет прямого произведения матриц выше, чем обычного матричного произведения.

При использовании способа “а” эквивалентная исходной форма уравнения имеет вид (форма “а”):

           e,

где  - матрица Z без j-го столбца,

 - вектр a без j-го элемента;

а в случае применения способа “б” (форма “б”):

             e.

Все приведенные выше структуры матриц и соотношения между матрицами и векторами сохраняются.

В уравнение регрессии можно включать более одного качественного фактора. В случае двух факторов, принимающих, соответственно, k1 и k2 значения, форма “б” уравнения записывается следующим образом:

              e,

где вместо “F” в качестве индекса качественного фактора используется его номер.

Это уравнение может включать фиктивные переменные совместного влияния качественных факторов (взаимодействия факторов). В исходной форме компонента совместного влияния записывается следующим образом:

                                       ,

где - k1´k2-вектор-столбец /,

а  - параметр при фиктивной переменной, которая равна 1, если 1-й фактор принимает i1-е значение, а 2-й фактор - i2-е значение, и равна 0 в остальных случаях (вектором-столбцом наблюдений за этой переменной является (k1(i1-1)+i2)-й столбец матрицы ).

Как и прежде, вектор параметров, из которого исключены все компоненты, линейно выражаемые через остальные, обозначается . Он имеет размерность (k1-1)´(k2-1) и связан с исходным вектором параметров таким образом:

                                           ,

где C1 и C2 - матрицы размерности k1´(k1-1) и k2´(k2-1), имеющие описанную выше структуру (матрица C).

Теперь компоненту совместного влияния можно записать следующим образом:

,

а уравнение, включающее эту компоненту (форма “б”) -

                     e.

В общем случае имеется L качественных факторов, j-й фактор принимает kj значений. Пусть упорядоченное множество {1,2,...,L} обозначается F, а J - его подмножества. Общее их количество, включая пустое подмножество, равно 2L. Каждому такому подмножеству взаимно однозначно соответствует число, например, в системе исчисления с основанием , и их можно упорядочить по возрастанию этих чисел. Если пустое подмножество обозначить 0, то можно записать J = 0,1,...,L,{1,2},...,{1,L},{2,3},...,{1,2,3},...,F. Тогда уравнение регрессии записывается следующим образом:

eee,

где    при j > 0; C0 = 1. Выражение  означает, что j принимает значения последовательно с 1-го по последний элемент подмножества J.

Очевидно, что приведенная выше запись уравнения для L = 2 является частным случаем данной записи.

Если p(J) - количество элементов в подмножестве J, то

 или - J-е эффекты, эффекты p(J)-го порядка, при p(J) = 1 - главные эффекты, при p(J) > 1 - эффекты взаимодействия, эффекты совместного влияния  или совместные эффекты.

 или bJ - параметры соответствующих J-х эффектов или также сами эти эффекты.

 

 

29