ГоловнаЗворотній зв'язок
Главная->Різні конспекти лекцій->Содержание->1.3. Эмпирические распределения случайной величины

Эконометрия

1.3. Эмпирические распределения случайной величины

 

Пусть все  попадают в полуинтервал , который делится на k равных полуинтервалов длиной . (предполагается, что  “чуть” меньше или равно , а  “чуть” больше или равно , так что некоторые из  попадают как в 1-й, так и в последний из этих k полуинтервалов).

общий размах вариации.

оптимальное соотношение между k и N (формула Стерджесса).

l -й полуинтервал , где

.

доля общего количества наблюдений N , попавших в l-й полуинтервал - частоты, эмпирические оценки вероятностей попадания в данный полуинтервал;

;

центры полуинтервалов;

накопленные частоты (эмпирические вероятности, с которыми значения величины в выборке не превышают xl ):

;

 эмпирические плотности распределения вероятности.

 среднеарифметическое значение;

 медиана,  здесь l-й полуинтервал является медианным, т.е. ;

 моменты q-го порядка;

a-й (a100-процентный) квантиль, т.е. значение величины, которое не превышается в выборке с вероятностью a; здесь l-й полуинтервал является квантильным, т.е.   ( являются квантилями с );

 среднее по той (нижней) части выборки, которая выделяется a-м квантилем (l-й полуинтервал также квантильный).

Среди квантилей особое значение имеют те, которые делят выборку на равные части (иногда именно эти величины называют квартилями):

 медиана;

 квартили;

 децили;

 процентили.

децильный размах вариации (может быть также квартильным или процентильным);

децильный коэффициент вариации (может быть медианным, квартильным или процентильным).

  мода, т.е. наиболее вероятное значение величины в выборке; здесь l-й полуинтервал является модальным,  fl  на нем достигает максимума; если этот максимум единственный, то распределение величины называется унимодальным;  если максимума два - бимодальным; в общем случае - при нескольких максимумах - полимодальным.

Гистограмма - эмпирическая (интервальная) функция плотности распределения; имеет ступенчатую форму: на l-м полуинтервале (l=1,...,k) принимает значение fl;

Полигон - функция, график которой образован отрезками, соединяющими точки .

Гистограмма и полигон могут строиться непосредственно по весам wl, если (как в данном случае) все полуинтервалы  имеют одинаковую длину.

Кумулята - эмпирическая (интервальная) функция распределения вероятности, график которой образован отрезками, соединяющими точки .

Огива - то же, что и кумулята, или (в традициях советской статистики) функция, обратная кумуляте.

 

 

7