Эконометрия
1.3. Эмпирические распределения случайной величины
Пусть все попадают в полуинтервал
,
который делится на k равных полуинтервалов длиной
;
.
(предполагается, что
“чуть” меньше или равно
, а
“чуть”
больше или равно
, так что некоторые из
попадают
как в 1-й, так и в последний из этих k полуинтервалов).
общий размах вариации.
оптимальное соотношение между k
и N (формула Стерджесса).
l -й полуинтервал
, где
.
доля общего количества наблюдений N
, попавших в l-й полуинтервал - частоты, эмпирические оценки
вероятностей попадания в данный полуинтервал;
;
центры полуинтервалов;
накопленные частоты (эмпирические
вероятности, с которыми значения величины в выборке не превышают xl
):
;
эмпирические плотности
распределения вероятности.
среднеарифметическое значение;
медиана, здесь l-й
полуинтервал является медианным, т.е.
;
моменты q-го порядка;
a-й (a100-процентный)
квантиль, т.е. значение величины, которое не превышается в выборке с
вероятностью a; здесь l-й полуинтервал является квантильным, т.е.
(
являются квантилями с
);
среднее по той (нижней) части
выборки, которая выделяется a-м квантилем (l-й полуинтервал также
квантильный).
Среди квантилей особое значение имеют те, которые делят выборку на равные части (иногда именно эти величины называют квартилями):
медиана;
квартили;
децили;
процентили.
децильный размах вариации (может
быть также квартильным или процентильным);
децильный коэффициент вариации
(может быть медианным, квартильным или процентильным).
мода, т.е. наиболее вероятное
значение величины в выборке; здесь l-й полуинтервал является модальным,
fl на нем достигает максимума; если этот максимум единственный,
то распределение величины называется унимодальным; если максимума два -
бимодальным; в общем случае - при нескольких максимумах - полимодальным.
Гистограмма - эмпирическая (интервальная) функция плотности распределения; имеет ступенчатую форму: на l-м полуинтервале (l=1,...,k) принимает значение fl;
Полигон - функция, график которой образован отрезками,
соединяющими точки .
Гистограмма и полигон могут строиться непосредственно
по весам wl, если (как в данном случае) все полуинтервалы имеют
одинаковую длину.
Кумулята - эмпирическая (интервальная) функция
распределения вероятности, график которой образован отрезками, соединяющими
точки .
Огива - то же, что и кумулята, или (в традициях советской статистики) функция, обратная кумуляте.
12 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36