Влияние увеличения размера выборки на точность оценок

Будем по-прежнему предполагать, что мы исследуем случайную переменную x с неизвестным математическим ожиданием Влияние увеличения размера выборки на точность оценок - №1 - открытая онлайн библиотека и теоретической дисперсией Влияние увеличения размера выборки на точность оценок - №2 - открытая онлайн библиотека и что для оценивания Влияние увеличения размера выборки на точность оценок - №1 - открытая онлайн библиотека используется Влияние увеличения размера выборки на точность оценок - №4 - открытая онлайн библиотека . Каким образом точность оценки x зависит от числа наблюдений n?

При увеличении n оценка Влияние увеличения размера выборки на точность оценок - №4 - открытая онлайн библиотека , вообще говоря, становится более точной. В единичном эксперименте большая по размеру выборка необязательно даст более точную оценку, чем меньшая выборка, но общая тенденция должна быть именно такой. Поскольку дисперсия Влияние увеличения размера выборки на точность оценок - №4 - открытая онлайн библиотека выражается формулой Влияние увеличения размера выборки на точность оценок - №7 - открытая онлайн библиотека , она тем меньше, чем больше размер выборки, и, значит, тем сильнее «сжата» функция плотности вероятности для Влияние увеличения размера выборки на точность оценок - №4 - открытая онлайн библиотека .

Это показано на рис. 9. Предположим, что x нормально распределена со средним 25 и стандартным отклонением 50. Если размер выборки равен 25, то стандартное отклонение величины Влияние увеличения размера выборки на точность оценок - №4 - открытая онлайн библиотека , равное Влияние увеличения размера выборки на точность оценок - №10 - открытая онлайн библиотека , составит: Влияние увеличения размера выборки на точность оценок - №11 - открытая онлайн библиотека . Если размер выборки равен 100, то это стандартное отклонение равно 5. На рис. 9 показаны соответствующие функции плотности вероятности. Вторая ( Влияние увеличения размера выборки на точность оценок - №12 - открытая онлайн библиотека ) выше первой в окрестности Влияние увеличения размера выборки на точность оценок - №1 - открытая онлайн библиотека , что говорит о более высокой вероятности получения с ее помощью аккуратной оценки. За пределами этой окрестности вторая функция всюду ниже первой.

Влияние увеличения размера выборки на точность оценок - №14 - открытая онлайн библиотека

Рис. 9.

Чем больше размер выборки, тем уже и выше будет график функции плотности вероятности для Влияние увеличения размера выборки на точность оценок - №15 - открытая онлайн библиотека . Если n становится действительно большим, то график функции плотности вероятности будет неотличим от вертикальной прямой, соответствующей Влияние увеличения размера выборки на точность оценок - №16 - открытая онлайн библиотека . Для такой выборки случайная составляющая x становится действительно очень малой, и поэтому Влияние увеличения размера выборки на точность оценок - №15 - открытая онлайн библиотека обязательно будет очень близкой к Влияние увеличения размера выборки на точность оценок - №18 - открытая онлайн библиотека . Это вытекает из того факта, что стандартное отклонение Влияние увеличения размера выборки на точность оценок - №15 - открытая онлайн библиотека , равное Влияние увеличения размера выборки на точность оценок - №20 - открытая онлайн библиотека , становится очень малым при больших n.

В пределе, при стремлении n к бесконечности, Влияние увеличения размера выборки на точность оценок - №20 - открытая онлайн библиотека стремится к нулю и Влияние увеличения размера выборки на точность оценок - №15 - открытая онлайн библиотека стремится в точности к Влияние увеличения размера выборки на точность оценок - №18 - открытая онлайн библиотека .

Состоятельность

Вообще говоря, если предел оценки по вероятности равен истинному значению характеристики генеральной совокупности, то эта оценка называется состоятельной. Иначе говоря, состоятельной называется такая оценка, которая дает точное значение для большой выборки независимо от входящих в нее конкретных наблюдений.

В большинстве конкретных случаев несмещенная оценка является и состоятельной.

Иногда бывает, что оценка, смещенная на малых выборках, является состоятельной (иногда состоятельной может быть даже оценка, не имеющая на малых выборках конечного математического ожидания). На рис. 10 показано, как при различных размерах выборки может выглядеть распределение вероятностей. Тот факт, что при увеличении размера выборки распределение становится симметричным вокруг истинного значения, указывает на асимптотическую несмещенность. То, что, в конечном счете, оно превращается в единственную точку истинного значения, говорит о состоятельности оценки.

Влияние увеличения размера выборки на точность оценок - №24 - открытая онлайн библиотека

Рис. 10.

Оценки, типа показанных на рис. 10, весьма важны в регрессионном анализе. Иногда невозможно найти оценку, несмещенную на малых выборках. Если при этом вы можете найти хотя бы состоятельную оценку, это может быть лучше, чем не иметь никакой оценки, особенно если вы можете предположить направление смещения на малых выборках.

[1] См. приложение 1

[2] Подробнее об автокорреляции см. в разделе 4.