Оценка вероятности события

Пусть нас интересует вероятность p некоторого события A и для её определения проведено n независимых, однородных испытаний. Пусть m(A) - число появлений события A при n испытаниях. Мы хотим понять, насколько хорошо относительная частота Оценка вероятности события - №1 - открытая онлайн библиотека = m(A)/n оценивает p.

Поскольку Оценка вероятности события - №2 - открытая онлайн библиотека является случайной величиной и может отличаться от оцениваемого параметра, то возникает необходимость в оценке точности и надёжности найденного, то есть требуется знать, к каким ошибкам может привести замена неизвестного параметра его оценкой и с какой уверенностью можно ожидать, что ошибка не выйдет за известные пределы. С этой целью строится интервальная оценка, то есть по данным выборки указывается интервал, который с заданной и достаточно близкой к 1 вероятностью Оценка вероятности события - №3 - открытая онлайн библиотека (её называют доверительной вероятностью или надёжностью оценки) накрывает неизвестный параметр.

Рассмотрим отклонение относительной частоты n(А) от вероятности p , то есть разность Оценка вероятности события - №4 - открытая онлайн библиотека .

Воспользуемся тем, что по теореме Муавра-Лапласа величина Оценка вероятности события - №5 - открытая онлайн библиотека распределена приблизительно нормально и снова используем то, что для нормально распределенной величины x~N(0,1):

Оценка вероятности события - №6 - открытая онлайн библиотека

Оценка вероятности события - №7 - открытая онлайн библиотека .

Следовательно

Оценка вероятности события - №8 - открытая онлайн библиотека и

Оценка вероятности события - №9 - открытая онлайн библиотека .

Мы определили выше числоkbкак корень уравнения Оценка вероятности события - №10 - открытая онлайн библиотека . Тогда с вероятностьюbвыполняется: неравенство

Оценка вероятности события - №11 - открытая онлайн библиотека .

Полученная оценка справедлива при больших n и обладает тем недостатком, что зависит от p - неизвестной величины. От второго затруднения можно уйти, заменив в подкоренных выражениях p на Оценка вероятности события - №12 - открытая онлайн библиотека (вспомним, что Оценка вероятности события - №12 - открытая онлайн библиотека сходится по вероятности к p, что дает

Оценка вероятности события - №14 - открытая онлайн библиотека . (2.28)

Что касается величины n, то практически удовлетворительный результат получается при npq > 9 .

Интервал, задаваемой формулой (2.28) и накрывающий параметр с вероятностью b, называется доверительным, b- это доверительная вероятность или уровень доверия, а a = 1-b – вероятность ошибки.

Пример . Из подвергнутых испытаниям на сортность 100 единиц товара из большой партии 80 выдержали его. Найти интервальную оценку для вероятности того, что произвольно выбранный образец является высокосортным, при условии, что оценка окажется неправильной не более, чем в 5% случаев.

Решение. В качестве точечной оценки неизвестного параметра принимаем Оценка вероятности события - №15 - открытая онлайн библиотека . По доверительной вероятности b=0,95 с помощью таблицы значений функции Лапласа находим kb= 1,96 и затем по формуле (2.28) определяем двусторонний доверительный интервал:

Оценка вероятности события - №16 - открытая онлайн библиотека

- с гарантией 0,95 доля высокосортного товара партии составляет от 72% до 88%.