Формула бернулли примеры. Биномиальное распределение. Дискретные распределения в MS EXCEL. Наивероятнейшее число появлений события

На этом уроке будем находить вероятность наступления события в независимых испытаниях при повторении испытаний. Испытания называются независимыми, если вероятность того или иного исхода каждого испытания не зависит от того, какие исходы имели другие испытания . Независимые испытания могут проводиться как в одинаковых условиях, так и в различных. В первом случае вероятность появления некоторого события во всех испытаниях одна и та же, во втором случае она меняется от испытания к испытанию.

Примеры независимых повторных испытаний :

  • выйдет из строя один из узлов прибора или два, три узла, причём выход из строя каждого узла не зависит от другого узла, а вероятность выхода из строя одного узла постоянна во всех испытаниях;
  • произведённая в некоторых постоянных технологических условиях деталь, или три, четыре, пять деталей, окажутся нестандартными, причём одна деталь может оказаться нестандартной независимо от любой другой детали и вероятность того, что деталь окажется нестандатной, постоянна во всех испытаниях;
  • из нескольких выстрелов по мишени один, три или четыре выстрела попадают в цель независимо от исходов других выстрелов и вероятность попадания в цель постоянна во всех испытаниях;
  • при опускании монеты автомат сработает правильно один, два или другое число раз независимо от того, какой результат имели другие опускания монеты, и вероятность того, что автомат сработает правильно, постоянна во всех испытаниях.

Эти события можно описать одной схемой. Каждое событие наступает в каждом испытании с одной и той же вероятностью, которая не изменяется, если становятся известными результаты предыдущих испытаний. Такие испытания называются независимыми, а схема называется схемой Бернулли . Предполагается, что такие испытания могут быть повторены как угодно большое количество раз.

Если вероятность p наступления события A в каждом испытании постоянна, то вероятность того, что в n независимых испытаниях событие A наступит m раз, находится по формуле Бернулли :

(где q = 1 – p - вероятность того, что событие не наступит)

Поставим задачу – найти вероятность того, что событие такого типа в n независимых испытаниях наступит m раз.

Формула Бернулли: примеры решения задач

Пример 1. Найти вероятность того, что среди взятых случайно пяти деталей две стандартные, если вероятность того, что каждая деталь окажется стандартной, равна 0,9.

Решение. Вероятность события А , состоящего в том, что взятая случайно деталь стандартна, есть p =0,9 , а вероятность того, что она нестандартна, есть q =1–p =0,1 . Обозначенное в условии задачи событие (обозначим его через В ) наступит, если, например, первые две детали окажутся стандартными, а следующие три – нестандартными. Но событие В также наступит, если первая и третья детали окажутся стандартными, а остальные – нестандартными, или если вторая и пятая детали будут стандартными, а остальные – нестандартными. Имеются и другие возможности наступления события В . Любая из них характеризуется тем, что из пяти взятых деталей две, занимающие любые места из пяти, окажутся стандартными. Следовательно, общее число различных возможностей наступления события В равно числу возможностей размещения на пяти местах двух стандартных деталей, т.е. равно числу сочетаний из пяти элементов по два, а .

Вероятность каждой возможности по теореме умножения вероятностей равна произведению пяти множителей, из которых два, соответствующие появлению стандартных деталей, равны 0,9, а остальные три, соответствующие появлению нестандартных деталей, равны 0,1, т.е. эта вероятность составляет . Так как указанные десять возможностей являются несовместимыми событиями, по теореме сложения вероятность события В , которую обозначим

Пример 2. Вероятность того, что станок в течение часа потребует внимания рабочего, равна 0,6. Предполагая, что неполадки на станках независимы, найти вероятность того, что в течение часа внимания рабочего потребует какой-либо один станок из четырёх обслуживаемых им.

Решение. Используя формулу Бернулли при n =4 , m =1 , p =0,6 и q =1–p =0,4 , получим

Пример 3. Для нормальной работы автобазы на линии должно быть не менее восьми автомашин, а их имеется десять. Вероятность невыхода каждой автомашины на линию равна 0,1. Найти вероятность нормальной работы автобазы в ближайший день.

Решение. Автобаза будет работать нормально (событие F ), если на линию выйдут или восемь (событие А ), или девять (событие В ), или все десять автомашин событие (событие C ). По теореме сложения вероятностей,

Каждое слагаемое находим по формуле Бернулли . Здесь n =10 , m =8; 9; 10 , а p =1-0,1=0,9 , так как p должно означать вероятность выхода автомашины на линию; тогда q =0,1 . В результате получим

Пример 4. Пусть вероятность того, что покупателю необходима мужская обувь 41-го размера, равна 0,25. Найти вероятность того, что из шести покупателей по крайней мере двум необходима обувь 41-го размера.

Рассмотрим Биномиальное распределение, вычислим его математическое ожидание, дисперсию, моду. С помощью функции MS EXCEL БИНОМ.РАСП() построим графики функции распределения и плотности вероятности. Произведем оценку параметра распределения p, математического ожидания распределения и стандартного отклонения. Также рассмотрим распределение Бернулли.

Определение . Пусть проводятся n испытаний, в каждом из которых может произойти только 2 события: событие «успех» с вероятностью p или событие «неудача» с вероятностью q =1-p (так называемая Схема Бернулли, Bernoulli trials ).

Вероятность получения ровно x успехов в этих n испытаниях равна:

Количество успехов в выборке x является случайной величиной, которая имеет Биномиальное распределение (англ. Binomial distribution ) p и n являются параметрами этого распределения.

Напомним, что для применения схемы Бернулли и соответственно Биномиального распределения, должны быть выполнены следующие условия:

  • каждое испытание должно иметь ровно два исхода, условно называемых «успехом» и «неудачей».
  • результат каждого испытания не должен зависеть от результатов предыдущих испытаний (независимость испытаний).
  • вероятность успеха p должна быть постоянной для всех испытаний.

Биномиальное распределение в MS EXCEL

В MS EXCEL, начиная с версии 2010, для Биномиального распределения имеется функция БИНОМ.РАСП() , английское название - BINOM.DIST(), которая позволяет вычислить вероятность того, что в выборке будет ровно х «успехов» (т.е. функцию плотности вероятности p(x), см. формулу выше), и интегральную функцию распределения (вероятность того, что в выборке будет x или меньше «успехов», включая 0).

До MS EXCEL 2010 в EXCEL была функция БИНОМРАСП() , которая также позволяет вычислить функцию распределения и плотность вероятности p(x). БИНОМРАСП() оставлена в MS EXCEL 2010 для совместимости.

В файле примера приведены графики плотности распределения вероятности и .

Биномиальное распределения имеет обозначение B (n ; p ) .

Примечание : Для построения интегральной функции распределения идеально подходит диаграмма типа График , для плотности распределения Гистограмма с группировкой . Подробнее о построении диаграмм читайте статью Основные типы диаграмм.

Примечание : Для удобства написания формул в файле примера созданы Имена для параметров Биномиального распределения : n и p.

В файле примера приведены различные расчеты вероятности с помощью функций MS EXCEL:

Как видно на картинке выше, предполагается, что:

  • В бесконечной совокупности, из которой делается выборка, содержится 10% (или 0,1) годных элементов (параметр p , третий аргумент функции =БИНОМ.РАСП() )
  • Чтобы вычислить вероятность, того что в выборке из 10 элементов (параметр n , второй аргумент функции) будет ровно 5 годных элементов (первый аргумент), нужно записать формулу: =БИНОМ.РАСП(5; 10; 0,1; ЛОЖЬ)
  • Последний, четвертый элемент, установлен =ЛОЖЬ, т.е. возвращается значение функции плотности распределения .

Если значение четвертого аргумента =ИСТИНА, то функция БИНОМ.РАСП() возвращает значение интегральной функции распределения или просто Функцию распределения . В этом случае можно рассчитать вероятность того, что в выборке количество годных элементов будет из определенного диапазона, например, 2 или меньше (включая 0).

Для этого нужно записать формулу:
= БИНОМ.РАСП(2; 10; 0,1; ИСТИНА)

Примечание : При нецелом значении х, . Например, следующие формулы вернут одно и тоже значение:
=БИНОМ.РАСП(2 ; 10; 0,1; ИСТИНА)
=БИНОМ.РАСП(2,9 ; 10; 0,1; ИСТИНА)

Примечание : В файле примера плотность вероятности и функция распределения также вычислены с использованием определения и функции ЧИСЛКОМБ() .

Показатели распределения

В файле примера на листе Пример имеются формулы для расчета некоторых показателей распределения:

  • =n*p;
  • (квадрата стандартного отклонения) = n*p*(1-p);
  • = (n+1)*p;
  • =(1-2*p)*КОРЕНЬ(n*p*(1-p)).

Выведем формулу математического ожидания Биномиального распределения , используя Схему Бернулли .

По определению случайная величина Х в схеме Бернулли (Bernoulli random variable) имеет функцию распределения :

Это распределение называется распределение Бернулли .

Примечание : распределение Бернулли частный случай Биномиального распределения с параметром n=1.

Сгенерируем 3 массива по 100 чисел с различными вероятностями успеха: 0,1; 0,5 и 0,9. Для этого в окне Генерация случайных чисел установим следующие параметры для каждой вероятности p:

Примечание : Если установить опцию Случайное рассеивание (Random Seed ), то можно выбрать определенный случайный набор сгенерированных чисел. Например, установив эту опцию =25 можно сгенерировать на разных компьютерах одни и те же наборы случайных чисел (если, конечно, другие параметры распределения совпадают). Значение опции может принимать целые значения от 1 до 32 767. Название опции Случайное рассеивание может запутать. Лучше было бы ее перевести как Номер набора со случайными числами .

В итоге будем иметь 3 столбца по 100 чисел, на основании которых можно, например, оценить вероятность успеха p по формуле: Число успехов/100 (см. файл примера лист ГенерацияБернулли ).

Примечание : Для распределения Бернулли с p=0,5 можно использовать формулу =СЛУЧМЕЖДУ(0;1) , которая соответствует .

Генерация случайных чисел. Биномиальное распределение

Предположим, что в выборке обнаружилось 7 дефектных изделий. Это означает, что «очень вероятна» ситуация, что изменилась доля дефектных изделий p , которая является характеристикой нашего производственного процесса. Хотя такая ситуация «очень вероятна», но существует вероятность (альфа-риск, ошибка 1-го рода, «ложная тревога»), что все же p осталась без изменений, а увеличенное количество дефектных изделий обусловлено случайностью выборки.

Как видно на рисунке ниже, 7 – количество дефектных изделий, которое допустимо для процесса с p=0,21 при том же значении Альфа . Это служит иллюстрацией, что при превышении порогового значения дефектных изделий в выборке, p «скорее всего» увеличилось. Фраза «скорее всего» означает, что существует всего лишь 10% вероятность (100%-90%) того, что отклонение доли дефектных изделий выше порогового вызвано только сучайными причинами.

Таким образом, превышение порогового количества дефектных изделий в выборке, может служить сигналом, что процесс расстроился и стал выпускать бо льший процент бракованных изделий.

Примечание : До MS EXCEL 2010 в EXCEL была функция КРИТБИНОМ() , которая эквивалентна БИНОМ.ОБР() . КРИТБИНОМ() оставлена в MS EXCEL 2010 и выше для совместимости.

Связь Биномиального распределения с другими распределениями

Если параметр n Биномиального распределения стремится к бесконечности, а p стремится к 0, то в этом случае Биномиальное распределение может быть аппроксимировано .
Можно сформулировать условия, когда приближение распределением Пуассона работает хорошо:

  • p <0,1 (чем меньше p и больше n , тем приближение точнее);
  • p >0,9 (учитывая, что q =1- p , вычисления в этом случае необходимо производить через q х нужно заменить на n - x ). Следовательно, чем меньше q и больше n , тем приближение точнее).

При 0,1<=p<=0,9 и n*p>10 Биномиальное распределение можно аппроксимировать .

В свою очередь, Биномиальное распределение может служить хорошим приближением , когда размер совокупности N Гипергеометрического распределения гораздо больше размера выборки n (т.е., N>>n или n/N<<1).

Подробнее о связи вышеуказанных распределений, можно прочитать в статье . Там же приведены примеры аппроксимации, и пояснены условия, когда она возможна и с какой точностью.

СОВЕТ : О других распределениях MS EXCEL можно прочитать в статье .

Если производится несколько испытаний, причем вероятность события А в каждом испытании не зависит от исходов других испытаний, то такие испытания называют независимыми относительно события А .

В разных независимых испытаниях событие А может иметь либо различные вероятности, либо одну и ту же вероятность. Будем далее рассматривать лишь такие независимые испытания, в которых событие А имеет одну и ту же вероятность.

Ниже воспользуемся понятием сложного события, понимая под ним совмещение нескольких отдельных событий, которые называют простыми .

Пусть производится n независимых испытаний, в каждом из которых событие А может появиться либо не появиться. Условимся считать, что вероятность события A в каждом испытании одна и та же, а именно равна р . Следовательно, вероятность ненаступления события А в каждом испытании также постоянна и равна q = 1 - p .

Поставим перед собой задачу вычислить вероятность того, что при n испытаниях событие А осуществится ровно k раз и, следовательно, не осуществится n - k раз. Важно подчеркнуть, что не требуется, чтобы событие А повторилось ровно k раз в определенной последовательности.

Например, если речь идет о появлении события А три раза в четырех испытаниях, то возможны следующие сложные события: ААА, ААА, ААА, ААА . Запись ААА означает, что в первом, втором и третьем испытаниях событие А наступило, а в четвертом испытании оно не появилось, т.е. наступило противоположное событие А; соответственный смысл имеют и другие записи.

Искомую вероятность обозначим Р п (k) . Например, символ Р 5 (3) означает вероятность того, что в пяти испытаниях событие появится ровно 3 раза и, следовательно, не наступит 2 раза.

Поставленную задачу можно решить с помощью так называемой формулы Бернулли.

Вывод формулы Бернулли . Вероятность одного сложного события, состоящего в том, что в п испытаниях событие А наступит k раз и не наступит п - k раз, по теореме умножения вероятностей независимых событий равна p k q n - k . Таких сложных событий может быть столько, сколько можно составить сочетаний из п элементов по k элементов, т.е. С n k .

Так как эти сложные события несовместны , то по теореме сложения вероятностей несовместных событий искомая вероятность равна сумме вероятностей всех возможных сложных событий . Поскольку же вероятности всех этих сложных событий одинаковы, то искомая вероятность (появления k раз события А в п испытаниях) равна вероятности одного сложного события, умноженной на их число:

Полученную формулу называют формулой Бернулли .

Пример 1 . Вероятность того, что расход электроэнергии в течение одних суток не превысит установленной нормы, равна р = 0,75 . Найти вероятность того, что в ближайшие 6 суток расход электроэнергии в течение 4 суток не превысит нормы.


Решение . Вероятность нормального расхода электроэнергии в продолжение каждых из 6 суток постоянна и равна р = 0,75 . Следовательно, вероятность перерасхода электроэнергии в каждые сутки также постоянна и равна q = 1 - р = 1 - 0,75 = 0,25.

Искомая вероятность по формуле Бернулли равна:


Определение повторных независимых испытаний. Формулы Бернулли для вычисления вероятности и наивероятнейшего числа. Асимптотические формулы для формулы Бернулли (локальная и интегральная, теоремы Лапласа). Использование интегральной теоремы. Формула Пуассона, для маловероятных случайных событий.

Повторные независимые испытания

На практике приходится сталкиваться с такими задачами, которые можно представить в виде многократно повторяющихся испытаний, в результате каждого из которых может появиться или не появиться событие A . При этом интерес представляет исход не каждого "отдельного испытания, а общее количество появлений события A в результате определенного количества испытаний. В подобных задачах нужно уметь определять вероятность любого числа m появлений события A в результате n испытаний. Рассмотрим случай, когда испытания являются независимыми и вероятность появления события A в каждом испытании постоянна. Такие испытания называются повторными независимыми.

Примером независимых испытаний может служить проверка на годность изделий, взятых по одному из ряда партий. Если в этих партиях процент брака одинаков, то вероятность того, что отобранное изделие будет бракованным, в каждом случае является постоянным числом.

Формула Бернулли

Воспользуемся понятием сложного события , под которым подразумевается совмещение нескольких элементарных событий, состоящих в появлении или непоявлении события A в i –м испытании. Пусть проводится n независимых испытаний, в каждом из которых событие A может либо появиться с вероятностью p , либо не появиться с вероятностью q=1-p . Рассмотрим событие B_m , состоящее в том, что событие A в этих n испытаниях наступит ровно m раз и, следовательно, не наступит ровно (n-m) раз. Обозначим A_i~(i=1,2,\ldots,{n}) появление события A , a \overline{A}_i - непоявление события A в i –м испытании. В силу постоянства условий испытания имеем

Событие A может появиться m раз в разных последовательностях или комбинациях, чередуясь с противоположным событием \overline{A} . Число возможных комбинаций такого рода равно числу сочетаний из n элементов по m , т. е. C_n^m . Следовательно, событие B_m можно представить в виде суммы сложных несовместных между собой событий, причем число слагаемых равно C_n^m :

B_m=A_1A_2\cdots{A_m}\overline{A}_{m+1}\cdots\overline{A}_n+\cdots+\overline{A}_1\overline{A}_2\cdots\overline{A}_{n-m}A_{n-m+1}\cdots{A_n},


где в каждое произведение событие A входит m раз, а \overline{A} - (n-m) раз.

Вероятность каждого сложного события, входящего в формулу (3.1), по теореме умножения вероятностей для независимых событий равна p^{m}q^{n-m} . Так как общее количество таких событий равно C_n^m , то, используя теорему сложения вероятностей для несовместных событий, получаем вероятность события B_m (обозначим ее P_{m,n} )

P_{m,n}=C_n^mp^{m}q^{n-m}\quad \text{or}\quad P_{m,n}=\frac{n!}{m!(n-m)!}p^{m}q^{n-m}.

Формулу (3.2) называют формулой Бернулли , а повторяющиеся испытания, удовлетворяющие условию независимости и постоянства вероятностей появления в каждом из них события A , называют испытаниями Бернулли , или схемой Бернулли .

Пример 1. Вероятность выхода за границы поля допуска при обработке деталей на токарном станке равна 0,07. Определить вероятность того, что из пяти наудачу отобранных в течение смены деталей у одной размеры диаметра не соответствуют заданному допуску.

Решение. Условие задачи удовлетворяет требования схемы Бернулли. Поэтому, полагая n=5,\,m=1,\,p=0,\!07 , по формуле (3.2) получаем

P_{1,5}=C_5^1(0,\!07)^{1}(0,\!93)^{5-1}\approx0,\!262.

Пример 2. Наблюдениями установлено, что в некоторой местности в сентябре бывает 12 дождливых дней. Какова вероятность того, что из случайно взятых в этом месяце 8 дней 3 дня окажутся дождливыми?

Решение.

P_{3;8}=C_8^3{\left(\frac{12}{30}\right)\!}^3{\left(1-\frac{12}{30}\right)\!}^{8-3}=\frac{8!}{3!(8-3)!}{\left(\frac{2}{5}\right)\!}^3{\left(\frac{3}{5}\right)\!}^5=56\cdot\frac{8}{125}\cdot\frac{243}{3125}=\frac{108\,864}{390\,625}\approx0,\!2787.

Наивероятнейшее число появлений события

Наивероятнейшим числом появления события A в n независимых испытаниях называется такое число m_0 , для которого вероятность, соответствующая этому числу, превышает или, по крайней мере, не меньше вероятности каждого из остальных возможных чисел появления события A . Для определения наивероятнейшего числа не обязательно вычислять вероятности возможных чисел появлений события, достаточно знать число испытаний n и вероятность появления события A в отдельном испытании. Обозначим P_{m_0,n} вероятность, соответствующую наивероятнейшему числу m_0 . Используя формулу (3.2), записываем

P_{m_0,n}=C_n^{m_0}p^{m_0}q^{n-m_0}=\frac{n!}{m_0!(n-m_0)!}p^{m_0}q^{n-m_0}.

Согласно определению наивероятнейшего числа, вероятности наступления события A соответственно m_0+1 и m_0-1 раз должны, по крайней мере, не превышать вероятность P_{m_0,n} , т. е.

P_{m_0,n}\geqslant{P_{m_0+1,n}};\quad P_{m_0,n}\geqslant{P_{m_0-1,n}}

Подставляя в неравенства значение P_{m_0,n} и выражения вероятностей P_{m_0+1,n} и P_{m_0-1,n} , получаем

Решая эти неравенства относительно m_0 , получаем

M_0\geqslant{np-q},\quad m_0\leqslant{np+p}

Объединяя последние неравенства, получаем двойное неравенство, которое используют для определения наивероятнейшего числа:

Np-q\leqslant{m_0}\leqslant{np+p}.

Так как длина интервала, определяемого неравенством (3.4), равна единице, т. е.

(np+p)-(np-q)=p+q=1,


и событие может произойти в n испытаниях только целое число раз, то следует иметь в виду, что:

1) если np-q - целое число, то существуют два значения наивероятнейшего числа, а именно: m_0=np-q и m"_0=np-q+1=np+p ;

2) если np-q - дробное число, то существует одно наивероятнейшее число, а именно: единственное целое, заключенное между дробными числами, полученными из неравенства (3.4);

3) если np - целое число, то существует одно наивероятнейшее число, а именно: m_0=np .

При больших значениях n пользоваться формулой (3.3) для расчета вероятности, соответствующей наивероятнейшему числу, неудобно. Если в равенство (3.3) подставить формулу Стирлинга

N!\approx{n^ne^{-n}\sqrt{2\pi{n}}},


справедливую для достаточно больших n , и принять наивероятнейшее число m_0=np , то получим формулу для приближенного вычисления вероятности, соответствующей наивероятнейшему числу:

P_{m_0,n}\approx\frac{n^ne^{-n}\sqrt{2\pi{n}}\,p^{np}q^{nq}}{(np)^{np}e^{-np}\sqrt{2\pi{np}}\,(nq)^{nq}e^{-nq}\sqrt{2\pi{nq}}}=\frac{1}{\sqrt{2\pi{npq}}}=\frac{1}{\sqrt{2\pi}\sqrt{npq}}.

Пример 2. Известно, что \frac{1}{15} часть продукции, поставляемой заводом на торговую базу, не удовлетворяет всем требованиям стандарта. На базу была завезена партия изделий в количестве 250 шт. Найти наивероятнейшее число изделий, удовлетворяющих требованиям стандарта, и вычислить вероятность того, что в этой партии окажется наивероятнейшее число изделий.

Решение. По условию n=250,\,q=\frac{1}{15},\,p=1-\frac{1}{15}=\frac{14}{15} . Согласно неравенству (3.4) имеем

250\cdot\frac{14}{15}-\frac{1}{15}\leqslant{m_0}\leqslant250\cdot\frac{14}{15}+\frac{1}{15}


откуда 233,\!26\leqslant{m_0}\leqslant234,\!26 . Следовательно, наивероятнейшее число изделий, удовлетворяющих требованиям стандарта, в партии из 250 шт. равно 234. Подставляя данные в формулу (3.5), вычисляем вероятность наличия в партии наивероятнейшего числа изделий:

P_{234,250}\approx\frac{1}{\sqrt{2\pi\cdot250\cdot\frac{14}{15}\cdot\frac{1}{15}}}\approx0,\!101

Локальная теорема Лапласа

Пользоваться формулой Бернулли при больших значениях n очень трудно. Например, если n=50,\,m=30,\,p=0,\!1 , то для отыскания вероятности P_{30,50} надо вычислить значение выражения

P_{30,50}=\frac{50!}{30!\cdot20!}\cdot(0,\!1)^{30}\cdot(0,\!9)^{20}

Естественно, возникает вопрос: нельзя ли вычислить интересующую вероятность, не используя формулу Бернулли? Оказывается, можно. Локальная теорема Лапласа дает асимптотическую формулу, которая позволяет приближенно найти вероятность появления событий ровно m раз в n испытаниях, если число испытаний достаточно велико.

Теорема 3.1. Если вероятность p появления события A в каждом испытании постоянна и отлична от нуля и единицы, то вероятность P_{m,n} того, что событие A появится в n испытаниях ровно m раз, приближенно равна (тем точнее, чем больше n ) значению функции

Y=\frac{1}{\sqrt{npq}}\frac{e^{-x^2/2}}{\sqrt{2\pi}}=\frac{\varphi(x)}{\sqrt{npq}} при .

Существуют таблицы, которые содержат значения функции \varphi(x)=\frac{1}{\sqrt{2\pi}}\,e^{-x^2/2}} , соответствующие положительным значениям аргумента x . Для отрицательных значений аргумента используют те же таблицы, так как функция \varphi(x) четна, т. е. \varphi(-x)=\varphi(x) .


Итак, приближенно вероятность того, что событие A появится в n испытаниях ровно m раз,

P_{m,n}\approx\frac{1}{\sqrt{npq}}\,\varphi(x), где x=\frac{m-np}{\sqrt{npq}} .

Пример 3. Найти вероятность того, что событие A наступит ровно 80 раз в 400 испытаниях, если вероятность появления события A в каждом испытании равна 0,2.

Решение. По условию n=400,\,m=80,\,p=0,\!2,\,q=0,\!8 . Воспользуемся асимптотической, формулой Лапласа:

P_{80,400}\approx\frac{1}{\sqrt{400\cdot0,\!2\cdot0,\!8}}\,\varphi(x)=\frac{1}{8}\,\varphi(x).

Вычислим определяемое данными задачи значение x :

X=\frac{m-np}{\sqrt{npq}}=\frac{80-400\cdot0,\!2}{8}=0.

По таблице прил, 1 находим \varphi(0)=0,\!3989 . Искомая вероятность

P_{80,100}=\frac{1}{8}\cdot0,\!3989=0,\!04986.

Формула Бернулли приводит примерно к такому же результату (выкладки ввиду их громоздкости опущены):

P_{80,100}=0,\!0498.

Интегральная теорема Лапласа

Предположим, что проводится n независимых испытаний, в каждом из которых вероятность появления события A постоянна и равна p . Необходимо вычислить вероятность P_{(m_1,m_2),n} того, что событие A появится в n испытаниях не менее m_1 и не более m_2 раз (для краткости будем говорить "от m_1 до m_2 раз"). Это можно сделать с помощью интегральной теоремы Лапласа.

Теорема 3.2. Если вероятность p наступления события A в каждом испытании постоянна и отлична от нуля и единицы, то приближенно вероятность P_{(m_1,m_2),n} того, что событие A появится в испытаниях от m_1 до m_2 раз,

P_{(m_1,m_2),n}\approx\frac{1}{\sqrt{2\pi}}\int\limits_{x"}^{x""}e^{-x^2/2}\,dx, где .

При решении задач, требующих применения интегральной теоремы Лапласа, пользуются специальными таблицами, так как неопределенный интеграл \int{e^{-x^2/2}\,dx} не выражается через элементарные функции. Таблица для интеграла \Phi(x)=\frac{1}{\sqrt{2\pi}}\int\limits_{0}^{x}e^{-z^2/2}\,dz приведена в прил. 2, где даны значения функции \Phi(x) для положительных значений x , для x<0 используют ту же таблицу (функция \Phi(x) нечетна, т. е. \Phi(-x)=-\Phi(x) ). Таблица содержит значения функции \Phi(x) лишь для x\in ; для x>5 можно принять \Phi(x)=0,\!5 .

Итак, приближенно вероятность того, что событие A появится в n независимых испытаниях от m_1 до m_2 раз,

P_{(m_1,m_2),n}\approx\Phi(x"")-\Phi(x"), где x"=\frac{m_1-np}{\sqrt{npq}};~x""=\frac{m_2-np}{\sqrt{npq}} .

Пример 4. Вероятность того, что деталь изготовлена с нарушениями стандартов, p=0,\!2 . Найти вероятность того, что среди 400 случайно отобранных деталей нестандартных окажется от 70 до 100 деталей.

Решение. По условию p=0,\!2,\,q=0,\!8,\,n=400,\,m_1=70,\,m_2=100 . Воспользуемся интегральной теоремой Лапласа:

P_{(70,100),400}\approx\Phi(x"")-\Phi(x").

Вычислим пределы интегрирования:


нижний

X"=\frac{m_1-np}{\sqrt{npq}}=\frac{70-400\cdot0,\!2}{\sqrt{400\cdot0,\!2\cdot0,\!8}}=-1,\!25,


верхний

X""=\frac{m_2-np}{\sqrt{npq}}=\frac{100-400\cdot0,\!2}{\sqrt{400\cdot0,\!2\cdot0,\!8}}=2,\!5,

Таким образом

P_{(70,100),400}\approx\Phi(2,\!5)-\Phi(-1,\!25)=\Phi(2,\!5)+\Phi(1,\!25).

По таблице прил. 2 находим

\Phi(2,\!5)=0,\!4938;~~~~~\Phi(1,\!25)=0,\!3944.

Искомая вероятность

P_{(70,100),400}=0,\!4938+0,\!3944=0,\!8882.

Применение интегральной теоремы Лапласа

Если число m (число появлений события A при n независимых испытаниях) будет изменяться от m_1 до m_2 , то дробь \frac{m-np}{\sqrt{npq}} будет изменяться от \frac{m_1-np}{\sqrt{npq}}=x" до \frac{m_2-np}{\sqrt{npq}}=x"" . Следовательно, интегральную теорему Лапласа можно записать и так:

P\left\{x"\leqslant\frac{m-np}{\sqrt{npq}}\leqslant{x""}\right\}=\frac{1}{\sqrt{2\pi}}\int\limits_{x"}^{x""}e^{-x^2/2}\,dx.

Поставим задачу найти вероятность того, что отклонение относительной частоты \frac{m}{n} от постоянной вероятности p по абсолютной величине не превышает заданного числа \varepsilon>0 . Другими словами, найдем вероятность осуществления неравенства \left|\frac{m}{n}-p\right|\leqslant\varepsilon , что то же самое, -\varepsilon\leqslant\frac{m}{n}-p\leqslant\varepsilon . Эту вероятность будем обозначать так: P\left\{\left|\frac{m}{n}-p\right|\leqslant\varepsilon\right\} . С учетом формулы (3.6) для данной вероятности получаем

P\left\{\left|\frac{m}{n}-p\right|\leqslant\varepsilon\right\}\approx2\Phi\left(\varepsilon\,\sqrt{\frac{n}{pq}}\right).

Пример 5. Вероятность того, что деталь нестандартна, p=0,\!1 . Найти вероятность того, что среди случайно отобранных 400 деталей относительная частота появления нестандартных деталей отклонится от вероятности p=0,\!1 по абсолютной величине не более чем на 0,03.

Решение. По условию n=400,\,p=0,\!1,\,q=0,\!9,\,\varepsilon=0,\!03 . Требуется найти вероятность P\left\{\left|\frac{m}{400}-0,\!1\right|\leqslant0,\!03\right\} . Используя формулу (3.7), получаем

P\left\{\left|\frac{m}{400}-0,\!1\right|\leqslant0,\!03\right\}\approx2\Phi\left(0,\!03\sqrt{\frac{400}{0,\!1\cdot0,\!9}}\right)=2\Phi(2)

По таблице прил. 2 находим \Phi(2)=0,\!4772 , следовательно, 2\Phi(2)=0,\!9544 . Итак, искомая вероятность приближенно равна 0,9544. Смысл полученного результата таков: если взять достаточно большое число проб по 400 деталей в каждой, то примерно в 95,44% этих проб отклонение относительной частоты от постоянной вероятности p=0,\!1 по абсолютной величине не превысит 0,03.

Формула Пуассона для маловероятных событий

Если вероятность p наступления события в отдельном испытании близка к нулю, то даже при большом числе испытаний n , но при небольшом значении произведения np получаемые по формуле Лапласа значения вероятностей P_{m,n} оказываются недостаточно точными и возникает потребность в другой приближенной формуле.

Теорема 3.3. Если вероятность p наступления события A в каждом испытании постоянна, но мала, число независимых испытаний n достаточно велико, но значение произведения np=\lambda остается небольшим (не больше десяти), то вероятность того, что в этих испытаниях событие A наступит m раз,

P_{m,n}\approx\frac{\lambda^m}{m!}\,e^{-\lambda}.

Для упрощения расчетов с применением формулы Пуассона составлена таблица значений функции Пуассона \frac{\lambda^m}{m!}\,e^{-\lambda} (см. прил. 3).

Пример 6. Пусть вероятность изготовления нестандартной детали равна 0,004. Найти вероятность того, что среди 1000 деталей окажется 5 нестандартных.

Решение. Здесь n=1000,p=0,004,~\lambda=np=1000\cdot0,\!004=4 . Все три числа удовлетворяют требованиям теоремы 3.3, поэтому для нахождения вероятности искомого события P_{5,1000} применяем формулу Пуассона. По таблице значений функции Пуассона (прил. 3) при \lambda=4;m=5 получаем P_{5,1000}\approx0,\!1563 .

Найдем вероятность того же события по формуле Лапласа. Для этого сначала вычисляем значение x , соответствующее m=5 :

X=\frac{5-1000\cdot0,\!004}{\sqrt{1000\cdot0,\!004\cdot0,\!996}}\approx\frac{1}{1,\!996}\approx0,\!501.

Поэтому согласно формуле Лапласа искомая вероятность

P_{5,1000}\approx\frac{\varphi(0,\!501)}{1,\!996}\approx\frac{0,\!3519}{1,\!996}\approx0,\!1763


а согласно формуле Бернулли точное ее значение

P_{5,1000}=C_{1000}^{5}\cdot0,\!004^5\cdot0,\!996^{995}\approx0,\!1552.

Таким образом, относительная ошибка вычисления вероятностей P_{5,1000} по приближенной формуле Лапласа составляет

\frac{0,\!1763-0,\!1552}{0,\!1552}\approx0,\!196 , или 13,\!6\%


а по формуле Пуассона -

\frac{0,\!1563-0,\!1552}{0,\!1552}\approx0,\!007 , или 0,\!7\%

Т. е. во много раз меньше.
Перейти к следующему разделу
Одномерные случайные величины
В вашем браузере отключен Javascript.
Чтобы произвести расчеты, необходимо разрешить элементы ActiveX!

1

1. Боголюбов А.Н. Математики. Механики: биографический справочник. – Киев: Наукова думка, 1983.

2. Гулай Т.А., Долгополова А.Ф., Литвин Д.Б. Анализ и оценка приоритетности разделов математических дисциплин, изучаемых студентами экономических специальностей аграрных вузов // Вестник АПК Ставрополья. – 2013. – № 1 (9). – С. 6-10.

3. Долгополова А.Ф., Гулай Т.А., Литвин Д.Б. Перспективы применения математических методов в экономических исследованиях // Аграрная наука, творчество, рост. – 2013. – С. 255-257.

В математике довольно часто встречаются задачи, в которых присутствует большое количество повторений одного и того же условия, испытания или эксперимента. Результатом каждого испытания будет считаться совершенно другой результат от наступившего предыдущего. Зависимости в результатах так же наблюдаться не будет. В качестве результата испытания можно различить несколько возможностей элементарных последствий: возникновение события (А) или же возникновение события, которое дополняет А.

Тогда попробуем предположить, что вероятность возникновения события Р(А) регулярна и равна р (0<р<1).

Примерами такого испытания может быть большое количество задач, таких как подбрасывание монетки, извлечение из темного мешка черно-белых шаров или же рождение черно-белых кроликов.

Такой эксперимент называют конфигурацией повторных независимых испытаний или схемой Бернулли.

Якоб Бернулли родился в семье фармацевта. Отец пытался наставить сына на медицинский путь, но Я. Бернулли увлекся математикой самостоятельно, а позже это стало его профессией. Ему принадлежат различные трофеи в работах на темы по теории вероятностей и чисел, рядов и дифференциальном исчислении. Изучив теорию вероятности по одной изработ Гюйгенса «О расчетах в азартной игре», Якоб увлекся этим. В данной книге не было даже четкого определения концепции «вероятность». Именно Я. Бернулли ввел в математику большую часть современных понятий теории вероятностей. Так же Бернулли первымвыразил свой вариант закона больших чисел. Имя Якоба носят различные работы, теоремы и схемы: «Числа Бернулли», «Многочлен Бернулли», «Дифференциальное уравнение Бернулли», «Распределение Бернулли» и «Уравнение Бернулли».

Вернемся к повторениям. Как уже было указано выше, то в итоге различных испытаний возможны два исхода: либо появится событие А, либо противоположность этому событию. Сама схема Бернулли обозначает производство n-го количества типовых вольных опытов, и в каждом из этих опытов может появится нужное нам событие А (вероятность этого события известна: Р(А)=р), вероятность противоположного события событию А обозначена за q=P(A)=1-p. Требуется определение вероятности, что при проведении испытаний неизвестного количества событие А появится ровно k раз.

Важно помнить о главном условии при решении задач при помощи схемы Бернулли-это постоянство. Без него схема теряет всякий смысл.

Этой схемой можно пользоваться для решения задач различного уровня сложности: от простых (та же монетка) до сложных (проценты). Однако чаще схема Бернулли применяется в решении таких задач, которые связаны с контролем свойств различной продукции и уверенности в самых разных механизмах. Только для решения задачи до начала работы должны быть известны заранее все условия и значения.

Не все задачи в теории вероятностей сводятся к постоянству в условиях. Даже если взять в пример черные и белые шары в темном мешке: при вытягивании одного шара соотношение количества и цветов шариков в мешке изменилось, а значит изменилась и сама вероятность.

Однако если же условия у нас постоянны, то мы можем точно определить требуемую от нас вероятность того, что событие А произойдет ровно kраз из n возможных.

Этот факт Якоб Бернулли скомпоновал в теорему, которую впоследствии стали называть его именем. «Теорема Бернулли» является одной из главных теорем в теории вероятности. Впервые ее опубликовали в труде Я.Бернулли «Искусство предположений». Что же представляет из себя эта теорема? «Если вероятность р наступления события А в каждом испытании постоянна, то вероятность Рk,n того, что событие наступит k раз в n испытаниях, не зависящих друг от друга равна: , где q=1-p».

В доказательство действенности формулы можно привести задачи.

Задача № 1:

Из n стеклянных банок за месяц хранения k разбиваются. Наугад взяли m банок. Найти вероятность, что среди этих банок l не разобьются. n=250, k=10, m=8,l=4.

Решение: Имеем схему Бернулли со значениями:

p=10/250=0,04 (вероятность того, что банки разобьются);

n=8 (число испытаний);

k=8-4=4 (количество разбитых банок).

Используем формулу Бернулли

Получили:

Ответ: 0,0141

Задача № 2:

Вероятность изготовления неисправного изделия на производстве равна 0,2. Найти вероятность того, что из 10 изготовленных на этом производстве изделий ровно k должны быть исправны. Выполнить решение для k = 0, 1, 10.

Нам интересно событие A - изготовление исправных деталей, случающееся раз в час с вероятностью p=1-0,2=0,8. Надо найти вероятность того, что данное событие совершится k раз. Событию A противоположно событие «не A», т.е. изготовление неисправного изделия.

Следовательно, мы имеем: n=10; p=0,8; q=0,2.

В итоге найдем вероятность того, что из 10 изготовленных изделий все изделия неисправны (k=0), что одно изделие исправно (k=1), что неисправных нет вообще (k=10):

В заключении хотелось бы отметить, что в современности многие ученые пытаются доказать, что «формула Бернулли» не соответствует законам природы и можно решить задачи, не применяя ее к использованию. Конечно это возможно, большинство задач по теории вероятности возможно выполнить без формулы Бернулли, главное не запутаться в больших объемах цифр.

Библиографическая ссылка

Хомутова Е.А., Калиниченко В.А. ФОРМУЛА БЕРНУЛЛИ В ТЕОРИИ ВЕРОЯТНОСТИ // Международный студенческий научный вестник. – 2015. – № 3-4.;
URL: http://eduherald.ru/ru/article/view?id=14141 (дата обращения: 12.03.2019). Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»