Биномиальное распределение случайной величины. Биномиальное распределение. Биномиальное распределение и расчёты в MS Excel

Рассмотрим осуществление схемы Бернулли , т.е. прозводится серия повторных независимых испытаний, в каждом из которых данное событие А имеет одну и ту же вероятность , не зависящую от номера испытания. И для каждого испытания имеются только два исхода:

1) событие А - успех;

2) событие - неуспех,

с постоянными вероятностями

Введем в рассмотрение дискретную случайную величину Х - «число появлений события А при п испытаниях» и найдем закон распределения этой случайной величины. Величина Х может принимать значения

Вероятность того, что случайную величину Х примет значение x k находится по формуле Бернулли

Закон распределения дискретной случайной величины, определяемый формулой Бернулли (1), называется биномиальным законом распределения . Постоянные п и р (q=1-p) , входящие в формулу (1) называются параметрами биномиального распределения.

Название «биномиальное распределение» связано с тем, что правая часть в равенстве (1) это общий член разложения бинома Ньютона ,т.е.

(2)

А так как p+q=1 , то правая часть равенства (2) равна 1

Это означает, что

(4)

В равенстве (3) первый член q n в правой части означает вероятность того, что в п испытаниях событие А не появится ни разу, второй член вероятность того, что событие А появится один раз, третий член - вероятность, что событие А появится два раза и наконец, последний член р п - вероятность того, что событие А появится ровно п раз.

Биномиальный закон распределения дискретной случайной величины представляют в виде таблицы:

Х 0 1 k n
Р q n р п

Основные числовые характеристики биномиального распределения:

1) математическое ожидание (5)

2) дисперсия (6)

3) среднее квадратическое отклонение (7)

4) наивероятнейшее число появление события k 0 - это число которому при заданном п соответствует максимальная биномиальная вероятность

При заданных п и р это число определяется неравенствами

(8)

если число пр+р не является целым, то k 0 равно целой части этого числа, если же пр+р - целое число, то k 0 имеет два значения

Биномиальный закон распределения вероятностей применяется в теории стрельбы, в теории и практике статистического контроля качества продукции, в теории массового обслуживания, в теории надежности и т.д. Этот закон может применяться во всех случаях, когда имеет место последовательность независимых испытаний.

Пример 1: Проверкой качества установлено, что из каждых 100 приборов не имеют дефекты 90 штук в среднем. Составить биномиальный закон распределения вероятностей числа качественных приборов из приобретенных наугад 4.


Решение: Событие А - появление которого проверяется это - «приобретенный наугад прибор качественный». По условию задачи основные параметры биномиального распределения:

Случайная величина Х - число качественных приборов из взятых 4, значит значения Х -Найдем вероятности значений Х по формуле (1):


Таким образом, закон распределения величины Х - число качественных приборов из взятых 4:

Х 0 1 2 3 4
Р 0,0001 0,0036 0,0486 0,2916 0,6561

Для проверки правильности построения распределения проверим чему равна сумма вероятностей

Ответ: Закон распределения

Х 0 1 2 3 4
Р 0,0001 0,0036 0,0486 0,2916 0,6561

Пример 2: Применяемый метод лечения приводит к выздоровлению в 95 % случаев. Пятеро больных применяли данный метод. Найти наивероятнейшее число выздоровевших, а так же числовые характеристики случайной величины Х - число выздоровевших из 5 больных применявших данный метод.

Здравствуйте! Мы уже знаем, что такое распределение вероятностей. Оно может быть дискретным или непрерывным, и мы узнали, что его называют плотностью распределения вероятностей. Теперь давайте изучим парочку более распространенных распределений. Предположим, у меня есть монета, причем правильная монета, и я собираюсь ее подбросить 5 раз. Также я определю случайную величину Х, обозначу ее заглавной буквой X, она будет равна количеству «орлов» при 5 подбрасываниях. Может, у меня есть 5 монет, я подброшу их все сразу и посчитаю, сколько у меня выпало «орлов». Или у меня могла бы быть одна монета, я могла бы ее подбросить 5 раз и посчитать, сколько раз у меня выпал «орел». Это, собственно, не имеет значения. Но давайте предположим, что у меня одна монета, и я подброшу ее 5 раз. Тогда у нас не будет неопределенности. Итак, вот определение моей случайной величины. Как мы знаем, случайная величина немного отличается от обычной переменной, она больше похожа на функцию. Она присваивает какое-то значение эксперименту. И эта случайная величина довольно проста. Мы просто считаем, сколько раз выпал «орел» после 5 подбрасываний, – это и есть наша случайная величина X. Давайте подумаем, какие могут быть вероятности разных значений в нашем случае? Так, какова вероятность того, что Х (заглавная Х) равна 0? Т.е. какова вероятность того, что после 5 подбрасываний ни разу не выпадет «орел»? Ну, это, по сути, то же самое, что вероятность выпадения одних «решек» (это так, небольшой обзор теории вероятностей). У вас должны выпасть одни «решки». Какова вероятность каждой из этих «решек»? Это 1/2. Т.е. здесь должно быть 1/2 умножить на 1/2, на 1/2, на 1/2 и снова на 1/2. Т.е. (1/2)⁵. 1⁵=1, разделить на 2⁵, т.е. на 32. Вполне логично. Так… Я немного повторю то, что мы проходили по теории вероятностей. Это важно для того, чтобы понимать, куда мы сейчас движемся и как, собственно, формируется дискретное распределение вероятностей. Итак, а какова вероятность того, что у нас ровно 1 раз выпадет «орел»? Ну, «орел» мог бы выпасть при первом подбрасывании. Т.е. могло бы быть так: «орел», «решка», «решка», «решка», «решка». Или «орел» мог бы выпасть при втором подбрасывании. Т.е. могла бы быть такая комбинация: «решка», «орел», «решка», «решка», «решка» и так далее. Один «орел» мог бы выпасть после любого из 5 подбрасываний. Какова вероятность каждой из этих ситуаций? Вероятность выпадения «орла» равна 1/2. Затем вероятность выпадения «решки», равная 1/2, умножить на 1/2, на 1/2, на 1/2. Т.е. вероятность каждой из этих ситуаций равна 1/32. Так же, как и вероятность ситуации, где Х=0. По сути, вероятность любого особого порядка выпадений «орла» и «решки» будет равна 1/32. Итак, вероятность этого равна 1/32. И вероятность этого равна 1/32. И вот такие ситуации имеют место потому, что «орел» мог бы выпасть при любом из 5 подбрасываний. Следовательно, вероятность того, что точно выпадет один «орел», равна 5*1/32, т.е. 5/32. Вполне логично. Теперь начинается интересное. Какова вероятность… (буду писать каждый из примеров другим цветом)… какова вероятность того, что моя случайная величина равна 2? Т.е. я подброшу монету 5 раз, и какова вероятность того, что 2 раза точно выпадет «орел»? Это уже интереснее, правда? Какие возможны комбинации? Могла бы быть «орел», «орел», «решка», «решка», «решка». Также могла бы быть «орел», «решка», «орел», «решка», «решка». И если подумать, что эти два «орла» могут стоять в разных местах комбинации, то можно немного запутаться. Уже нельзя размышлять о размещениях так, как мы это делали здесь, вверху. Хотя… можно, только рискуете запутаться. Вы должны понять одно. Для каждой из этих комбинаций вероятность равна 1/32. ½*½*½*½*½. Т.е. вероятность каждой из этих комбинаций равна 1/32. И мы должны подумать над тем, сколько существует таких комбинаций, удовлетворяющих нашему условию (2 «орла»)? Т.е. по сути, нужно представить, что есть 5 подбрасываний монеты, и нужно из них выбрать 2, при которых выпадает «орел». Давайте представим, что наши 5 подбрасываний собрались в кружочек, также представим, что у нас есть только два стула. И мы говорим: «Хорошо, кто из вас сядет на эти стулья для «орлов»? Т.е. кто из вас будет «орлом»? И нас не интересует то, в каком порядке они сядут. Я привожу такой пример, надеясь, что так вам будет понятнее. И может, вам захочется посмотреть некоторые уроки по теории вероятностей на эту тему, когда я буду говорить о биноме Ньютона. Потому что там я более детально углублюсь во все это. Но если вы будете рассуждать таким путем, то поймете, что такое биномиальный коэффициент. Потому что если будете думать так: хорошо, у меня 5 подбрасываний, при каком подбрасывании выпадет первый «орел»? Ну, здесь 5 возможностей того, при каком по счету подбрасывании выпадет первый «орел». А сколько возможностей для второго «орла»? Ну, первое подбрасывание, которое мы уже использовали, забрало одну возможность выпадения «орла». Т.е. одна позиция «орла» в комбинации уже занята одним из подбрасываний. Теперь осталось 4 подбрасывания, значит, второй «орел» может выпасть при одном из 4 подбрасываний. И вы это видели, вот здесь. Я выбрала так, что «орел» выпал при 1-м подбрасывании, и предположила, что при 1 из 4 оставшихся бросков также должен выпасть «орел». Итак, здесь только 4 возможности. Все, что я говорю, означает, что для первого «орла» у вас есть 5 различных позиций, на которые он может выпасть. А для второго уже остается только 4 позиции. Подумайте над этим. Когда мы вычисляем вот так, то порядок учитывается. Но для нас сейчас неважно, в какой последовательности выпадают «орлы» и «решки». Мы не говорим, что это «орел 1» или что это «орел 2». В обоих случаях это просто «орел». Мы могли бы предположить, что это «орел 1», а это – «орел 2». Или могло бы быть наоборот: это мог бы быть второй «орел», а это – «первый». И я говорю это потому, что важно понять, где использовать размещения, а где – сочетания. Нас не интересует последовательность. Так что, собственно, есть только 2 способа происхождения нашего события. Значит, делим это на 2. И как вы позже увидите, здесь 2! способов происхождения нашего события. Если было бы 3 «орла», тогда здесь было бы 3!, и я покажу вам, почему. Итак, это будет равно… 5*4=20 и разделить на 2 – получится 10. Поэтому здесь 10 различных комбинаций из 32, в которых у вас точно будет 2 «орла». Итак, 10*(1/32) равно 10/32, а чему это равно? 5/16. Запишу через биномиальный коэффициент. Это значение, вот здесь, вверху. Если подумать, то это – то же самое, что и 5!, деленный на… Что означает вот это 5*4? 5! – это 5*4*3*2*1. Т.е. если мне здесь нужно только 5*4, то для этого я могу разделить 5! на 3! Это равно 5*4*3*2*1, деленное на 3*2*1. И остается только 5*4. Значит, это – то же самое, что и этот числитель. И затем, т.к. нас не интересует последовательность, нам нужно здесь 2. Собственно, 2!. Умножить на 1/32. Такой была бы вероятность того, что у нас выпало бы точно 2 «орла». Какова вероятность того, что у нас точно 3 раза выпадет «орел»? Т.е. вероятность того, что Х=3. Итак, по той же логике, первый случай выпадения «орла» может иметь место при 1 из 5 подбрасываний. Второй случай выпадения «орла» может иметь место при 1 из 4 оставшихся подбрасываний. А третий случай выпадения «орла» может иметь место при 1 из 3 оставшихся подбрасываний. А сколько существует различных способов расставить 3 подбрасывания? В общем, сколько есть способов, чтобы расставить 3 предмета по местам? Это 3! И вы можете это вычислить или, возможно, захотите пересмотреть те уроки, в которых я подробнее это объясняла. Но если вы, например, возьмете буквы A, B и C, то всего есть 6 способов, с помощью которых вы их можете расставить. Можете рассматривать это как случаи выпадения «орлов». Здесь могли бы быть ACB, CAB. Могло бы быть BAC, BCA, и… Какой последний вариант, который я не назвала? CBA. Есть 6 способов расставить 3 разных предмета. Мы делим на 6, потому что не хотим повторно засчитывать эти 6 разных способов, потому что рассматриваем их как равнозначные. Здесь нас не интересует, при каком по счету подбрасывании выпадет «орел». 5*4*3… Это можно переписать, как 5!/2!. И разделить это еще на 3!. Это он и есть. 3! равен 3*2*1. Тройки сокращаются. Это становится равным 2. Это – равным 1. Еще раз, 5*2, т.е. равно 10. Каждая ситуация имеет вероятность 1/32, потому это опять равно 5/16. И это интересно. Вероятность того, что у вас выпадет 3 «орла» равна вероятности того, что у вас есть 2 орла. И причина этому… Ну, есть много причин тому, что так получилось. Но если подумать, что вероятность того, что выпадет 3 «орла» – то же самое, что вероятность выпадения 2 «решек». И вероятность выпадения 3 «решек» должна быть такой же, как и вероятность выпадения 2-х «орлов». И хорошо, что значения вот так срабатывают. Хорошо. Какова вероятность того, что Х=4? Мы можем использовать ту же формулу, что использовали прежде. Это могло бы быть 5*4*3*2. Итак, здесь запишем 5*4*3*2… Сколько есть различных способов расставить 4 предмета? Это 4!. 4! – это, по сути, вот эта часть, вот здесь. Это 4*3*2*1. Так, это сокращается, остается 5. Затем, каждая комбинация имеет вероятность 1/32. Т.е. это равно 5/32. И еще раз заметьте, что вероятность того, что 4 раза выпадет «орел» равна вероятности того, что 1 раз выпадет «орел». И в этом есть смысл, т.к. 4 «орла» – это то же самое, что случай выпадения 1 «решки». Вы скажете: ну, и при каком же подбрасывании выпадет эта одна «решка»? Ага, для этого здесь есть 5 различных комбинаций. И каждая из них имеет вероятность 1/32. И наконец, какова вероятность того, что Х=5? Т.е. выпадает «орел» 5 раз подряд. Должно быть так: «орел», «орел», «орел», «орел», «орел». Каждый из «орлов» имеет вероятность 1/2. Вы их перемножаете и получаете 1/32. Можно пойти другим путем. Если всего есть 32 способа, с помощью которых вы можете получить «орлы» и «решки» в этих экспериментах, то это – только один из этих способов. Здесь таких способов было 5 из 32. Здесь - 10 из 32. Тем не менее, вычисления мы провели, а теперь готовы нарисовать распределение вероятностей. Но мое время истекло. Позвольте продолжить на следующем уроке. А если вы в настроении, то, может, нарисуете перед тем, как смотреть следующий урок? До скорой встречи!

Не все явления измеряются в количественной шкале типа 1, 2, 3 … 100500 … Не всегда явление может принимать бесконечное или большое количество различных состояний. Например, пол у человека может быть либо М, либо Ж. Стрелок либо попадает в цель, либо не попадает. Голосовать можно либо «За», либо «Против» и т.д. и т.п. Другими словами, такие данные отражают состояние альтернативного признака – либо «да» (событие наступило), либо «нет» (событие не наступило). Наступившее событие (положительный исход) еще называют «успехом».

Эксперименты с такими данными называются схемой Бернулли , в честь известного швейцарского математика, который установил, что при большом количестве испытаний соотношение положительных исходов и общего количества испытаний стремится к вероятности наступления этого события.

Переменная альтернативного признака

Для того, чтобы в анализе задействовать математический аппарат, результаты подобных наблюдений следует записать в числовом виде. Для этого положительному исходу присваивают число 1, отрицательному – 0. Другими словами, мы имеем дело с переменной, которая может принимать только два значения: 0 или 1.

Какую пользу отсюда можно извлечь? Вообще-то не меньшую, чем от обычных данных. Так, легко подсчитать количество положительных исходов – достаточно просуммировать все значения, т.е. все 1 (успехи). Можно пойти далее, но для этого потребуется ввести парочку обозначений.

Первым делом нужно отметить, что положительные исходы (которые равны 1) имеют некоторую вероятность появления. Например, выпадение орла при подбрасывании монеты равно ½ или 0,5. Такая вероятность традиционно обозначается латинской буквой p . Следовательно, вероятность наступления альтернативного события равна 1 — p , которую еще обозначают через q , то есть q = 1 – p . Указанные обозначения можно наглядно систематизировать в виде таблички распределения переменной X .

Мы получили перечень возможных значений и их вероятности. Можно рассчитать математическое ожидание и дисперсию . Матожидание – это сумма произведений всех возможных значений на соответствующие им вероятности:

Вычислим матожидание, используя обозначения в таблицы выше.

Получается, что математическое ожидание альтернативного признака равно вероятности этого события – p .

Теперь определим, что такое дисперсия альтернативного признака. Дисперсия – есть средний квадрат отклонений от математического ожидания. Общая формула (для дискретных данных) имеет вид:

Отсюда дисперсия альтернативного признака:

Нетрудно заметить, что эта дисперсия имеет максимум 0,25 (при p=0,5) .

Стандартное отклонение – корень из дисперсии:

Максимальное значение не превышает 0,5.

Как видно, и математическое ожидание, и дисперсия альтернативного признака имеют очень компактный вид.

Биномиальное распределение случайной величины

Рассмотрим ситуацию под другим углом. Действительно, кому интересно, что среднее выпадение орлов при одном бросании равно 0,5? Это даже невозможно представить. Интересней поставить вопрос о числе выпадения орлов при заданном количестве бросков.

Другими словами, исследователя часто интересует вероятность наступления некоторого числа успешных событий. Это может быть количество бракованных изделий в проверяемой партии (1- бракованная, 0 — годная) или количество выздоровлений (1 – здоров, 0 – больной) и т.д. Количество таких «успехов» будет равно сумме всех значений переменной X , т.е. количеству единичных исходов.

Случайная величина B называется биномиальной и принимает значения от 0 до n (при B = 0 – все детали годные, при B = n – все детали бракованные). Предполагается, что все значения x независимы между собой. Рассмотрим основные характеристики биномиальной переменной, то есть установим ее математическое ожидание, дисперсию и распределение.

Матожидание биномиальной переменной получить очень легко. Математическое ожидание суммы величин есть сумма математических ожиданий каждой складываемой величины, а оно у всех одинаковое, поэтому:

Например, математическое ожидание количества выпавших орлов при 100 подбрасываниях равно 100 × 0,5 = 50.

Теперь выведем формулу дисперсии биномиальной переменной. Дисперсия суммы независимых случайных величин есть сумма дисперсий. Отсюда

Стандартное отклонение, соответственно

Для 100 подбрасываний монеты стандартное отклонение количества орлов равно

И, наконец, рассмотрим распределение биномиальной величины, т.е. вероятности того, что случайная величина B будет принимать различные значения k , где 0≤ k ≤n . Для монеты эта задача может звучать так: какова вероятность выпадения 40 орлов при 100 бросках?

Чтобы понять метод расчета, представим, что монета подбрасывается всего 4 раза. Каждый раз может выпасть любая из сторон. Мы задаемся вопросом: какова вероятность выпадения 2 орлов из 4 бросков. Каждый бросок независим друг от друга. Значит, вероятность выпадения какой-либо комбинации будет равна произведению вероятностей заданного исхода для каждого отдельного броска. Пусть О – это орел, Р – решка. Тогда, к примеру, одна из устраивающих нас комбинаций может выглядеть как ООРР, то есть:

Вероятность такой комбинации равняется произведению двух вероятностей выпадения орла и еще двух вероятностей не выпадения орла (обратное событие, рассчитываемое как 1 — p ), т.е. 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. Такова вероятность одной из устраивающих нас комбинации. Но вопрос ведь стоял об общем количестве орлов, а не о каком-то определенном порядке. Тогда нужно сложить вероятности всех комбинаций, в которых присутствует ровно 2 орла. Ясно, все они одинаковы (от перемены мест множителей произведение не меняется). Поэтому нужно вычислить их количество, а затем умножить на вероятность любой такой комбинации. Подсчитаем все варианты сочетаний из 4 бросков по 2 орла: РРОО, РОРО, РООР, ОРРО, ОРОР, ООРР. Всего 6 вариантов.

Следовательно, искомая вероятность выпадения 2 орлов после 4 бросков равна 6×0,0625=0,375.

Однако подсчет подобным образом утомителен. Уже для 10 монет методом перебора получить общее количество вариантов будет очень трудно. Поэтому умные люди давно изобрели формулу, с помощью которой рассчитывают количество различных сочетаний из n элементов по k , где n – общее количество элементов, k – количество элементов, варианты расположения которых и подсчитываются. Формула сочетания из n элементов по k такова:

Подобные вещи проходят в разделе комбинаторики. Всех желающих подтянуть знания отправляю туда. Отсюда, кстати, и название биномиального распределения (формула выше является коэффициентом в разложении бинома Ньютона).

Формулу для определения вероятности легко обобщить на любое количество n и k . В итоге формула биномиального распределения имеет следующий вид.

Количество подходящих под условие комбинаций умножить на вероятность одной из них.

Для практического использования достаточно просто знать формулу биномиального распределения. А можно даже и не знать – ниже показано, как определить вероятность с помощью Excel. Но лучше все-таки знать.

Рассчитаем по этой формуле вероятность выпадения 40 орлов при 100 бросках:

Или всего 1,08%. Для сравнения вероятность наступления математического ожидания этого эксперимента, то есть 50 орлов, равна 7,96%. Максимальная вероятность биномиальной величины принадлежит значению, соответствующему математическому ожиданию.

Расчет вероятностей биномиального распределения в Excel

Если использовать только бумагу и калькулятор, то расчеты по формуле биномиального распределения, несмотря на отсутствие интегралов, даются довольно тяжело. К примеру значение 100! – имеет более 150 знаков. Раньше, да и сейчас тоже, для вычисления подобных величин использовали приближенные формулы. В настоящий момент целесообразно использовать специальное ПО, типа MS Excel. Таким образом, любой пользователь (даже гуманитарий по образованию) вполне может вычислить вероятность значения биномиально распределенной случайной величины.

Для закрепления материала задействуем Excel пока в качестве обычного калькулятора, т.е. произведем поэтапное вычисление по формуле биномиального распределения. Рассчитаем, например, вероятность выпадения 50 орлов. Ниже приведена картинка с этапами вычислений и конечным результатом.

Как видно, промежуточные результаты имеют такой масштаб, что не помещаются в ячейку, хотя везде и используются простые функции типа: ФАКТР (вычисление факториала), СТЕПЕНЬ (возведение числа в степень), а также операторы умножения и деления. Более того, этот расчет довольно громоздок, во всяком случаен не является компактным, т.к. задействовано много ячеек. Да и разобраться с ходу трудновато.

В общем в Excel предусмотрена готовая функция для вычисления вероятностей биномиального распределения. Функция называется БИНОМ.РАСП .

Число успехов – количество успешных испытаний. У нас их 50.

Число испытаний – количество бросков: 100 раз.

Вероятность успеха – вероятность выпадения орла при одном подбрасывании 0,5.

Интегральная – указывается либо 1, либо 0. Если 0, то рассчитается вероятность P(B=k) ; если 1, то рассчитается функция биномиального распределения, т.е. сумма всех вероятностей от B=0 до B=k включительно.

Нажимаем ОК и получаем тот же результат, что и выше, только все рассчиталось одной функцией.

Очень удобно. Эксперимента ради вместо последнего параметра 0 поставим 1. Получим 0,5398. Это значит, что при 100 подкидываниях монеты вероятность выпадения орлов в количестве от 0 до 50 равна почти 54%. А поначалу то казалось, что должно быть 50%. В общем, расчеты производятся легко и быстро.

Настоящий аналитик должен понимать, как ведет себя функция (каково ее распределение), поэтому произведем расчет вероятностей для всех значений от 0 до 100. То есть зададимся вопросом: какова вероятность, что не выпадет ни одного орла, что выпадет 1 орел, 2, 3, 50, 90 или 100. Расчет приведен в следующей картинке. Синяя линия – само биномиальное распределение, красная точка – вероятность для конкретного числа успехов k.

Кто-то может спросить, а не похоже ли биномиальное распределение на… Да, очень похоже. Еще Муавр (в 1733 г.) говорил, что биномиальное распределение при больших выборках приближается к (не знаю, как это тогда называлось), но его никто не слушал. Только Гаусс, а затем и Лаплас через 60-70 лет вновь открыли и тщательно изучили нормальной закон распределения. На графике выше отлично видно, что максимальная вероятность приходится на математическое ожидание, а по мере отклонения от него, резко снижается. Также, как и у нормального закона.

Биномиальное распределение имеет большое практическое значение, встречается довольно часто. С помощью Excel расчеты проводятся легко и быстро.

В настоящей и нескольких следующих заметках мы рассмотрим математические модели случайных событий. Математическая модель - это математическое выражение, представляющее случайную величину. Для дискретных случайных величин это математическое выражение известно под названием функция распределения.

Если задача позволяет явно записать математическое выражение, представляющее случайную величину, можно вычислить точную вероятность любого ее значения. В этом случае можно вычислить и перечислить все значения функции распределения. В деловых, социологических и медицинских приложениях встречаются разнообразные распределения случайных величин. Одним из наиболее полезных распределений является биномиальное.

Биномиальное распределение используется для моделирования ситуаций, характеризующихся следующими особенностями.

  • Выборка состоит из фиксированного числа элементов n , представляющих собой исходы некоего испытания.
  • Каждый элемент выборки принадлежит одной из двух взаимоисключающих категорий, исчерпывающих все выборочное пространство. Как правило, эти две категории называют успех и неудача.
  • Вероятность успеха р является постоянной. Следовательно, вероятность неудачи равна 1 – р .
  • Исход (т.е. удача или неудача) любого испытания не зависит от результата другого испытания. Чтобы гарантировать независимость исходов, элементы выборки, как правило, получают с помощью двух разных методов. Каждый элемент выборки случайным образом извлекается из бесконечной генеральной совокупности без возвращения или из конечной генеральной совокупности с возвращением.

Скачать заметку в формате или , примеры в формате

Биномиальное распределение используется для оценки количества успехов в выборке, состоящей из n наблюдений. Рассмотрим в качестве примера оформление заказов. Чтобы сделать заказ клиенты компании Saxon Company могут воспользоваться интерактивной электронной формой и послать ее в компанию. Затем информационная система проверяет, нет ли в заказах ошибок, а также неполной или недостоверной информации. Любой заказ, вызывающий сомнения, помечается и включается в ежедневный отчет об исключительных ситуациях. Данные, собранные компанией, свидетельствуют, что вероятность ошибок в заказах равна 0,1. Компания хотела бы знать, какова вероятность обнаружить определенное количество ошибочных заказов в заданной выборке. Например, предположим, что клиенты заполнили четыре электронных формы. Какова вероятность, что все заказы окажутся безошибочными? Как вычислить эту вероятность? Под успехом будем понимать ошибку при заполнении формы, а все остальные исходы будем считать неудачей. Напомним, что нас интересует количество ошибочных заказов в заданной выборке.

Какие исходы мы можем наблюдать? Если выборка состоит из четырех заказов, ошибочными могут оказаться один, два, три или все четыре, кроме того, все они могут оказаться правильно заполненными. Может ли случайная величина, описывающая количество неправильно заполненных форм, принимать какое-либо иное значение? Это невозможно, поскольку количество неправильно заполненных форм не может превышать объем выборки n или быть отрицательным. Таким образом, случайная величина, подчиняющаяся биномиальному закону распределения, принимает значения от 0 до n .

Допустим, что в выборке из четырех заказов наблюдаются следующие исходы:

Какова вероятность обнаружить три ошибочных заказа в выборке, состоящей из четырех заказов, причем в указанной последовательности? Поскольку предварительные исследования показали, что вероятность ошибки при заполнении формы равна 0,10, вероятности указанных выше исходов вычисляются следующим образом:

Поскольку исходы не зависят друг от друга, вероятность указанной последовательности исходов равна: р*р*(1–р)*р = 0,1*0,1*0,9*0,1 = 0,0009. Если же необходимо вычислить количество вариантов выбора X n элементов, следует воспользоваться формулой сочетаний (1):

где n! = n * (n –1) * (n – 2) * … * 2 * 1 - факториал числа n , причем 0! = 1 и 1! = 1 по определению.

Это выражение часто обозначают как . Таким образом, если n = 4 и X = 3, количество последовательностей, состоящих из трех элементов, извлеченных из выборки, объем которой равен 4, определяется по следующей формуле:

Следовательно, вероятность обнаружить три ошибочных заказа вычисляется следующим образом:

(Количество возможных последовательностей) *
(вероятность конкретной последовательности) = 4 * 0,0009 = 0,0036

Аналогично можно вычислить вероятность того, что среди четырех заказов окажутся один или два ошибочных, а также вероятность того, что все заказы ошибочны или все верны. Однако при увеличении объема выборки n определить вероятность конкретной последовательности исходов становится труднее. В этом случае следует применить соответствующую математическую модель, описывающую биномиальное распределение количества вариантов выбора X объектов из выборки, содержащей n элементов.

Биноминальное распределение

где Р(Х) - вероятность X успехов при заданных объеме выборки n и вероятности успеха р , X = 0, 1, … n .

Обратите внимание на то, что формула (2) представляет собой формализацию интуитивных выводов. Случайная величина X , подчиняющаяся биномиальному распределению, может принимать любое целое значение в диапазоне от 0 до n . Произведение р X (1 – р) n X представляет собой вероятность конкретной последовательности, состоящей из X успехов в выборке, объем которой равен n . Величина определяет количество возможных комбинаций, состоящих из X успехов в n испытаниях. Следовательно, при заданном количестве испытаний n и вероятности успеха р вероятность последовательности, состоящей из X успехов, равна

Р(Х) = (количество возможных последовательностей) * (вероятность конкретной последовательности) =

Рассмотрим примеры, иллюстрирующие применение формулы (2).

1. Допустим, что вероятность неверно заполнить форму равна 0,1. Какова вероятность того, что среди четырех заполненных форм три окажутся ошибочными? Используя формулу (2), получаем, что вероятность обнаружить три ошибочных заказа в выборке, состоящей из четырех заказов, равна

2. Допустим, что вероятность неверно заполнить форму равна 0,1. Какова вероятность того, что среди четырех заполненных форм не менее трех окажутся ошибочными? Как показано в предыдущем примере, вероятность того, что среди четырех заполненных форм три окажутся ошибочными, равна 0,0036. Чтобы вычислить вероятность того, что среди четырех заполненных форм не менее трех будут неправильно заполнены, необходимо сложить вероятность того, что среди четырех заполненных форм три окажутся ошибочными, и вероятность того, что среди четырех заполненных форм все окажутся ошибочными. Вероятность второго события равна

Таким образом, вероятность того, что среди четырех заполненных форм не менее трех окажутся ошибочными, равна

Р(Х > 3) = Р(Х = 3) + Р(Х = 4) = 0,0036 + 0,0001 = 0,0037

3. Допустим, что вероятность неверно заполнить форму равна 0,1. Какова вероятность того, что среди четырех заполненных форм менее трех окажутся ошибочными? Вероятность этого события

Р(X < 3) = P(X = 0) + P(X = 1) + P(X = 2)

Используя формулу (2), вычислим каждую из этих вероятностей:

Следовательно, Р(Х < 3) = 0,6561 + 0,2916 + 0,0486 = 0,9963.

Вероятность Р(Х < 3) можно вычислить иначе. Для этого воспользуемся тем, что событие X < 3 является дополнительным по отношению к событию Х> 3. Тогда Р(Х< 3) = 1 – Р(Х> 3) = 1 – 0,0037 = 0,9963.

По мере увеличения объема выборки n вычисления, аналогичные проведенным в примере 3, становятся затруднительными. Чтобы избегать этих сложностей, многие биномиальные вероятности табулируют заранее. Некоторые из этих вероятностей приведены рис. 1. Например, чтобы получить вероятность, что Х = 2 при n = 4 и p = 0,1, следует извлечь из таблицы число, стоящее на пересечении строки Х = 2 и столбца р = 0,1.

Рис. 1. Биномиальная вероятность при n = 4, Х = 2 и р = 0,1

Биномиальное распределение можно вычислить с помощью функции Excel =БИНОМ.РАСП() (рис. 2), имеющей 4 параметра: число успехов – Х , число испытаний (или объем выборки) – n , вероятность успеха – р , параметр интегральная , принимающий значения ИСТИНА (в этом случае вычисляется вероятность не менее Х событий) или ЛОЖЬ (в этом случае вычисляется вероятность точно Х событий).

Рис. 2. Параметры функции =БИНОМ.РАСП()

Для вышеприведенных трех примеров расчеты приведены на рис. 3 (см. также Excel-файл). В каждом столбце приведено по одной формуле. Цифрами показаны ответы на примеры соответствующего номера).

Рис. 3. Расчет биноминального распределения в Excel для n = 4 и p = 0,1

Свойства биномиального распределения

Биномиальное распределение зависит от параметров n и р . Биномиальное распределение может быть, как симметричным, так и асимметричным. Если р = 0,05, биномиальное распределение является симметричным независимо от величины параметра n . Однако, если р ≠ 0,05, распределение становится асимметричным. Чем ближе значение параметра р к 0,05 и чем больше объем выборки n , тем слабее выражена асимметрия распределения. Таким образом, распределение количества неправильно заполненных форм смещено вправо, поскольку p = 0,1 (рис. 4).

Рис. 4. Гистограмма биномиального распределения при n = 4 и p = 0,1

Математическое ожидание биномиального распределения равно произведению объема выборки n на вероятность успеха р :

(3) Μ = Е(Х) = np

В среднем, при достаточно долгой серии испытаний в выборке, состоящей из четырех заказов, может оказаться р = Е(Х) = 4 х 0,1 = 0,4 неправильно заполненных форм.

Стандартное отклонение биномиального распределения

Например, стандартное отклонение количества неверно заполненных форм в бухгалтерской информационной системе равно:

Используются материалы книги Левин и др. Статистика для менеджеров. – М.: Вильямс, 2004. – с. 307–313