Геометрическое распределение математическое ожидание доказательство. Биномиальный закон распределения
Пусть производится стрельба по заданной мишени до первого попадания, при этом вероятность p попадания в цель в каждом выстреле одна и та же и не зависит от результатов предыдущих выстрелов. Другими словами, в рассматриваемом опыте осуществляется схема Бернулли. В качестве случайной величины X будем рассматривать число произведенных выстрелов. Очевидно, что возможными значениями случайной величины X являются натуральные числа: x 1 =1, x 2 =2, … тогда вероятность того, что понадобится k выстрелов будет равна
Полагая в этой формуле k =1,2, … получим геометрическую прогрессию с первым членом p и множителем q :
По этой причине распределение, определяемое формулой (6.11) называется геометрическим .
Используя формулу суммы бесконечно убывающей геометрической прогрессии, легко убедится, что
.
Найдем числовые характеристики геометрического распределения.
По определению математического ожидания для ДСВ имеем
.
Дисперсию вычислим по формуле
.
Для этого найдем
.
Следовательно,
.
Итак, математическое ожидание и дисперсия геометрического распределения равна
. (6.12)
6.4.* Производящая функция
При решении задач, связанных с ДСВ, часто используются методы комбинаторики. Одним из наиболее развитых теоретических методов комбинаторного анализа является метод производящих функций, который является одним из самых сильных методов и в применениях. Кратко познакомимся с ним.
Если случайная величина принимает только целые неотрицательные значения, т.е.
,
то производящей функцией распределения вероятностей случайной величины называется функция
, (6.13)
где z – действительная или комплексная переменная. Отметим, что между множеством производящих функций (x ) и множеством распределений {P(=k )} существует взаимно однозначное соответствие .
Пусть случайная величина имеет биномиальное распределение
.
Тогда, используя формулу бинома Ньютона, получим
,
т.е. производящая функция биномиального распределения имеет вид
. (6.14)
Добавление. Производящая функция распределения Пуассона
имеет вид
. (6.15)
Производящая функция геометрического распределения
имеет вид
. (6.16)
При помощи производящих функций удобно находить основные числовые характеристики ДСВ. Например, первый и второй начальный моменты связаны с производящей функцией следующими равенствами:
, (6.17)
. (6.18)
Метод производящих функций часто бывает удобен тем, что в некоторых случаях функцию распределения ДСВ очень трудно определить, тогда как производящую функцию порой легко найти. Например, рассмотрим схему последовательных независимых испытаний Бернулли, но внесем в нее одно изменение. Пусть вероятность осуществления события A от испытания к испытанию меняется. Это означает, что формула Бернулли для такой схемы становится неприменимой. Задача нахождения функции распределения в таком случае представляет значительные трудности. Однако для данной схемы легко находится производящая функция, а, следовательно, легко находятся и соответствующие числовые характеристики.
Широкое применение производящих функций основано на том, что изучение сумм случайных величин можно заменить изучением произведений соответствующих производящих функций. Так, если 1 , 2 , …, n независимы, то
Пусть p k =P k (A ) – вероятность "успеха" в k -м испытании в схеме Бернулли (соответственно, q k =1–p k – вероятность "неуспеха" в k -м испытании). Тогда, в соответствие с формулой (6.19), производящая функция будет иметь вид
. (6.20)
Пользуясь данной производящей функцией, можем написать
.
Здесь учтено, что p k + q k =1. Теперь по формуле (6.1) найдем второй начальный момент. Для этого предварительно вычислим
и
.
В частном случае p 1 =p 2 =…=p n =p (т.е. в случае биномиального распределения) из полученных формул следует, что M=np , D=npq .
Можно выделить наиболее часто встречающиеся законы распределения дискретных случайных величин:
- Биномиальный закон распределения
- Пуассоновский закон распределения
- Геометрический закон распределения
- Гипергеометрический закон распределения
Для данных распределений дискретных случайных величин расчет вероятностей их значений, а также числовых характеристик (математическое ожидание, дисперсия, и т.д.) производится по определенных «формулам». Поэтому очень важно знать данные типы распределений и их основные свойства.
1. Биномиальный закон распределения.
Дискретная случайная величина $X$ подчинена биномиальному закону распределения вероятностей, если она принимает значения $0,\ 1,\ 2,\ \dots ,\ n$ с вероятностями $P\left(X=k\right)=C^k_n\cdot p^k\cdot {\left(1-p\right)}^{n-k}$. Фактически, случайная величина $X$ - это число появлений события $A$ в $n$ независимых испытаний . Закон распределения вероятностей случайной величины $X$:
$\begin{array}{|c|c|}
\hline
X_i & 0 & 1 & \dots & n \\
\hline
p_i & P_n\left(0\right) & P_n\left(1\right) & \dots & P_n\left(n\right) \\
\hline
\end{array}$
Для такой случайной величины математическое ожидание $M\left(X\right)=np$, дисперсия $D\left(X\right)=np\left(1-p\right)$.
Пример . В семье двое детей. Считая вероятности рождения мальчика и девочки равными $0,5$, найти закон распределения случайной величины $\xi $ - числа мальчиков в семье.
Пусть случайная величина $\xi $ - число мальчиков в семье. Значения, которые может принимать $\xi:\ 0,\ 1,\ 2$. Вероятности этих значений можно найти по формуле $P\left(\xi =k\right)=C^k_n\cdot p^k\cdot {\left(1-p\right)}^{n-k}$, где $n=2$ - число независимых испытаний, $p=0,5$ - вероятность появления события в серии из $n$ испытаний. Получаем:
$P\left(\xi =0\right)=C^0_2\cdot {0,5}^0\cdot {\left(1-0,5\right)}^{2-0}={0,5}^2=0,25;$
$P\left(\xi =1\right)=C^1_2\cdot 0,5\cdot {\left(1-0,5\right)}^{2-1}=2\cdot 0,5\cdot 0,5=0,5;$
$P\left(\xi =2\right)=C^2_2\cdot {0,5}^2\cdot {\left(1-0,5\right)}^{2-2}={0,5}^2=0,25.$
Тогда закон распределения случайной величины $\xi $ есть соответствие между значениями $0,\ 1,\ 2$ и их вероятностями, то есть:
$\begin{array}{|c|c|}
\hline
\xi & 0 & 1 & 2 \\
\hline
P(\xi) & 0,25 & 0,5 & 0,25 \\
\hline
\end{array}$
Сумма вероятностей в законе распределения должна быть равна $1$, то есть $\sum _{i=1}^{n}P(\xi _{{\rm i}})=0,25+0,5+0,25=1 $.
Математическое ожидание $M\left(\xi \right)=np=2\cdot 0,5=1$, дисперсия $D\left(\xi \right)=np\left(1-p\right)=2\cdot 0,5\cdot 0,5=0,5$, среднее квадратическое отклонение $\sigma \left(\xi \right)=\sqrt{D\left(\xi \right)}=\sqrt{0,5}\approx 0,707$.
2. Закон распределения Пуассона.
Если дискретная случайная величина $X$ может принимать только целые неотрицательные значения $0,\ 1,\ 2,\ \dots ,\ n$ с вероятностями $P\left(X=k\right)={{{\lambda }^k}\over {k!}}\cdot e^{-\lambda }$, то говорят, что она подчинена закону распределения Пуассона с параметром $\lambda $. Для такой случайной величины математическое ожидание и дисперсия равны между собой и равны параметру $\lambda $, то есть $M\left(X\right)=D\left(X\right)=\lambda $.
Замечание . Особенность этого распределения заключается в том, что мы на основании опытных данных находим оценки $M\left(X\right),\ D\left(X\right)$, если полученные оценки близки между собой, то у нас есть основание утверждать, что случайная величина подчинена закону распределения Пуассона.
Пример . Примерами случайных величин, подчиненных закону распределения Пуассона, могут быть: число автомашин, которые будут обслужены завтра автозаправочной станцией; число бракованных изделий в произведенной продукции.
Пример . Завод отправил на базу $500$ изделий. Вероятность повреждения изделия в пути равна $0,002$. Найти закон распределения случайной величины $X$, равной числу поврежденных изделий; чему равно $M\left(X\right),\ D\left(X\right)$.
Пусть дискретная случайная величина $X$ - число поврежденных изделий. Такая случайная величина подчинена закону распределения Пуассона с параметром $\lambda =np=500\cdot 0,002=1$. Вероятности значений равны $P\left(X=k\right)={{{\lambda }^k}\over {k!}}\cdot e^{-\lambda }$. Очевидно, что все вероятности всех значений $X=0,\ 1,\ \dots ,\ 500$ перечислить невозможно, поэтому мы ограничимся лишь первыми несколькими значениями.
$P\left(X=0\right)={{1^0}\over {0!}}\cdot e^{-1}=0,368;$
$P\left(X=1\right)={{1^1}\over {1!}}\cdot e^{-1}=0,368;$
$P\left(X=2\right)={{1^2}\over {2!}}\cdot e^{-1}=0,184;$
$P\left(X=3\right)={{1^3}\over {3!}}\cdot e^{-1}=0,061;$
$P\left(X=4\right)={{1^4}\over {4!}}\cdot e^{-1}=0,015;$
$P\left(X=5\right)={{1^5}\over {5!}}\cdot e^{-1}=0,003;$
$P\left(X=6\right)={{1^6}\over {6!}}\cdot e^{-1}=0,001;$
$P\left(X=k\right)={{{\lambda }^k}\over {k!}}\cdot e^{-\lambda }$
Закон распределения случайной величины $X$:
$\begin{array}{|c|c|}
\hline
X_i & 0 & 1 & 2 & 3 & 4 & 5 & 6 & ... & k \\
\hline
P_i & 0,368; & 0,368 & 0,184 & 0,061 & 0,015 & 0,003 & 0,001 & ... & {{{\lambda }^k}\over {k!}}\cdot e^{-\lambda } \\
\hline
\end{array}$
Для такой случайной величины математическое ожидание и дисперсия равным между собой и равны параметру $\lambda $, то есть $M\left(X\right)=D\left(X\right)=\lambda =1$.
3. Геометрический закон распределения.
Если дискретная случайная величина $X$ может принимать только натуральные значения $1,\ 2,\ \dots ,\ n$ с вероятностями $P\left(X=k\right)=p{\left(1-p\right)}^{k-1},\ k=1,\ 2,\ 3,\ \dots $, то говорят, что такая случайная величина $X$ подчинена геометрическому закону распределения вероятностей. Фактически, геометрическое распределения представляется собой испытания Бернулли до первого успеха.
Пример . Примерами случайных величин, имеющих геометрическое распределение, могут быть: число выстрелов до первого попадания в цель; число испытаний прибора до первого отказа; число бросаний монеты до первого выпадения орла и т.д.
Математическое ожидание и дисперсия случайной величины, подчиненной геометрическому распределению, соответственно равны $M\left(X\right)=1/p$, $D\left(X\right)=\left(1-p\right)/p^2$.
Пример . На пути движения рыбы к месту нереста находится $4$ шлюза. Вероятность прохода рыбы через каждый шлюз $p=3/5$. Построить ряд распределения случайной величины $X$ - число шлюзов, пройденных рыбой до первого задержания у шлюза. Найти $M\left(X\right),\ D\left(X\right),\ \sigma \left(X\right)$.
Пусть случайная величина $X$ - число шлюзов, пройденных рыбой до первого задержания у шлюза. Такая случайная величина подчинена геометрическому закону распределения вероятностей. Значения, которые может принимать случайная величина $X:$ 1, 2, 3, 4. Вероятности этих значений вычисляются по формуле: $P\left(X=k\right)=pq^{k-1}$, где: $p=2/5$ - вероятность задержания рыбы через шлюз, $q=1-p=3/5$ - вероятность прохода рыбы через шлюз, $k=1,\ 2,\ 3,\ 4$.
$P\left(X=1\right)={{2}\over {5}}\cdot {\left({{3}\over {5}}\right)}^0={{2}\over {5}}=0,4;$
$P\left(X=2\right)={{2}\over {5}}\cdot {{3}\over {5}}={{6}\over {25}}=0,24;$
$P\left(X=3\right)={{2}\over {5}}\cdot {\left({{3}\over {5}}\right)}^2={{2}\over {5}}\cdot {{9}\over {25}}={{18}\over {125}}=0,144;$
$P\left(X=4\right)={{2}\over {5}}\cdot {\left({{3}\over {5}}\right)}^3+{\left({{3}\over {5}}\right)}^4={{27}\over {125}}=0,216.$
$\begin{array}{|c|c|}
\hline
X_i & 1 & 2 & 3 & 4 \\
\hline
P\left(X_i\right) & 0,4 & 0,24 & 0,144 & 0,216 \\
\hline
\end{array}$
Математическое ожидание:
$M\left(X\right)=\sum^n_{i=1}{x_ip_i}=1\cdot 0,4+2\cdot 0,24+3\cdot 0,144+4\cdot 0,216=2,176.$
Дисперсия:
$D\left(X\right)=\sum^n_{i=1}{p_i{\left(x_i-M\left(X\right)\right)}^2=}0,4\cdot {\left(1-2,176\right)}^2+0,24\cdot {\left(2-2,176\right)}^2+0,144\cdot {\left(3-2,176\right)}^2+$
$+\ 0,216\cdot {\left(4-2,176\right)}^2\approx 1,377.$
Среднее квадратическое отклонение:
$\sigma \left(X\right)=\sqrt{D\left(X\right)}=\sqrt{1,377}\approx 1,173.$
4. Гипергеометрический закон распределения.
Если $N$ объектов, среди которых $m$ объектов обладают заданным свойством. Случайных образом без возвращения извлекают $n$ объектов, среди которых оказалось $k$ объектов, обладающих заданным свойством. Гипергеометрическое распределение дает возможность оценить вероятность того, что ровно $k$ объектов в выборке обладают заданным свойством. Пусть случайная величина $X$ - число объектов в выборке, обладающих заданным свойством. Тогда вероятности значений случайной величины $X$:
$P\left(X=k\right)={{C^k_mC^{n-k}_{N-m}}\over {C^n_N}}$
Замечание . Статистическая функция ГИПЕРГЕОМЕТ мастера функций $f_x$ пакета Excel дает возможность определить вероятность того, что определенное количество испытаний будет успешным.
$f_x\to $ статистические $\to $ ГИПЕРГЕОМЕТ $\to $ ОК . Появится диалоговое окно, которое нужно заполнить. В графе Число_успехов_в_выборке указываем значение $k$. Размер_выборки равен $n$. В графе Число_успехов_в_совокупности указываем значение $m$. Размер_совокупности равен $N$.
Математическое ожидание и дисперсия дискретной случайной величины $X$, подчиненной геометрическому закону распределения, соответственно равны $M\left(X\right)=nm/N$, $D\left(X\right)={{nm\left(1-{{m}\over {N}}\right)\left(1-{{n}\over {N}}\right)}\over {N-1}}$.
Пример . В кредитном отделе банка работают 5 специалистов с высшим финансовым образованием и 3 специалиста с высшим юридическим образованием. Руководство банка решило направить 3 специалистов Для повышения квалификации, отбирая их в случайном порядке.
а) Составьте ряд распределения числа специалистов с высшим финансовым образованием, которые могут быть направлены на повышение квалификации;
б) Найдите числовые характеристики этого распределения.
Пусть случайная величина $X$ - число специалистов с высшим финансовым образованием среди трех отобранных. Значения, которые может принимать $X:0,\ 1,\ 2,\ 3$. Данная случайная величина $X$ распределена по гипергеометрическому распределению с параметрами: $N=8$ - размер совокупности, $m=5$ - число успехов в совокупности, $n=3$ - размер выборки, $k=0,\ 1,\ 2,\ 3$ - число успехов в выборке. Тогда вероятности $P\left(X=k\right)$ можно рассчитать по формуле: $P(X=k)={C_{m}^{k} \cdot C_{N-m}^{n-k} \over C_{N}^{n} } $. Имеем:
$P\left(X=0\right)={{C^0_5\cdot C^3_3}\over {C^3_8}}={{1}\over {56}}\approx 0,018;$
$P\left(X=1\right)={{C^1_5\cdot C^2_3}\over {C^3_8}}={{15}\over {56}}\approx 0,268;$
$P\left(X=2\right)={{C^2_5\cdot C^1_3}\over {C^3_8}}={{15}\over {28}}\approx 0,536;$
$P\left(X=3\right)={{C^3_5\cdot C^0_3}\over {C^3_8}}={{5}\over {28}}\approx 0,179.$
Тогда ряд распределения случайной величины $X$:
$\begin{array}{|c|c|}
\hline
X_i & 0 & 1 & 2 & 3 \\
\hline
p_i & 0,018 & 0,268 & 0,536 & 0,179 \\
\hline
\end{array}$
Рассчитаем числовые характеристики случайной величины $X$ по общим формулам гипергеометрического распределения.
$M\left(X\right)={{nm}\over {N}}={{3\cdot 5}\over {8}}={{15}\over {8}}=1,875.$
$D\left(X\right)={{nm\left(1-{{m}\over {N}}\right)\left(1-{{n}\over {N}}\right)}\over {N-1}}={{3\cdot 5\cdot \left(1-{{5}\over {8}}\right)\cdot \left(1-{{3}\over {8}}\right)}\over {8-1}}={{225}\over {448}}\approx 0,502.$
$\sigma \left(X\right)=\sqrt{D\left(X\right)}=\sqrt{0,502}\approx 0,7085.$
Т.е. дискретная случ. величина Х имеет геом. распред. с параметром р и знаменателем q , если она принимает значения 1,2,3,… k , … с вероятностями
Р(Х) = pq k -1 , где q =1-р .
Распределение называется геом., т.к. вер-ти р 1 , р 2 , … образуют геом.прогрессию, у которой первый член – р , а знаменатель – q .
Если количество испытаний не ограничено, т.е. если случайная величина может принимать значения 1, 2, ..., ∞, то мат.ожидание и дисперсию геометр. распределения можно найти по формулам Mх = 1/p, Dх = q/p 2
Пример. Из орудия производится стрельба по цели до первого попадания. Вероятность попадания в цель p = 0,6 при каждом выстреле. С.в. X - число возможных выстрелов до первого попадания.
А) Составить ряд распределения, найти функцию распределения, построить её график и найти все числовые характеристики. б) Найти математическое ожидание и дисперсию для случая, если стрелок намеревается произвести не более трёх выстрелов.
а)
Случайная величина может принимать значения 1, 2, 3, 4,..., ∞
P(1) = p = 0,6
P(2) = qp = 0,4 · 0,6 = 0,24
P(3) = q 2 p = 0,4 2 · 0,6 = 0,096 ...
P(k) = q k-1 p = 0,4 k-1 · 0,6 ...
Ряд распределения:
Контроль: Σp i = 0,6/(1-0,4) = 1 (сумма геометрической прогрессии)
Ф-ция распределения - это вероятность того, что с.в. Х примет значение меньшее, чем конкретное числовое значение х. Значения функции распределения находим суммированием вероятностей.
Если x ≤ 1, то F(x) = 0
Если 1 < x ≤ 2, то F(x) = 0,6
Если 2 < x ≤ 3, то F(x) = 0,6 + 0,24 = 0,84
Если 3 < x ≤ 4, то F(x) = 0,84 + 0,096 = 0,936 ...
Если k-1 < x ≤ k, то F(x) = 0,6(1-0,4 k-1)/(1-0,4) = 1-0,4 k-1 (частичная сумма геом-ой прогрессии) ...
Mх = 1/p = 1/0,6 ≈ 1,667
Dх = q/p 2 = 0,4/0,36 ≈ 1,111
σ = √Dх ≈ 1,054
х | |||
р | 0,6 | 0,24 | 0,16 |
б)
Случайная величина может принимать значения 1, 2, 3.
P(1) = p = 0,6
P(2) = qp = 0,4 · 0,6 = 0,24
P(3) = q 2 p + q 3 = 0,4 2 · 0,6 + 0,4 3 = 0,16
Ряд распределения:
Контроль: Σp i = 0,6 + 0,24 + 0,16 = 1
Функция распределения.
Если x ≤ 1, то F(x) = 0
Если 1 < x ≤ 2, то F(x) = 0,6
Если 2 < x ≤ 3, то F(x) = 0,6 + 0,24 = 0,84
Если x > 3, то F(x) = 0,84 + 0,16 = 1
M(X) = 1 · 0,6 + 2 · 0,24 + 3 · 0,16 = 1,56
D(X) = 1 2 · 0,6 + 2 2 · 0,24 + 3 2 · 0,16 - 1,56 2 = 0,5664
σ(Х) ≈ 0,752
Асимметрия и эксцесс
Асимметрия – это свойство распределения выборки, которое характеризует несимметричность распределения случайной величины. На практике симметричные распределения встречаются редко и чтобы выявить и оценить степень асимметрии, вводят понятие асимметрии. В случае отрицательного коэффициента асимметрии более пологий «спуск» наблюдается слева, в противном случае – справа. В первом случае асимметрию называют левосторонней, а во втором – правосторонней.
Коэффициент асимметрии дискретной
случайной величины вычисляется по формуле:
As(X) = (x
1 -M X
) 3 p 1 + (x
2 - M X
) 3 p 2 + ... + (x
n - M X
) 3 p n
Коэфф. асимметрии непрерывной сл.вел. вычисляется по формуле:
Эксцесс – это мера крутости кривой распределения. Коэффициент эксцесса дискретной случайной величины вычисляется по формуле:
Ex(X) = [(x 1 - M X) 4 p 1 + (x 2 - M X) 4 p 2 + ... + (x n - M X) 4 p n ] / σ 4 - 3
Коэффициент эксцесса непрерывной случайной величины вычисляется по формуле:
Пример .
Закон распределения дискретной случайной величины X – это перечень всех возможных значений сл.вел. X , которые она может принимать, и соответствующих вероятностей. Сумма всех вер-ей должна равняться 1. Проверка: 0,1 + 0,2 + 0,5 + 0,1 + 0,1 = 1.
- Математическое ожидание : M(X) = -2·0,1 - 1·0,2 + 0·0,5 + 1·0,1 + 2·0,1 = -0,1
- Дисперсия
– это математическое ожидание квадрата отклонений значений сл.вел. X от её мат.ож.: D(X) = (-2 + 0,1) 2 ·0,1 + (- 1 + 0,1) 2 ·0,2 + (0 + 0,1) 2 ·0,5 + (1 + 0,1) 2 ·0,1 + (2 + 0,1) 2 ·0,1 = 1,09
или D(X) = (-2) 2 ·0,1 + (-1) 2 ·0,2 + 0 2 ·0,5 + 1 2 ·0,1 + 2 2 ·0,1 - (-0,1) 2 = 1,1 - 0,01 = 1,09 - Ср. кв. откл. – это корень квадратный из дисперсии: σ = √1,09 ≈ 1,044
- Коэф. асимметрии As(X) = [(-2 + 0,1) 3 ·0,1 + (- 1 + 0,1) 3 ·0,2 + (0 + 0,1) 3 ·0,5 + (1 + 0,1) 3 ·0,1 + (2 + 0,1) 3 ·0,1] / 1,044 3 = 0,200353
- Коэф. эксцесса Ex (X) = [(-2 + 0,1) 4 ·0,1 + (- 1 + 0,1) 4 ·0,2 + (0 + 0,1) 4 ·0,5 + (1 + 0,1) 4 ·0,1 + (2 + 0,1) 4 ·0,1]/1,044 4 - 3 = 0,200353
- Функция распределения – это вероятность того, что случайная величина X примет значение меньшее, чем какое – либо числовое значение x : F(X) = P(X < x ). Функция распределения – функция неубывающая. Она принимает значения в интервале от 0 до 1.
P(X < -0,1) = F(-0,1) = 0,3 P(X > -0,05) = P(0) + P(1) + P(2) = 0,5 + 0,1 + 0,1 = 0,7
2) Непрерывные случайные величины. Нормальное распределение.
Непрерывная случайная величина принимает не какие-либо конкретные числовые значения, а любые значения на числовом отрезке. Описание закона распределения в непрерывном случае существенно сложнее, чем в дискретном.
Непрерывной называют случайную величину, которая может принимать любые значения из некоторого заданного интервала, например, время ожидания транспорта, температура воздуха в каком-либо месяце, отклонение фактического размера детали от номинального, и т.д. Интервал, на котором она задана, может быть бесконечным в одну или обе стороны.
Главное различие в задачах вычисления вероятностей для дискретного и непрерывного случаев состоит в следующем. В дискретном случае длясобытий типа х = с (случайная величина принимает определенное значение) ищется вероятность Р (с ). В непрерывном случае вероятности такого типа равны нулю , поэтому интерес представляют вероятности событий типа «случайная величина принимает значения из некоторого отрезка», т.е. а ≤ х ≤ b . Или для событий типа х ≤ с ищется вероятность р (х ≤ с ). Получили график функции распределения F(х ≤ с ).
р | |||||||||
7 / 8 | |||||||||
4 / 8 | |||||||||
3 / 8 | |||||||||
1 / 8 | |||||||||
х |
Итак, разнообразие случайных величин весьма велико. Число принимаемых ими значений может быть конечным, счетным или несчетным; значения могут быть расположены дискретно или заполнять интервалы сплошь. Для того чтобы задавать вероятности значений случайных величин, столь различных по своей природе, и притом задавать их одним и тем же способом, в теории вероятностей вводят понятие функции распределения случайной величины .
Пусть - случайная величина и х - произвольное действительное число. Вероятность того, что примет значение, меньшее, чем х, называется функцией распределения вероятностей случайной величины : F(x) = Р( <х}.
Резюмируем сказанное: случайной величиной называется величина, значения которой зависят от случая и для которой определена функция распределения вероятностей.
Для непрерывных случайных величин (когда множество возможных значений случайной величины несчетно) закон распределения задается при помощи функции. Чаще всего это функция распределения : F(x ) = P(X<х ) .
Функция F(x ) обладает следующими свойствами :
1. 0 ≤ F(x ) ≤ 1 ;
2. F(x ) не убывает ;
3. F(x ) непрерывна слева ;
4. F(-∞ ) = 0, F(∞ ) = 1.
С помощью функции распределения можно вычислять вероятности попадания случайной величины Х
в различные промежутки вида х 1
Пример. Известно, что . Найти F(2).
По определению . След, . .
Пример.
Ф-я распред. сл.вел.Х имеет вид:
. Найти вероятность того, что сл. вел. Х примет значение в промежутке :
Вер-ть попадания непр.случ.величины в (-∞ ; х]:
Для дискрет.сл.вел. мы находили мат. ожид., дисперсию, среднекв. отклонение. Их аналогами для непр.сл.вел. являются:
Пример. Случ.вел. Х задана плотностью распределения на отрезке : f(x) = 1.
Плотность вероятности непрерывной случайной величины или функция распределения вероятностей - аналог закона распределения дискретной с.в. Но если закон распределения дискретной с.в. графически изображается в виде точек, соединённых для наглядности ломаной линией, то плотность вероятностей графически представляет собой непрерывную гладкую линию. Аналитически задаётся формулой.
Если закон распределения дискретной с.в. ставит каждому значению x в соответствие определённую вероятность, то про плотность распределения такого сказать нельзя. Для непрерывных с.в. можно найти только вероятность попадания в какой-либо интервал. Считается, что для каждого отдельного значения непрерывной с.в. вероятность равна нулю.
Основное свойство плотности вероятности: несобственный интеграл от плотности вероятности в пределах от -∞ до +∞ равен единице (геометрически это выражается тем, что площадь фигуры, ограниченной сверху графиком плотности вероятности, снизу - осью OX, равна 1).
Функция распределения случайной величины - это функция, определяющая для каждого значения x вероятность того, что случайная величина (ξ) примет значение меньшее, чем x: F(x) = P(ξ < x). Численно функция распределения равна площади фигуры, ограниченной сверху графиком плотности вероятности, снизу осью ОХ, с боков - рассматриваемым интервалом.
ЛЕКЦИЯ 8
Распределения вероятностей дискретных случайных величин. Биномиальное распределение. Распределение Пуассона. Геометрическое распределение. Производящая функция.
6. РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ
ДИСКРЕТНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН
Биномиальное распределение
Пусть производится n
независимых испытаний, в каждом из которых событие A
может либо появится, либо не появится. Вероятность p
появления события A
во всех испытаниях постоянна и не изменяется от испытания к испытанию. Рассмотрим в качестве случайной величины X число появлений события A
в этих испытаниях. Формула, позволяющая найти вероятность появления события A
ровно k
раз в n
испытаниях, как известно, описывается формулой Бернулли
Распределение вероятностей, определяемое формулой Бернулли, называется биномиальным .
Этот закон назван "биномиальным" потому, что правую часть можно рассматривать как общий член разложения бинома Ньютона
Запишем биномиальный закон в виде таблицы
X | n | n –1 | … | k | … | |
P | p n | np n –1 q | … | … | q n |
Найдем числовые характеристики этого распределения.
.
Запишем равенство, являющееся бином Ньютона
.
и продифференцируем его по p. В результате получим
.
Умножим левую и правую часть на p :
.
Учитывая, что p+q =1, имеем
(6.2)
Итак, математическое ожидание числа появлений событий в n независимых испытаниях равно произведению числа испытаний n на вероятность p появления события в каждом испытании .
Дисперсию вычислим по формуле
Для этого найдем
.
Предварительно продифференцируем формулу бинома Ньютона два раза по p :
и умножим обе части равенства на p 2:
Следовательно,
Итак, дисперсия биномиального распределения равна
. (6.3)
Данные результаты можно получить и из чисто качественных рассуждений. Общее число X появлений события A во всех испытаниях складываются из числа появлений события в отдельных испытаниях. Поэтому если X 1 – число появлений события в первом испытании, X 2 – во втором и т.д., то общее число появлений события A во всех испытаниях равно X=X 1 +X 2 +…+X n . По свойству математического ожидания:
Каждое из слагаемых правой части равенства есть математическое ожидание числа событий в одном испытании, которое равно вероятности события. Таким образом,
По свойству дисперсии:
Так как , а математическое ожидание случайной величины , которое может принимать только два значения, а именно 1 2 с вероятностью p и 0 2 с вероятностью q , то . Таким образом, В результате, получаем
Воспользовавшись понятием начальных и центральных моментов, можно получить формулы для асимметрии и эксцесса:
. (6.4)
Многоугольник биномиального распределения имеет следующий вид (см. рис. 6.1). Вероятность P n (k ) сначала возрастает при увеличении k , достигает наибольшего значения и далее начинает убывать. Биномиальное распределение асимметрично, за исключением случая p =0,5. Отметим, что при большом числе испытаний n биномиальное распределение весьма близко к нормальному. (Обоснование этого предложения связано с локальной теоремой Муавра-Лапласа.)
Число m 0 наступлений события называется наивероятнейшим , если вероятность наступления события данное число раз в этой серии испытаний наибольшая (максимум в многоугольнике распределения) . Для биномиального распределения
. (6.5)
Замечание. Данное неравенство можно доказать, используя рекуррентную формулу для биномиальных вероятностей:
(6.6)
Пример 6.1. Доля изделий высшего сорта на данном предприятии составляет 31%. Чему равно математического ожидание и дисперсия, также наивероятнейшее число изделий высшего сорта в случайно отобранной партии из 75 изделий?
Решение. Поскольку p =0,31, q =0,69, n =75, то
M[X ] = np = 75×0,31 = 23,25; D[X ] = npq = 75×0,31×0,69 = 16,04.
Для нахождения наивероятнейшего числа m 0 , составим двойное неравенство
Отсюда следует, что m 0 = 23.
Распределение Пуассона
Как было уже отмечено, биномиальное распределение приближается к нормальному при n ®¥. Однако это не имеет места, если наряду с увеличением n одна из величин p или q стремится к нулю. В этом случае имеет место асимптотическая формула Пуассона, т.е. при n ®¥, p ®0
, (6.7)
где l=np . Эта формула определяет закон распределения Пуассона , который имеет самостоятельное значение, а не только как частный случай биномиального распределения. В отличие от биномиального распределения здесь случайная величина k может принимать бесконечное множество значений: k =0,1,2,…
Закон Пуассона описывает число событий k, происходящих за одинаковые промежутки времени при условии, что события происходят независимо друг от друга с постоянной средней интенсивностью, которая характеризуется параметром l. Многоугольник распределения Пуассона показан на рис. 6.2. Отметим, что при больших l рас
пределение Пуассона приближается к нормальному. Поэтому распределение Пуассона применяется, как правило, в тех случаях, когда l имеет порядок единицы, при этом число испытаний n
должно быть велико, а вероятность появления события p
в каждом испытании мала. В связи с этим закон Пуассона часто называют еще законом распределения редких явлений
.
Примерами ситуаций, в которых возникает распределение Пуассона, могут служить распределения: 1) числа определенных микробов в единице объема; 2) числа вылетевших электронов с накаленного катода за единицу времени; 3) числа a-частиц, испускаемых радиоактивным источником за определенных промежуток времени; 4) числа вызовов, поступающих на телефонную станцию за определенное время суток и т.д.
Запишем закон Пуассона в виде таблицы
X | … | k | … | ||||
P | … | … |
Проверим, что сумма всех вероятностей равна единице:
Найдем числовые характеристики этого распределения. По определению математического ожидания для ДСВ имеем
Отметим, что в последней сумме суммирование начинается с k =1, т.к. первый член суммы, соответствующий k =0, равен нулю.
Для нахождения дисперсии найдем предварительно математического ожидание квадрата случайной:
Таким образом, математическое ожидание и дисперсия случайной величины, распределенной по закону Пуассона, совпадают и равны параметру этого распределения
. (6.8)
В этом состоит отличительная особенность распределения Пуассона. Так, если на основании опытных данных было получено, что математическое ожидание и дисперсия некоторой величины близки между собой, то есть основания предполагать, что данная случайная величина распределена в соответствии с законом Пуассона.
Воспользовавшись понятием начальных и центральных моментов, можно показать, что для распределения Пуассона коэффициент асимметрии и эксцесс равны:
. (6.9)
Поскольку параметр l всегда положителен, то у распределения Пуассона всегда положительная асимметрия и эксцесс.
Покажем теперь, что формулу Пуассона можно рассматривать как математическую модель простейшего потока событий.
Потоком событий называют последовательность событий, которые наступают в случайные моменты времени. Поток называется простейшим , если он обладает свойствами стационарности , отсутствия последействия и ординарности .
Интенсивностью потока l называют среднее число событий, которые появляются в единицу времени.
Если постоянная интенсивности потока l известна, то вероятность появления k событий простейшего потока за время t определяется формулой Пуассона:
. (6.10)
Эта формула отражает все свойства простейшего потока. Более того, любой простейший поток описывается формулой Пуассона, поэтому простейшие потоки часто называют пуассоновскими .
Свойство стационарности k событий в любом промежутке времени зависит только от числа k и от длительности t промежутка времени и не зависит от начала его отсчета. Другими словами, если поток обладает свойством стационарности, то вероятность появления k событий за промежуток времени t есть функция, зависящая только от k и от t .
В случае простейшего потока из формулы Пуассона (6.10) следует, что вероятность k событий за время t , при заданной интенсивности является функцией только двух аргументов: k и t , что характеризует свойство стационарности.
Свойство отсутствия последействия состоит в том, что вероятность появления k событий в любом промежутке времени зависит от того, появлялись или не появлялись события в моменты времени, предшествующие началу рассматриваемого промежутка. Другими словами, предыстория потока не влияет на вероятности появления событий в ближайшем будущем.
В случае простейшего потока в формуле Пуассона (6.10) не используется информация о появлении событий до начала рассматриваемого промежутка времени, что характеризует свойство отсутствия последействия.
Свойство ординарности состоит в том, что появление двух или более событий за малый промежуток времени практически невозможно. Другими словами, вероятность появление более одного события за малый промежуток времени пренебрежимо мала по сравнению с вероятностью появления только одного события.
Покажем, что формула Пуассона (6.10) отражает свойство ординарности. Положив k =0 и k =1, найдем соответственно вероятности не появления событий и появления одного события:
Следовательно, вероятность появления более одного события равна
Используя разложение функции в ряд Маклорена, после элементарных преобразований получим
.
Сравнивая P t (1) и P t (k >1), заключаем, что при малых значениях t вероятность появления более одного события пренебрежимо мала по сравнению с вероятностью наступления одного события, что характеризует свойство ординарности.
Пример 6.2. В наблюдениях Резерфорда и Гейгера радиоактивное вещество за промежуток времени 7,5 сек испускало в среднем 3,87 a-частицы. Найти вероятность того, что за 1 сек это вещество испустит хотя бы одну частицу.
Решение. Как мы уже отмечали, распределение числа a-частиц, испускаемых радиоактивным источником за определенных промежуток времени описывается формулой Пуассона, т.е. образует простейший поток событий. Поскольку интенсивность испускания a-частиц за 1 сек равно
,
то формула Пуассона (6.10) примет вид
Таким образом, вероятность того, что за t =1 сек вещество испустит хотя бы одну частицу будет равно
Геометрическое распределение
Пусть производится стрельба по заданной мишени до первого попадания, при этом вероятность p попадания в цель в каждом выстреле одна и та же и не зависит от результатов предыдущих выстрелов. Другими словами, в рассматриваемом опыте осуществляется схема Бернулли. В качестве случайной величины X будем рассматривать число произведенных выстрелов. Очевидно, что возможными значениями случайной величины X являются натуральные числа: x 1 =1, x 2 =2, … тогда вероятность того, что понадобится k выстрелов будет равна
. (6.11)
Полагая в этой формуле k =1,2, … получим геометрическую прогрессию с первым членом p и множителем q :
По этой причине распределение, определяемое формулой (6.11) называется геометрическим .
Используя формулу суммы бесконечно убывающей геометрической прогрессии, легко убедится, что
.
Найдем числовые характеристики геометрического распределения.
По определению математического ожидания для ДСВ имеем
.
Дисперсию вычислим по формуле
.
Для этого найдем
.
Следовательно,
.
Итак, математическое ожидание и дисперсия геометрического распределения равна
. (6.12)
6.4.* Производящая функция
При решении задач, связанных с ДСВ, часто используются методы комбинаторики. Одним из наиболее развитых теоретических методов комбинаторного анализа является метод производящих функций, который является одним из самых сильных методов и в применениях. Кратко познакомимся с ним.
Если случайная величина x принимает только целые неотрицательные значения, т.е.
,
то производящей функцией распределения вероятностей случайной величины x называется функция
, (6.13)
где z – действительная или комплексная переменная. Отметим, что между множеством производящих функций j x (x ) и множеством распределений {P(x=k )} существует взаимно однозначное соответствие .
Пусть случайная величина x имеет биномиальное распределение
.
Тогда, используя формулу бинома Ньютона, получим
,
т.е. производящая функция биномиального распределения имеет вид
. (6.14)
Добавление. Производящая функция распределения Пуассона
имеет вид
. (6.15)
Производящая функция геометрического распределения
имеет вид
. (6.16)
При помощи производящих функций удобно находить основные числовые характеристики ДСВ. Например, первый и второй начальный моменты связаны с производящей функцией следующими равенствами:
, (6.17)
. (6.18)
Метод производящих функций часто бывает удобен тем, что в некоторых случаях функцию распределения ДСВ очень трудно определить, тогда как производящую функцию порой легко найти. Например, рассмотрим схему последовательных независимых испытаний Бернулли, но внесем в нее одно изменение. Пусть вероятность осуществления события A от испытания к испытанию меняется. Это означает, что формула Бернулли для такой схемы становится неприменимой. Задача нахождения функции распределения в таком случае представляет значительные трудности. Однако для данной схемы легко находится производящая функция, а, следовательно, легко находятся и соответствующие числовые характеристики.
Широкое применение производящих функций основано на том, что изучение сумм случайных величин можно заменить изучением произведений соответствующих производящих функций. Так, если x 1 , x 2 , …, x n независимы, то
Пусть p k =P k (A ) – вероятность "успеха" в k -м испытании в схеме Бернулли (соответственно, q k =1–p k – вероятность "неуспеха" в k -м испытании). Тогда, в соответствие с формулой (6.19), производящая функция будет иметь вид
. (6.20)
Пользуясь данной производящей функцией, можем написать
.
Здесь учтено, что p k +q k =1. Теперь по формуле (6.1) найдем второй начальный момент. Для этого предварительно вычислим
и .
В частном случае p 1 =p 2 =…=p n =p (т.е. в случае биномиального распределения) из полученных формул следует, что Mx=np , Dx=npq .
В геометрическом распределении опыты в схеме Бернулли проводятся до первого успеха, с вероятностью успеха р в единичном опыте.
Примерами таких величин могут быть:
- число выстрелов до первого попадания;
- число испытаний прибора до первого отказа;
- число шаров до первого появления белого. см. решение ;
- число бросаний монеты до первого выпадения решки и т.д.
X | 1 | 2 | 3 | … | m | … |
p | p | qp | q 2 p | … | q m-1 p | … |
Вероятности образуют геометрическую прогрессию с первым членом р и знаменателем q .
Математическое ожидание и дисперсия случайной величины Х, имеющей геометрическое распределение с параметром р, равны:
Гипергеометрическое распределение
Дискретная случайная величина имеет гипергеометрическое распределение с параметрами n, k, m, если она принимает значения 0, 1, 2, ... с вероятностями .Гипергеометрическое распределение имеет случайная величина Х, равная числу объектов, обладающих заданным свойством, среди m объектов, случайно извлеченных (без возврата) из совокупности n объектов, k из которых обладают этим свойством.
Например:
- В партии из 10 деталей 3 бракованных. Извлекается 4 детали. Х – число годных деталей среди извлеченных. (m = 4, n = 10, k = 3). см. решение
Пример №1
. В урне 2 белых и 3 черных шара. Шары наудачу достают из урны без возвращения до тех пор, пока не появится белый шар. Как только это произойдет, процесс прекращается. Составить таблицу распределения случайной величины X – числа произведенных опытов, найти F(x), P(X ≤ 2), M(X), D(X).·
Решение:
Обозначим через А – появление белого шара. Опыт может быть проведен только один раз, если белый шар появится сразу:. Если же в первый раз белый шар не появился, а появился при втором извлечении, то X=2. Вероятность такого события равна . Аналогично: , , . Запишем данные в таблицу:
X | 1 | 2 | 3 | 4 |
P | 0,4 | 0,3 | 0,2 | 0,1 |
НайдемF(x):
Найдем P(X ≤ 2) = P(X = 1 или X = 2) = 0,4 + 0,3 = 0,7
M(X) = 1 · 0,4 + 2 · 0,3 +3 · 0,2 + 4 · 0,1 = 2.
D(X) = (1-2) 2 · 0,4 + (2-2) 2 · 0,3 +(3-2) 2 · 0,2 + (4-2) 2 · 0,1 = 1.
Пример №2
. В ящике содержится 11 деталей, среди которых 5 бракованных. Сборщик наудачу извлекает 4 деталей.
1. Найти вероятность того, что среди извлеченных деталей: a
) 4 бракованных; b
) одна бракованная; c
) две бракованные; d
) хотя бы одна бракованная.
2. Составить закон распределения случайной величины X
– числа бракованных деталей среди извлеченных.
3. Найти M(X), D(X), σ(X).
4. Вычислить P(1
Решение:
1. Найти вероятность того, что среди извлеченных деталей:
a
) 4 бракованных;
b
) одна бракованная;
Общее число возможных элементарных исходов для данных испытаний равно числу способов, которыми можно извлечь 4 детали из 11:
Подсчитаем число исходов, благоприятствующих данному событию (среди 4 деталей ровно 1 деталь дефектная):
Остальные 3 детали можно выбрать из 7:
Следовательно, число благоприятствующих исходов равно: 5*20 = 100
Искомая вероятность равна отношению числа исходов, благоприятствующих событию, к числу всех элементарных исходов: P(1) = 100/330 = 0,303
c
) две бракованные;
d
) хотя бы одна бракованная.
Вероятность того, что нет дефектных деталей. X = 0.
Тогда вероятность того, что хотя бы одна бракованная составит:
P = 1 – P(0) = 1 – 0,0455 = 0,95
2. Составим закон распределения P(x), X -числа бракованных деталей среди извлеченных.
Найдем вероятность появления трех бракованных изделий.
X | 0 | 1 | 2 | 3 | 4 |
P | 0,0455 | 0,303 | 0,4545 | 0,182 | 0,015 |
2. Найдем M(X), D(X),
σ(X).
Математическое ожидание находим по формуле m = ∑x i p i .
Математическое ожидание M[X]
.
M[x] = 0*0.0455 + 1*0.303 + 2*0.4545 + 3*0.182 + 4*0.015 = 1.818
Дисперсию находим по формуле d = ∑x 2 i p i - M[x] 2 .
Дисперсия D[X]
.
D[X] = 0 2 *0.0455 + 1 2 *0.303 + 2 2 *0.4545 + 3 2 *0.182 + 4 2 *0.015 - 1.818 2 = 0.694
Среднее квадратическое отклонение σ(x)
.
3. Вычислим P(1
F(0< x ≤1) = 0.0455
F(1< x ≤2) = 0.303 + 0.0455 = 0.349
F(2< x ≤3) = 0.455 + 0.349 = 0.803
F(3< x ≤4) = 0.182 + 0.803 = 0.985
F(x>4) = 1
Вероятность попадания СВ в тот ли иной интервал находится по формуле:
P(a ≤ X < b) = F(b) - F(a)
Найдем вероятность того, что СВ будет находиться в интервале 1 ≤ X < 4
P(1 ≤ X < 4) = F(4) - F(1) = 0.985 - 0.0455 = 0.9395
Пример №3
. В партии 7 деталей 3 бракованные. Контролер наудачу достает 4 детали. Составить закон распределения случайной величины Х – числа годных деталей в выборке. Найти математическое ожидание и дисперсию Х. Построить график функции распределения.
Всего исправных деталей: 7-3 = 4
1. Найдем вероятность того, что среди выбранных 4 деталей одна исправная.
Общее число возможных элементарных исходов для данных испытаний равно числу способов, которыми можно извлечь 4 детали из 7:
Подсчитаем число исходов, благоприятствующих данному событию.