Априорная вероятность. Априорная и апостериорная вероятности гипотез. Примеры. Определение априорной вероятности заболевания

Рассуждение, опирающееся исключительно на точные факты и точные выводы, исходящие из этих фактов, называются строгими соображениями. В случаях, когда для принятия решений необходимо использовать неопределенные факты, строгие рассуждения становятся непригодными. Поэтому, одной из сильнейших сторон любой экспертной системы считается ее способность формировать рассуждения в условиях неопределенности так же успешно, как это делают эксперты-люди. Такие рассуждения имеют характер нестрогих. Можно смело говорить о присутствии нечеткой логики .

Неопределенность , а в следствии и нечеткая логика может рассматриваться как недостаточность адекватной информации для принятия решения. Неопределенность становится проблемой, поскольку может препятствовать созданию наилучшего решения и даже стать причиной того, что будет найдено некачественное решение. Следует отметить, что качественное решение, найденное в реальном времени, часто считается более приемлемым, чем лучшее решение, для вычисления которого требуется большое количество времени. Например, задержка в предоставлении лечения с целью проведения дополнительных анализов может привести к тому, что пациент умрет не дождавшись помощи.

Причиной неопределенности является наличие в информации различных ошибок. Упрощенная классификация этих ошибок может быть представлена ​​в их разделении на следующие типы:

  • неоднозначность информации, возникновение которой связано с тем, что некоторая информация может интерпретироваться различными способами;
  • неполнота информации, связанной с отсутствием некоторых данных;
  • неадекватность информации, обусловленная применением данных, не соответствуют реальной ситуации (возможными причинами являются субъективные ошибки: ложь, дезинформация, неисправность оборудования);
  • погрешности измерения, которые возникают из-за несоблюдения требований правильности и точности критериев количественного представления данных;
  • случайные ошибки, проявлением которых являются случайные колебания данных относительно среднего их значения (причиной могут быть: ненадежность оборудовании, броуновское движение, тепловые эффекты и т.д.).

На сегодня разработана значительное количество теорий неопределенности, в которых делается попытка устранения некоторых или даже всех ошибок и обеспечения надежного логического вывода в условиях неопределенности. К наиболее употребляемых на практике относятся теории, основанные на классическом определении вероятности и на апостериорной вероятности.

Одним из старейших и важнейших инструментальных средств решения задач искусственного интеллекта является вероятность. Вероятность — это количественный способ учета неопределенности. Классическая вероятность берет начало из теории, которая была впервые предложена Паскалем и Ферма в 1654 году. С тех пор была проведена большая работа в области изучения вероятности и осуществлении многочисленные применения вероятности в науке, технике, бизнесе, экономике и других областях.

Классическая вероятность

Классическую вероятность называют также априорной вероятностью, поскольку ее определение относится к идеальным систем. Термин «априорная» обозначает вероятность, что определяется «к событиям», без учета многих факторов, имеющих место в реальном мире. Понятие априорной вероятности распространяется на события, происходящие в идеальных системах, склонных к износу или влияния других систем. В идеальной системе появление любого из событий происходит одинаково, благодаря чему их анализ становится намного проще.

Фундаментальная формула классической вероятности (Р) определена следующим образом:

В этой формуле W — количество ожидаемых событий, а N общее количество событий с равными вероятностями, которые являются возможными результатами эксперимента или испытания. Например, вероятность выпадения любой грани шестигранной игральной кости равна 1/6, а извлечение любой карты из колоды, содержащей 52 различные карты — 1/52.

Аксиомы теории вероятности

Формальная теория вероятности может быть создана на основе трех аксиом:

Приведенные аксиомы позволили заложить фундамент теории вероятности, однако в них не рассматривается вероятность событий, происходящих в реальных — неидеальных системах. В отличие от априорного подхода, в реальных системах, для определения вероятности некоторого события Р(Е) , применяется способ определения экспериментальной вероятности как лимита распределения частот:

Апостериорная вероятность

В этой формуле f(E) обозначает частоту появления некоторого события между N -го количества наблюдений общих результатов. Вероятность такого типа называется также апостериорной вероятностью , т.е. вероятностью, определяемой «после событий». В основу определения апостериорной вероятности положено измерение частоты, с которой возникает некоторое событие при проведении большого количества испытаний. Например, определение социального типа кредитоспособного клиента банка на основе эмпирического опыта.

События, которые не относятся к взаимоисключающих, могут влиять друг на друга. Такие события относятся к классу сложных. Вероятность сложных событий может быть вычислена путем анализа соответствующих им выборочных пространств. Эти выборочные пространства могут быть представлены с помощью диаграмм Венна, как показано на рис. 1

Рис.1 Выборочное пространство для двух не взаимоисключающих событий

Вероятность наступления события А, которая определяется с учетом того, что произошло событие В, называется условной вероятностью и обозначается Р(А|В) . Условная вероятность определяется следующим образом:

Априорная вероятность

В этой формуле вероятность Р(В) не должна равняться нулю, и представляет собой априорную вероятность, что определяется до того, как станет известна другая дополнительная информация. Априорную вероятность , что применяется в связи с использованием условной вероятности, иногда называют абсолютной вероятностью.

Существует задача, которая является по сути противоположной задачи вычисления условной вероятности. Она заключается в определении обратной вероятности, которая показывает вероятность предыдущей события с учетом тех событий, которые произошли в дальнейшем. На практике с вероятностью такого типа приходится встречаться довольно часто, например, при проведении медицинской диагностики или диагностики оборудования, при которой выявляются определенные симптомы, а задача состоит в том, чтобы найти возможную причину.

Для решения этой задачи применяется теорема Байеса , названная в честь британского математика XVIII века Томаса Байеса. Байесивськая теория, в наши дни, широко используется для анализа деревьев решений в экономике и общественных науках. Метод байесовского поиска решений применяется также в экспертной системе PROSPECTOR при определении перспективных площадок для разведки полезных ископаемых. Система PROSPECTOR приобрела широкую популярность как первая экспертная система, с помощью которой был открыт ценное месторождение молибдена, что стоимость 100 миллионов долларов.

Общая форма теоремы Байеса может быть записана в терминах событий (Е) и гипотез (Н), в следующем виде:

Субъективная вероятность

При определении вероятности события применяется также еще один тип вероятности, который называется субъективной вероятностью. Понятие субъективной вероятности распространяются на события, которые не являются воспроизводимыми, и не имеют исторической основы, с помощью которой можно было бы осуществлять экстраполяцию. Такую ситуацию можно сравнить с бурением нефтяной скважины на новой площадке. Однако оценка субъективной вероятности, сделанная экспертом, лучшая, по сравнению с полным отсутствием оценки.

1)Выборка вероятностей всех симптомов для предполагаемых заболеваний. Если заболеваний три (D1,D2,D3), то должно появиться три группы чисел:

P(S 2 /D 1) P(S 2 /D 2) P(S 2 /D 3)

P(S 7 /D 1) P(S 7 /D 2) P(S 7 /D 3)

P(S 9 /D 1) P(S 9 /D 2) P(S 9 /D 3)

Если симптомов много и много возможных диагнозов, что и бывает на практике, то один этот этап выборки осуществить без привлечения ЭВМ принципиально невозможно, что и сделало данный метод возможным лишь с использованием компьютерных технологий.

2)Вычисление условной вероятности симптомокомплекса P(S сi /D j). Вычисляют по формуле, известной из теории вероятностей. Условная вероятность симптомокомплекса представляет собой произведение вероятностей симптомов данного симптомокомплекса при данном диагнозе. Например, для симптомокомплекса из n симптомов для некоторого диагноза J:

P(S ci /Dj)= P(S 1 /D j)*P(S 2 /D j) * ... * P(S n /D j) (1)

Количество получаемых таки образом условных вероятностей равно количеству рассматриваемых в системе диагнозов (т.е. числу столбцов таблицы).

Определение априорной вероятности заболевания.

Априорной вероятностью некоторого диагноза (Dj) называют эмпирическую частоту наблюдения данного заболевания в некоторых конкретных условиях. Априорная вероятность обозначается P(D j) .Она характеризует распределение болезней в данной группе населения. Такой группой может быть контингент данной больницы, данного района, данного города. Априорной (доопытной) она называется потому, что уже известна до получения симптомокомплекса, т.е. к ней новый больной никакого отношения не имеет. Смысл введения в диагностику величины P(D j) состоит в том, что она непостоянна и зависит от географических, сезонных, эпидемиологических и других факторов, которые должны быть учтены при постановке диагноза. Например, в какой-либо больнице наугад было выбрано 100 человек, 70 из них оказались больны гриппом. Значит, вероятность заболевания гриппом у всех пациентов в данной больнице будет равна 70/100=0,7, когда эпидемия гриппа будет ликвидирована, естественно и P(D j) для гриппа в этой больнице будет другой. Величина априорной вероятности диагноза является одной из величин, которая в процессе работы диагностической системы требует мониторинга и текущей коррекции.

Вычисление нормировочного коэффициента (Psc).

Нормировочный коэффициент представляет собой полную вероятность наличия симптомокомплекса при всех заболеваниях. Эта величина несет математический смысл, представляя собой полную сумму попарных произведений условных вероятностей симптомокомплекса для данного диагноза на априорную вероятность этого диагноза:

Psc = P(S сi /D 1) * p(D 1)+ P(S сi /D 2) * p(D 2)+ …+P(S сi /D n) * p(D n)


Полное количество слагаемых в данной сумме равно числу диагнозов, рассматриваемых в данной системе.

5)Вычисление вероятностей диагнозов при данном симптомокомплексе (P(D j /S ci)).

Данный этап являет предпоследним в схеме функционирования системы и основан на использовании теоремы Байеса (формула вероятности гипотез):

P(D j /S ci)=[ P(S сi /D j) x P(D j)] / [ P(Sc) ]

Количество вероятностей диагнозов равно числу диагнозов системы. Иными словами в результате данного этапа работы система вычисляет вероятность каждого из имеющихся диагнозов.

Постановка диагноза.

Этап является наиболее простым и основан на простом сравнении полученных на этапе (5) величин. Наибольшая величина и указывает на тот диагноз, который наиболее вероятен при данном симптомокомплексе. Теоретически возможны случаи, когда вероятность нескольких диагнозов равна. В этом случае необходимо говорить о том, что диагностическая таблица, использующаяся в системе недостаточно совершенна, чтобы “различить” эти диагнозы.

Искомое нами преобразование можно описать следующим образом:
, где

P(x|z) - апостериорная вероятность (wiki);
P(z|x) - функция правдоподобия (зависит от данных, т.е. текущего изображения);
P(x) - априорная вероятность (не зависит от данных).
Фактически, проблему поиска лучшего разделения можно сформулировать таким образом:
(это формула и выражает MAP), или, что тоже самое
, где
E(x) - энергия изображения.
Рассмотрим каждую часть отдельно.

Функция правдоподобия
Данная функция при x = 0 или x = 1 показывает, относится ли текущий пиксель z к нужной нам области изображения. На рисунке справа можно это увидеть.
        Для улучшения результата нам необходимо найти максимум:

        В результате должно получиться следующее:
Априорная вероятность
Этот параметр позволяет учитывать и соседние пиксели при сегментации. Соединим текущий пиксель с его соседями по вертикали и горизонтали. Тогда:
, где

- функция разделения;

- «Ising prior» (априорная вероятность Изинга, по подсказке yuriv).
При этом всем

Апостериорная вероятность
При определении данного слагаемого воспользуемся распределением Гиббса (wiki):
, где

Энергия изображения, где первое слагаемое - значение энергии текущего пикселя самого по себе, а второе - суммарное значение с соседом; w - некий вес, значение которого определяется экспериментально;

Функция правдоподобия;

Априорная вероятность.
Фух, осталось совсем чуть-чуть, самое главное.

Минимизация энергии

Как мы установили в самом начале, минимум энергии соответствует MAP. В этом случае:

(искомый минимум энергии)

Результаты

«Что это было и, главное, ЗАЧЕМ?!», спросит читатель. Вот что в итоге может получиться, с указанием разных значений веса w:

Выводы

Особая прелесть данного метода заключается в том, что формулы энергии мы можем задавать любые. Например, можно добиться выделения на изображении исключительно прямых линий, точек пересечения определенного числа прямых/кривых и многое другое. Кстати, любой счастливый обладатель MS Office 2010 может пощупать описанную технологию. Достаточно использовать инструмент Background Removal.
        Спасибо за внимание!
Уголок копирайтера
Все использованные изображения взяты из работ Carsten Rother. Формулы построены при помощи онлайн

С7 В этом современном виде теорема Байеса была на самом деле сформулирована Лапласом. Томасу Байесу принадлежит сама постановка задачи . Он сформулировал ее как обратную известной задаче Бернулли. Если Бернулли искал вероятность различных исходов бросания "кривой" монеты, то Байес, наоборот, стремился определить степень этой "кривизны" по эмпирически наблюдаемым исходам бросания монеты. В его решении отсутствовала априорная вероятность.  


Хотя правило выглядит очень простым, применить его на практике оказывается трудно, так как бывают неизвестны апостериорные вероятности (или даже значения упрощенных решающих функций). Их значения можно оценить. В силу теоремы Байеса апостериорные вероятности можно выразить через априорные вероятности и функции плотности по формуле Р С, Iх = Р С, (Р(х I С, / Р Су Р хI С,  

Оценивая результаты классификации по методу MDA, мы видим значительную долю ошибочных решений по компаниям-банкротам (группа 1) - одной из них кредит был бы предоставлен. Фирмы с неясным положением (группа 2) с трудом поддаются правильной классификации, потому что, в конечном итоге, они могут попасть в 1-ю или 3-ю группу. Дело нельзя улучшить, приводя априорные вероятности в соответствие с представлениями банка о вероятности принадлежности фирмы различным группам. Общий показатель правильности прогноза составил всего 56.6%, причем из 1-й группы правильно классифицированы были только 30%.  

При имеющемся уровне сложности и одновременности происходящих процессов модели, основанные на причинных связях , имеют ограниченные возможности для применения вновь происходящие события постоянно меняют спецификации всех переменных (и включенных, и не включенных в модель), а значения априорных вероятностей и размеров выплат по различным стратегиям весьма неопределенны и резко меняются вместе с изменениями показателей экономического роста , процентных ставок, обменных курсов и прибыльностью сделок, не связанных с кредитованием (например, при изменении операционных и комиссионных сборов).  

Так как в реальной ситуации нельзя знать заранее, какая часть из компаний, представленных в случайной выборке , потерпит банкротство в течение года и поскольку авторы двух рассматриваемых моделей, как можно предположить, устанавливали разделяющие уровни, исходя из каких-то конкретных предположений об априорных вероятностях банкротства и цене ошибок, мы упростили процедуру сравнения и ввели относительные разделяющие уровни. Иначе говоря, для каждой модели мы считали сигналами о банкротстве нижние 10% сигналов, выдаваемых моделью за очередной год. На деле такой подход означает общую 10-процентную априорную вероятность банкротства и такое отношение числа сигналов о банкротстве к реальным банкротствам в предыдущем тесте, которое определяется с помощью оптимизирующего порога. Кроме того, этот способ имеет то преимущество, что при этом минимизируются искажения, возникающие из-за большого разрыва во времени между публикацией Z-счета Альтмана и проведением эксперимента. Средние показатели за это время могли измениться, и поэтому разделение компаний на сильные и слабые, исходя из определенной пропорции, представляется более надежным. В табл. 9.2 приведены результаты эксперимента по прогнозированию банкротств на год вперед с указанием погрешности для каждой модели.  

Принимая априорную вероятность за факт, оцените ожидаемую прибыль в случае открытия филиала.  

Обозначим через А. событие, заключающееся в том, что q б [

Пусть, например, выбраны следующие параметры величина капитальных вложений , величина эксплуатационных затрат и цена готовой продукции , которые соответственно могут принимать значения Кь К2, К3 Эь Э2, Э3 Ць Ц2, Цз- Каждому из этих значений соответствует некоторая априорная вероятность, например, Кь Эь Ц имеют вероятность pt = 0,1, для К2, Э2, Ц2 вероятность будет р2 = 0,8, а для К3, Э3, Ц3 - р3 = 0,1.  

Пусть априорная вероятность получения в конце процесса проектирования технического решения , удовлетворяющего по-  

Если игрок 2 имеет в игре Г более одной стратегии и априорные вероятности их использования игроку 1 неизвестны или даже вовсе не имеет смысла говорить об этих вероятностях, то все только что сказанное неприменимо.  

Как мы уже ранее видели, изменения априорных вероятностей р и q зависит от настройки сигнала.  

Отсюда следует, что если мы имеем нейтрального к риску субъекта, который считает, что колл-опцион будет стоить Си с вероятностью тг и j с вероятностью (1 - тг), то этот субъект будет вычислять текущую цену опциона с полном соответствии с выведенным нами уравнением. Заметим, что мы нигде не предполагали наличия априорных вероятностей появления той или иной цены акции и, соответственно, будущей оценки опциона . Изложенный подход называется нейтральной к риску оценкой.  

Пусть тг(

Правая часть (7.53) не является плотностью в собственном смысле, так как интеграл от нее не определен, тем не менее при вычислении по формуле Байеса плотности апостериорного распределения параметров формальных трудностей при работе с (7.53) или не возникает, или они легко могут быть преодолены. Как мы увидим ниже в п. 7.3.2, выбор (7.53) удобен в аналитическом отношении и, казалось бы, хорошо отражает полное отсутствие априорных знаний о распределении параметров. Однако в нем на самом деле скрываются очень сильные предположения отсутствие корреляции между параметрами (не пу-т ть с корреляцией между оценками значений параметров, которая зависит от распределения регрессоров и величины а), пренебрежимая малость априорной вероятности того, что вектор параметров лежит в любом наперед заданном конечном объеме, какова бы ни была его величина, и т. д. Это приводит порою к серьезным трудностям с интерпретацией результатов байесовского оценивания .  

Рассмотрим содержание теоремы Байеса с несколько иной точки зрения . Для этого выпишем все возможные исходы нашего эксперимента. Пусть символы Н0, h означают исход монета не накрыта и ее верхняя сторона - герб" . Если вы оцениваете априорную вероятность осуществления  

Я как V2i то вероятность указанного исхода будет Va X х1/2=1/4- Ниже мы приводим список всех исходов и их априорные вероятности  

Так, в примере с монетой и игральной костью Р(На) - априорная вероятность, Р(На К) - апостериорная вероятность , а Р(Н На) - правдоподобность.  

Если теперь априорная вероятность Р(Н0) может быть взята равной либо 1, либо 0, говорят, что принимающий решение  

Вообразим теперь, что экспериментатор предлагает принимающему решение совершенно надежную (или полную) информацию о том, какой именно предмет не накрыт. Принимающий решение должен, однако, заплатить за услугу сообщения такой совершенно надежной информации, прежде чем он получит эту информацию. Какова была бы ценность такой информации Он может заглянуть вперед и спросить себя, что он будет делать в ответ на каждое из двух возможных сообщений, которые может обеспечить данная услуга, и вычислить свой доход, исходя из полученных ответов. Взвешивание этого дохода с помощью априорных вероятностей возможных сообщений позволило бы ему оценить сумму его ожидаемого дохода, если он уплатит некоторую сумму за совершенно надежную информацию до ее фактического получения. Так как этот ожидаемый доход был бы больше 0,5 долл., т. е. того, что он ожидает на основании одной лишь априорной информации , то прирост дохода и явился бы той максимальной суммой, которую ему имело бы смысл уплатить за информационную услугу.  

Фирма должна закупить большое количество товара либо сегодня, либо завтра. Сегодня цена товара 14,5 долл. за единицу. По мнению фирмы, завтра его цена будет либо 10, либо 20 долл. с равной вероятностью. Пусть х обозначает завтрашнюю цену тогда априорные вероятности равны  

На последнем этапе проверяется надежность выбора априорных вероятностей наступления рыночных состояний и вычисляется ожидаемая полезность от уточнения этих вероятностей. Для этого строится дерево решений . В случае появления необходимости дополнительных исследований рынка рекомендуется приостановить процесс внедрения выбранного варианта нового товара до получения более надежных результатов.  

В маркетинговой практической деятельности фирмы зачастую приходится сравнивать затраты на получение частичной (неполной) информации и затраты на получение дополнительной новой информации для принятия более качественного решения. Менеджер (ЛПР) должен оценить, насколько выгода, получаемая от дополнительной информации , покрывает затраты на ее получение. В данном случае может быть применена теория принятия решений Байеса. Исходными данными являются априорные вероятности P(Sk) и условные вероятности P(Z Sk) появления рыночного состояния Z при условии, что предположено появление состояния 5А. При получении новой информации вычисляются ожидаемые полезности каждой стратегии, а затем выбирается стратегия с максимальным значением ожидаемой полезности. С помощью новой информации ЛПР может исправлять априорные вероятности P(Sk), а это очень важно при принятии решений.  

Теперь желательно узнать, какая будет вероятность появления объективного состояния Sk при получении новой информации. Таким образом, необходимо найти P(Sk Z), где k,q = 1,п. Это условная вероятность и она является уточненной априорной вероятностью. Для вычисления P(Sk Z) воспользуемся формулой Байеса  

Итак, мы получили уточненные априорные вероятности появления объективных рыночных состояний. Весь процесс вычисления и получаемые результаты указаны в табл. 9.11 и 9.12.  

Использование бейесовского подхода (6.47) требует знания априорных вероятностей и плотностей распределения вероятностей.  

Используя полученные из АГК числовые характеристики объектов, мы провели стандартный линейный множественный дискрими-нантный анализ с одинаковыми (равными 33%) априорными вероятностями принадлежности элемента. группам. Правильно были классифицированы 41% от общего числа случаев, и это несколько лучше 33-процентной точности, которая получилась бы при случайном отнесении объекта к той или иной группе. Табл. 8.6 ниже- это таблица неправильных классификаций, которая также называется матрицей ошибок.  

Следующая проблема - это выработка стандарта для тестирования. Для оценки MDA-моделей в большинстве случаев берется небольшое количество образцов, и это увеличивает вероятность того, что модель будет слишком точно подогнана под тестовые данные. В выборках обычно содержится поровну компаний-банкротов и небанкротов, а сами данные, как правило, соответствуют периодам интенсивных банкротств. Это приводит к выводу о том, что надежными являются только результаты оценки модели на новых данных. Из табл. 9.1 видно, что даже на самых благоприятных тестах с новыми данными (когда все примеры берутся из одного периода времени и притом однородными в смысле отраслей и размера предприятия) качество получается хуже, чем на образцах, по которым определялись параметры модели. Поскольку на практике пользователи моделей классификации не смогут настраивать модель на другие априорные вероятности банкротства, размер фирмы или отрасль, реальное качество модели может оказаться еще хуже. Качество может также ухудшиться из-за того, что в выборках, используемых для тестирования MDA-моделей, бывает мало фирм, которые не обанкротились, но находятся в зоне риска. Если таких с риском выживающих фирм всего четыре-пять, то это искажает реальную долю рисковых компаний, и в результате частота ошибок 2-го рода оказывается недооцененной.  

Участвовавшие в сравнении MDA-методы были рассчитаны и оптимизированы, исходя из доли ложных сигналов 10 1 при некоторых априорных вероятностях и цене ошибок. Хотелось бы использовать в качестве ex ante критерия меньшее, чем 10-процентное, число потенциальных банкротов в популяции, но это плохо согласуется с параметрами моделей . Это также противоречит практике, когда снижение порога ниже 10-процентного уровня не приводило к банкротству. Так, когда доля ложных сигналов урезалась до 7%, Z-шкала Таффлера вообще переставала идентифицировать банкротства, а модель Datastream наталкивалась на это препятствие на отметке 8%. В противоположность этому нейронная сеть распознала два случая банкротства ниже разделяющего уровня в 4.5%, т.е. сеть способна работать в условиях, когда на одну правильную идентификацию банкротства приходится всего пять ложных сигналов. Этот показатель сравним с наилучшими результатами, которые получаются у MDA-моделей на гораздо менее требовательных тестах задним числом (ех post). Отсюда следуют два вывода во-первых, нейронные модели представляют собой надежный метод классификации в кредитной сфере, и, во-вторых, использование при обучении в качестве целевой переменной цены акции может оказаться более выгодным, чем собственно показателя банкротство/выживание. В цене акций отражает-  

В гл. 3-5 описываются методы шкалирования предпочтений (весов) будущих событий, количественные оценки степени предпочтения и, мы можем вычислить безусловную вероятность любого результата выборки  

Случайное событие оценивают числом, определяющим интенсивность проявления этого события. Это число называют вероятностью события P() . Вероятность элементарного события – . Вероятность события есть численная мера степени объективности, возможности этого события. Чем больше вероятность, тем более возможно событие.

Любое событие, совпадающее со всем пространством исходов S , называетсядостоверным событием , т.е. таким событием, которое в результате эксперимента обязательно должно произойти (например, выпадение любого числа очков от 1 до 6 на игральной кости). Если событие не принадлежит множествуS , то оно считаетсяневозможным (например, выпадение числа очков, большего 6, на игральной кости). Вероятность невозможного события равна 0, вероятность достоверного события равна 1. Все остальные события имеют вероятность от 0 до 1.

События Е иназываютсяпротивоположными , еслиЕ наступает тогда, когда не наступает. Например, событиеЕ – «выпадение четного числа очков», тогда событие– «выпадение нечетного числа очков». Два событияЕ 1 иЕ 2 называютсянесовместными , если не существует никакого исхода, общего для обоих событий.

Для определения вероятностей случайных событий используют непосредственные или косвенные способы. При непосредственном подсчете вероятности различают априорную и апостериорную схемы подсчетов, когда проводят наблюдения (опыты) или априорно подсчитывают число опытовm , в которых событие проявилось, и общее число произведенных опытовn . Косвенные способы основываются на аксиоматической теории. Поскольку события определяются как множества, то над ними можно совершать все теоретико-множественные операции. Теория множеств, функциональный анализ были предложены академиком А.Н. Колмогоровым и составили основу аксиоматической теории вероятности. Приведем аксиомы вероятностей.

Аксиома I . Поле событий F (S ) является алгеброй множеств .

Эта аксиома указывает на аналогию теории множеств и теории вероятности.

Аксиома II . Каждому множеству из F (S ) поставлено в соответствие действительное число P(), называемое вероятностью события :

при условии S 1 S 2 = (для несовместных событийS 1 иS 2 ), или для множества несовместных событий

где N – количество элементарных событий (возможных исходов).

Вероятность случайного события

,

где– вероятности элементарных событий, входящих в подмножество.

Пример 1.1. Определить вероятность выпадения каждого числа при бросании игральной кости, выпадения четного числа, числа4 .

Решение . Вероятность выпадения каждого числа из множества

S = {1, 2, 3, 4, 5, 6}
1/6.

Вероятность выпадения четного числа, т.е.
={2,
4, 6}, исходя из (1.6) будетP(
) = 1/6 + 1/6 + 1/6 = 3/6 = 1/2
.

Вероятность выпадения числа 4 , т.е.
= {4, 5, 6 } ,

P(
) = 1/6 + 1/6 + 1/6 = 3/6 = 1/2.

Задания для самостоятельной работы

1. В корзине 20 белых, 30 черных и 50 красных шаров. Определите вероятность того, что первый вынутый из корзинки шар будет белым; черным; красным.

2. В студенческой группе 12 юношей и 10 девушек. Какова вероятность того, что на семинаре по теории вероятности будут отсутствовать: 1) юноша; 2) девушка; 3) два юноши?

3. В течение года 51 день отличался тем, что в эти дни шел дождь (или снег). Какова вероятность того, что вы рискуете попасть под дождь (или снег): 1) отправляясь на работу; 2) отправляясь в поход на 5 дней?

4. Составьте задачу на тему данного задания и решите ее.

1.1.3. Определение апостериорной вероятности (статистической вероятности или частоты

случайного события)

При априорном определении вероятности предполагалось, что равновероятны. Это далеко не всегда соответствует действительности, чаще бывает, что
при
. Допущение
приводит к ошибке в априорном определенииP() по установленной схеме. Для определения, а в общем случаеP() проводят целенаправленные испытания. В ходе проведения таких испытаний (например, результаты испытаний в примерах 1.2, 1.3) при различном состоянии разнообразных условий, воздействий, причинных факторов, т.е. в различныхслучаях, могут возникнуть различныеисходы (различные проявления сведений исследуемого объекта).Каждый исход испытаний соответствует одному элементу или одному подмножеству множества S .Если определять m как число благоприятных событию А исходов, полученных в результате n испытаний, то апостериорная вероятность (статистическая вероятность или частота случайного события А )

На основании закона больших чисел для A

, n ,

т.е. при увеличении числа испытаний частота случайного события (апостериорная, или статистическая, вероятность) стремится к вероятности этого события.

Пример 1.2. Определенная по схеме случаев вероятность выпадения решки при подбрасывании монеты равна 0,5. Требуется подбросить монету 10, 20, 30 ... раз и определить частоту случайного события решка после каждой серии испытаний.

Решение . К. Пуассон подбрасывал монету 24000 раз, при этом решка выпадала 11998 раз. Тогда по формуле (1.7) вероятность выпадения решки

.

Задания для самостоятельной работы

    На основании большого статистического материала (n ) были получены значения вероятностей появления отдельных букв русского алфавита и пробела () в текстах, которые приведены в табл.1.1.

Таблица 1.1. Вероятность появления букв алфавита в тексте

Возьмите страницу любого текста и определите частоту появления различных букв на этой странице. Увеличьте объем испытаний до двух страниц. Полученные результаты сравните с данными таблицы. Сделайте вывод.

    При стрельбе по мишеням был получен следующий результат (см. табл.1.2).

Таблица 1.2. Результат стрельбы по мишеням

Какова вероятность того, что цель была бы поражена с первого выстрела, если бы по своим размерам она была меньше «десятки», «девятки» и т.д.?

3. Спланируйте и проведите аналогичные испытания для других событий. Представьте их результаты.