При увеличении доверительного интервала почему увеличивается надежность. Доверительный интервал. Доверительная вероятность. средней по малой выборке

1. Введение

2. Основная часть

2.1.1Понятие о доверительных интервалах

2.1.2 Доверительный интервал для математического ожидания нормальной случайной величины при известной дисперсии

2.1.3 Доверительный интервал для математического ожидания нормальной случайной величины при неизвестной дисперсии

2.1.4 Доверительный интервал для дисперсии нормальной случайной величины

2.2 Генеральная совокупность

2.2.1 Построение доверительного интервала для генеральной средней по малой выборке

2.2.2 Построение доверительного интервала для генеральной доли по малой выборке

2.2.3 Построение доверительного интервала для генеральной дисперсии

3. Заключение

Список литературы

1. В ве д е ние

На практике мы всегда имеем дело с ограниченным числом измерений, и задача, которая всегда стоит перед оператором, состоит в том, как оценить точность измерений, т.е. найти его меру приближения к истинному значению на основании группы результатов наблюдения.

В результате отдельных измерений мы получаем некоторые строго фиксированные результаты (точки) измеряемой величины. Их значения являются случайными с некоторым распределением. Случайная погрешность измерения образуется под влиянием большого числа факторов, сопутствующих процессу измерения. Важно зафиксировать отклонения и, при использовании полученных результатов, использовать подход, который будет учитывать такие флуктуации. Подходящим решением является введение понятий доверительного интервала и доверительной вероятности.

2. Основная часть

2.1. 1 Понятие о доверительных интервалах .

После получения точечной оценки и * желательно иметь данные о надежности такой оценки. Особенно важно иметь сведения о точности оценок для небольших выборок (поскольку с возрастанием объема п выборки несмещенность и состоятельность основных оценок гарантируется утверждениями математической статистики). Поэтому точечная оценка может быть дополнена интервальной оценкой -- интервалом (и 1 , и 2), внутри которого с наперед заданной вероятностью г находится точное значение оцениваемого параметра и. Задачу определения такого интервала называют интервальным оцениванием, а сам интервал -- доверительным интервалом. При этом г называют доверительной вероятностью или надежностью, с которой оцениваемый параметр и попадает в интервал (и 1, и 2).

Зачастую для определения доверительного интервала заранее выбирают число б = 1 -- г, 0< б < 1, называемое уровнем значимости, и находят два числа и 1 и и 2 , зависящих от точечной оценки и * , такие, что

Р (и 1 < и < и 2) = 1- б = г. (1)

В этом случае говорят, что интервал (и 1, и 2) накрывает неизвестный параметр и с вероятностью (1 - б), или в 100(1 - б)% случаев. Границы интервала и 1 и и 2 называются доверительными, и они обычно находятся из условия Р (и < и 1) = Р(и > и 2) = б/2 (рис. 1) .

Рисунок 1 - Распределение параметра и

Длина доверительного интервала, характеризующая точность интервальной оценки, зависит от объема выборки п и надежности г (уровня значимости г= 1 - б). При увеличении величины п длина доверительного интервала уменьшается, а с приближением надежности г к единице -- увеличивается. Выбор б (или г = 1 - б) определяется конкретными условиями. Обычно используется б=0,1; 0,05; 0,01, что соответствует 90, 95, 99%-м доверительным интервалам.

Общая схема построения доверительного интервала:

1. Из генеральной совокупности с известным распределением f (x , и) случайной величины X извлекается выборка объема п, по которой находится точечная оценка и * параметра и.

2. Строится случайная величина Y(и), связанная с параметром и и имеющая известную плотность вероятности f (у, и).

3. Задается уровень значимости б.

4. Используя плотность вероятности случайной величины Y, определяют два числа с 1 и с 2 такие, что

Значения с 1 и с 2 выбираются как правило, из условий

Неравенство с 1 < Y (и) < с 2 преобразуется в равносильное и*- д < и < и + д такое, что Р (и*- д < и < и*+ д) = 1 - б .

Полученный интервал (и *- д < и < и *+ д), накрывающий неизвестный параметр и с вероятностью 1 - б, и является интервальной оценкой параметра и.

Интервальная оценка также носит случайный характер, так как она напрямую связана с результатами выборки. Однако она позволяет сделать следующий вывод. Если построен доверительный интервал, который с надежностью г = 1 - б накрывает неизвестный параметр, и его границы рассчитываются по К выборкам одинакового объема п, то в (1- б)К случаях построенные интервалы накроют истинное значение исследуемого параметра.

Поскольку в эконометрических задачах часто приходится находить доверительные интервалы параметров случайных величин, имеющих нормальное распределение, приведем схемы их определения.

2. 1. 2

нормальной случайной величины при известной дисперсии .

Пусть количественный признак X генеральной совокупности имеет нормальное распределение с заданной дисперсией у 2 и неизвестным математическим ожиданием M(Х~N(т , у)). Построим доверительный интервал для т.

1. Пусть для оценки т извлечена выборка х 1 , х 2 , ..., х п объема n . Тогда

2. Составим случайную величину. Нетрудно показать, что случайная величина u имеет стандартизированное нормальное распределение, т.е. u ~ N (0, 1) ().

3. Зададим уровень значимости б.

4. Применяя формулу нахождения вероятности отклонения нормальной величины от математического ожидания, имеем:

Это означает, что доверительный интервал накрывает неизвестный параметр т с надежностью 1- б. Точность оценки определяется величиной .

Отметим, что число определяется по таблице значений функции Лапласа из равенства (рис.2) .

Рисунок 2 - Стандартизированное нормальное распределение случайной величины

Пример 1 . На основе продолжительных наблюдений за весом X пакетов орешков, заполняемых автоматически, установлено, что стандартное отклонение веса пакетов у = 10 г. Взвешено 25 пакетов, при этом их средний вес составил = 244 г. В каком интервале с надежностью 95 % лежит истинное значение среднего веса пакетов?

Логично считать, что случайная величина X имеет нормальный закон распределения: Х~N(m , 10). Для определения 95%-го доверительного интервала найдем критическую точку = u 0,025 из приложения 1 по соотношению

Тогда по формуле (3) построим доверительный интервал:

2.1.3 Доверительный интервал для математического ожидания

нормальной случайной величины при неизвестной дисперсии .

В реальности истинное значение дисперсии исследуемой случайной величины, скорее всего, известно не будет. Это приводит к необходимости использования другой формулы при определении доверительного интервала для математического ожидания случайной величины, имеющей нормальное распределение.

Пусть X ~ N(m , у 2), причем т и у 2 -- неизвестны. Необходимо построить доверительный интервал, накрывающий с надежностью г = 1 - б истинное значение параметра т.

Для этого из генеральной совокупности случайной величины X извлекается выборка объема п: х 1 , х 2 , ..., х п .

1. В качестве точечной оценки математического ожидания т используется выборочное среднее, а в качестве оценки, дисперсии у 2 -- исправленная выборочная дисперсия , которой соответствует стандартное отклонение.

2. Для нахождения доверительного интервала строится статистика , имеющая в этом случае распределение Стьюдента с числом степеней свободы v = п - 1 независимо от значений параметров т и у 2 .

4. Применяется следующая формула расчета вероятности

где -- критическая точка распределения Стьюдента, которая находится по соответствующей таблице . Тогда

Это означает, что интервал накрывает неизвестный параметр m с надежностью 1 - б.

Пример 2 . Найти доверительный интервал для оценки неизвестного математического ожидания нормально распределенного признака, если известны:у = 2; = 5,4; n = 10; г = 0,95.

Решение.

2Ф(t) = 0,95, Ф(t) = 0,5*0,95=0,475.

Найдя t = 1,96, получим.

Доверительный интервал

(- д; + д) = (5,4- 1,24; 5,4+1,24)=(4,16; 6,64).

Пример 3 . Найти минимальный объем выборки, при котором с надежностью 0,95 точность оценки математического ожидания нормально распределенного признака по выборочной средней будет равна 0,2, если среднее квадратическое отклонение равно2.

Решение.

Дано: г = 0,95; д = 0,2; у = 2. Найти n.

Из формулы находим. Из условия2Ф(t) = 0,95 находим t = 1,96. Тогда.

Пример 4 . По заданным значениям характеристик нормально распределенного признака найти доверительный интервал для оценки неизвестного математического ожидания:

г = 0,95, n =12, S = 1,5. = 16,8.

Решение.

По даннымг и n находим t = 2,20, тогда.

Доверительный интервал: (16,8 - 0,95; 16,8 + 0,95) = (15,85; 17,75).

2.1.4 Доверительный интервал для дисперсии нормальной

случайной величины .

Пусть X ~ N(т, у 2), причем т и у 2 -- неизвестны. Пусть для оценки у 2 извлечена выборка объема п: : х 1 , х 2 , ..., х п .

1. В качестве точечной оценки дисперсии D (X ) используется исправленная выборочная дисперсия которой соответствует стандартное отклонение.

2. При нахождении доверительного интервала для дисперсии в этом случае вводится статистика, имеющая -распределение с числом степеней свободы v = п - 1 независимо от значения параметра у 2 .

3. Задается требуемый уровень значимости б.

4. Тогда, используя таблицу критических точек распределения, нетрудно указать критические точки, для которых будет выполняться следующее равенство:

Подставив вместо соответствующее значение, получим

Неравенство может быть преобразовано в следующее:

Таким образом, доверительный интервал () накрывает неизвестный параметр с надежностью 1- б . А доверительный интервал () с надежностью 1 - б накрывает неизвестный параметр .

2.2 Генеральная совокупность .

Генеральной совокупностью называется множество всех возможных значений или реализаций исследуемой случайной величины при данном реальном комплексе условий.

Выборкой называют часть генеральной совокупности, отобранную для изучения.

Изучение всей генеральной совокупности во многих случаях либо невозможно, либо нецелесообразно в силу больших материальных затрат, поэтому на практике часто приходится иметь дело с выборками небольшого объема п <10- 20. В этом случае используемый обычно метод построения интервальной оценки для генеральной средней (среднего арифметического генеральной совокупности) и генеральной доли (доли элементов, обладающих необходимым признаком) неприменим в силу двух обстоятельств:

1) необоснованным становится вывод о нормальном законе распределения выборочных средней и доли w , так как он основан на центральной предельной теореме при больших п;

2) необоснованной становится замена неизвестных генеральной дисперсии у 2 и доли р их точечными оценками (или) или w , так как в силу закона больших чисел (состоятельности оценок) эта замена возможна лишь при больших п .

2.2.1

средней по малой выборке.

Задача построения доверительного интервала для генеральной средней может быть решена, если в генеральной совокупности рассматриваемый признак имеет нормальное распределение.

Теорема. Если признак (случайная величина) X имеет нормальный закон распределения с параметрами, x 2 = 2 , т.е. , то выборочная средняя при любом n имеет нормальный закон распределения

Если в случае больших выборок из любых генеральных совокупностей нормальность распределения обусловливалась суммированием большого числа одинаково распределенных случайных величин / n (теорема Ляпунова), то в случае малых выборок, полученных из нормальной генеральной совокупности, нормальность распределения вытекает из того, что распределение суммы (композиция) любого числа нормально распределенных случайных величин имеет нормальное распределение. Формулы числовых характеристик для получены ранее.

Таким образом, если бы была известна генеральная дисперсия, то доверительный интервал можно было бы построить аналогично изложенному выше и при малых n . Заметим, что в этом случае нормированное отклонение выборочной средней имеет стандартное нормальное распределение N(0; 1), т.е. нормальное распределение с математическим ожиданием, равным нулю, и дисперсией, равной единице.

Действительно, используя свойства математического ожидания и дисперсии, получим, что

Однако на практике почти всегда генеральная дисперсия (как и оцениваемая генеральная средняя) неизвестна. Если заменить ее «наилучшей» оценкой по выборке, а именно «исправленной» выборочной дисперсией, то большой интерес представляет распределение выборочной характеристики (статистики) или с учетом малой выборки, распределение статистики.

Представим статистику t в виде:

Числитель выражения (8) имеет стандартное нормальное распределение N (0; 1). Можно показать, что случайная величина имеет - распределение с н = n - 1 степенями свободы. Следовательно, статистика t имеет t- распределение Стьюдента с н =п - 1 степенями свободы. Указанное распределение не зависит от неизвестных параметров распределения случайной величины X, а зависит лишь от числа н, называемого числом степеней свободы.

Выше отмечено, что t - распределение Стьюдента напоминает нормальное распределение, и действительно при н >? как угодно близко приближается к нему.

Число степеней свободы к определяется как общее число n наблюдений (вариантов) случайной величины X минус число уравнений l, связывающих эти наблюдения, т.е. н = п - l.

Так, например, для распределения статистики число степеней свободы н = п - 1, ибо одна степень свободы «теряется» при определении выборочной средней (и наблюдений связаны одним уравнением).

3ная t - распределение Стьюдента, можно найти такое критическое значение что вероятность того, что статистика не превзойдет величину (по абсолютной величине), равна:

Функция, где - плотность вероятности t - распределения Стьюдента при числе степеней свободы н табулирована. Эта функция аналогична функции Лапласа Ф(t ), но в отличие от нее является функцией двух переменных -- t и н = п - 1. При н >? функция неограниченно приближается к функции Лапласа Ф(t) .

Формула доверительной вероятности для малой выборки может быть представлена в равносильном виде:

- предельная ошибка малой выборки. Доверительный интервал для генеральной средней, как и ранее, находится по формуле:

Пример 5 . Для контроля срока службы электроламп из большой партии было отобрано 17 электроламп. В результате испытаний оказалось, что средний срок службы отобранных ламп равен 980 ч, а среднее квадратическое отклонение их срока службы -- 18 ч. Необходимо определить: а) вероятность того, что средний срок службы ламп во всей партии отличается от среднего срока службы отобранных для испытаний ламп не более чем на 8 ч (по абсолютной величине); б) границы, в которых с вероятностью 0,95 заключен средний срок службы ламп во всей партии.

Решение.

Имеем по условию п = 20, = 980(ч), S = 18 ч.

а) Зная предельную ошибку малой выборки = 8 (ч), найдем из соотношения (9):

Теперь искомая доверительная вероятность

А находится по таблице значений при числе степеней свободы = 16.

Итак, вероятность того, что расхождение средних сроков службы электроламп в выборке и во всей партии не превысит 8 ч (по абсолютной величине), равна 0,906.

б) Учитывая, что = 0,95 и t 0,95;16 =2,12, по (11)найдем предельную ошибку малой выборки (ч). Теперь по (12)искомый доверительный интервал или (ч), т.е. с надежностью 0,95 средний срок службы электроламп в партии заключен от 970,5 до 989,5 ч.

2.2.2 Построение доверительного интервала для генеральной доли

по малой выборке.

Если доля признака в генеральной совокупности равна р то вероятность того, что в повторной выборке объема п т элементов обладают этим признаком, определяется по формуле Бернулли: , где q = 1 - р , т.е. распределение повторной выборки описывается биномиальным распределением. Так как при р? 0,5 биномиальное распределение несимметрично, то в качестве доверительного интервала для р берут такой интервал (p 1 , p 2 ), что вероятность попадания левее р 1 и правее p 2 одна и та же и равна (1 - г)/2:

где - фактическое число элементов выборки, обладающих признаком.

Рисунок 3 - Генеральная доля для г=0,9

Решение таких уравнений можно упростить, если использовать специальные графики, позволяющие при данном объеме выборки п и заданной доверительной вероятности г определить границы доверительного интервала для генеральной доли р. В качестве примера на рисунке 3 приведены такие графики для г = 0,9.

Пример 6 . Опрос случайно отобранных 15 жителей города показал, что 6 из них будут поддерживать действующего мэра на предстоящих выборах. Найти границы, в которых с надежностью 0,9 заключена доля граждан города, которые будут поддерживать на предстоящих выборах действующего мэра.

Решение.

Выборочная доля жителей, поддерживающих мэра, w = т/п = 6/15 = 0,4 . По рисунку 3 для г = 0,9 находим при w = 0,4 и для п = 15 по нижнему графику p 1 =0,23, а по верхнему -- р 2 = 0,60, т.е. доля жителей города, поддерживающих мэра, с надежностью 0,9 заключена в границах от 0,23 до 0,60. Очевидно, что более точный ответ на вопрос задачи может быть получен при увеличении объема выборки п.

2.2.3 Построение доверительного интервала для генеральной

дисперсии.

Пусть распределение признака (случайной величины) X в генеральной совокупности является нормальным N (, 2). Предположим, что математическое ожидание М(Х) = (генеральная средняя) известно. Тогда выборочная дисперсия повторной выборки X 1 , X 2 , …, X n :

ее неследует путать с выборочной дисперсией

и «исправленной» выборочной дисперсией

если S характеризует вариацию значений признака относительно генеральной средней, то и -- относительно выборочной средней .

Рассмотрим статистику

Учитывая, M (X i ) = , D (X i )= у 2 , (i = 1, 2, …, n ) нетрудно показать, что М (t ) = 0 и.

Выше отмечено, что распределение суммы квадратов п независимых случайных величин, каждая из которых имеет стандартное нормальное распределение N (0;l), представляет распределение 2 с н = п степенями свободы.

Таким образом, статистика имеет распределение 2 с н = п степенями свободы.

Распределение 2 не зависит от неизвестных параметров случайной величины X , а зависит лишь от числа степеней свободы н .

Плотность вероятности распределения имеет сложный вид и интегрирование ее является весьма трудоемким процессом. Составлены таблицы для вычисления вероятности того, что случайная величина, имеющая 2 - распределение с н степенями свободы, превысит некоторое критическое значение, т.е.

В практике выборочного наблюдения математическое ожидание, как правило, неизвестно, и приходится иметь дело не с, а с S 2 или. Если Х 1 , X 2 ,..., X n -- повторная выборка из нормально распределенной генеральной совокупности, то, как уже сказано выше, случайная величина (или) имеет распределение 2 с н = п --1 степенями свободы. Поэтому для заданной доверительной вероятности г можно записать:

(графически это площадьпод кривой распределения и рис. 4).

Рисунок 4 - Кривая распределения 2

Очевидно, что значения и определяются неоднозначно при одном и том же значении заштрихованной площади. Обычно и выбирают таким образом, чтобы вероятности событий < и > были одинаковы, т. е.

Преобразовавдвойное неравенство в равенстве (13)к равносильному виду, получим формулу доверительной вероятности для генеральной дисперсии:

а для среднеквадратического отклонения:

. (15)

При использовании таблиц вероятностей необходимо учесть, что поэтому условие

равносильно условию.

Таким образом, значения и находим из равенств:

Пример 7. На основании выборочных наблюдений производительности труда 20 работниц было установлено, что среднее квадратическое отклонение суточной выработки составляет 15 м ткани в час. Предполагая, что производительность труда работницы имеет нормальное распределение, найти границы, в которых с надежностью 0,9 заключены генеральные дисперсия и среднее квадратическое отклонение суточной выработки работниц.

Решение.

Имеем г = 0,9; (1 - г)/2 = 0,05; (1 +г)/2 = 0,95.

При числе степеней свободы н = n - 1=20 - 1=19 в соответствии с (16)и (17)определим и для вероятностей 0,95 и 0,05, т.е. = 10,1 и = 30,1. Тогда доверительный интервал для у 2 по (14)можно записать в виде:

или и для у по (15):

или 12,2 < у <21,1(м/ч).

Итак, с надежностью 0,9 дисперсия суточной выработки работниц заключена в границах от 149,5 до 445,6, а ее среднее квадратическое отклонение -- от 12,2 до 21,1 метров ткани в час.

Таблицы составлены при числе степеней свободы н от 1 до 30. При н > 30 можно считать, что случайная величина имеет стандартное нормальное распределение N (0; l). Поэтому для определения и следует записать, что

откуда и, после преобразований,

Таким образом, при расчете доверительного интервала надо полагать, .

Пример 8 . Решить задачу, приведенную в примере 7, при п = 100 работницам.

Решение.

При Ф(t ) = 0,9 t = 1,645, поэтому

3. Заключение

В данной курсовой работе рассмотрено понятие доверительного интервала и его разновидности в метрологии.

Провести бесконечное число измерений для получения верного результата в реальной жизни невозможно, поэтому важно дать объективное представление результатов ограниченного числа измерений, чему и призван помочь изучаемый подход.

Цель любого оценивания состоит в получении наиболее точного значения исследуемой характеристики. Доверительный интервал позволяет с определенной точностью получить распределение параметра, что дает хорошее представление об исследуемом объекте.

Список литературы

1. Беляев Ю.К., Носко В.П. Основные понятия и задачи математической статистики. - М.: Изд- во МГУ, ЧеРо, 1998. С. 114

2. Бородич С.А. Вводный курс эконометрики: Учебное пособие. - Мн.: БГУ, 2000. С. 46-48, 60-70

3. Крамер Г. Математические методы статистики.- М.: Госиноиздат, 1948. С. 118-130

4. Крамер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов. - М.: ЮНИТИ- ДАНА, 2002. С. 140-144

5. Мешалкин Л.Д. Сборник задач по теории вероятностей. - М.: Изд- во МГУ, 1963. С. 30-33

6. Тутубалин В.Н. Теория вероятностей и случайных процессов. Основы математического аппарата и прикладные аспекты. - М.: Изд- во МГУ, 1992.

7. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. - М.: Инфра- М Финансы и статистика, 1995.

Cтраница 2


Качество исходных данных (статистика) о показателях надежности электрооборудования (вместе с показателями ущерба от нарушений электроснабжения и сведениями о режимах работы и ППР) оценивается точностью - шириной доверительного интервала, накрывающего показатель, и достоверностью - вероятностью не совершить ошибку, выбирая этот интервал. Точность математических моделей надежности оценивается их адекватностью реальному объекту, а точность метода расчета надежности - адекватностью полученного решения идеальному.  

Теперь коэффициент вариации дебита, так же как и сам дебит, существенно зависит от &0 / &1 - Так, например, при pi 1 м и ku / k 5 средний дебит уменьшается по сравнению с первоначальным примерно в 2 раза, а ширина доверительного интервала почти в 3 раза. Очевидно, уточнение параметров призабойной зоны в этом случае дает существенную информацию и значительно улучшает качество прогноза.  


Неизменность числа испытаний п на каждой ступени оказывает существенное влияние иа точность результатов. Ширина доверительного интервала уменьшается с увеличением объема выборки.  

Доверительными называют интервалы, в пределах которых находятся с определенными (доверительными) вероятностями истинные значения оцениваемых параметров. Обычно ширину доверительного интервала выражают через СКО результатов отдельных наблюдений ах.  

Ширина доверительного интервала зависит от желаемой статистической надежности е, объема выборки п и от распределения случайных значений, в особенности от разброса. Длина и ширина доверительных интервалов определяется также имеющейся (случайной) выборкой.  

Однако ширина доверительного интервала при этом получается неприемлемо большой. Однако и в этом случае ширина доверительного интервала получается слишком большой.  


Отсюда границы доверительного интервала составляют (23 85 - 2 776 - 0 13; 23 85 2 776Х Х0 13) (23 49; 24 21) МПа. Из результатов видно, что ширина доверительного интервала для той же вероятности должна быть почти в 1 5 раза больше за счет того, что при меньшем числе измерений доверие к ним меньше.  

Из соотношения (2.29) следует, что вероятность того, что доверительный интервал (0 - Д; в Д) со случайными границами накроет известный параметр 0, равна у. Величину Д, равную половине ширины доверительного интервала, называют точностью оценки, а вероятность у - доверительной вероятностью (или надежностью) оценки.  

Интервал (04, 042) называется доверительным, его границы 04 и 0W, являющиеся случайными величинами, соответственно нижним и верхним доверительными пределами. Любая интервальная оценка может быть охарактеризована совокупностью двух чисел: шириной доверительного интервала Н 04 - 0И, являющейся мерой точности оценивания параметра 0, и доверительной вероятностью у, характеризующей степень достоверности (надежности) результатов.  

При этих условиях доверительные границы определяются: для Мэ и а с помощью - распределения, а для Мн - с помощью распределения Стьюдента. Из графиков видно, что при малом числе п наблюдавшихся отказов ширина доверительного интервала, которая характеризует возможное отклонение в оценке параметра распределения, велика. Действительное значение параметра может в несколько раз отличаться от полученного из опыта значения соответствующей статистической оценки. С увеличением п границы доверительного интервала постепенно суживаются. Для получения достаточно точных и достоверных оценок требуется, чтобы при испытании наблюдалось большое число отказов, что, в свою очередь, требует значительного объема испытаний, особенно при высокой надежности объектов.  

Пусть измерение проводят несколько раз, причем условия эксперимента поддерживают, насколько возможно, неизменными. Поскольку строго соблюдать неизменность условий невозможно, результаты отдельных измерений будут несколько различаться. Их можно рассматривать как значения случайной величины g, распределенной по некоторому закону, заранее нам неизвестному.

Очевидно, математическое ожидание равно точному значению измеряемой величины (строго говоря, точному значению плюс систематическая ошибка).

Обработка измерений основана на центральной предельной теореме теории вероятностей: если с есть случайная величина, распределенная по любому закону, то

есть также случайная величина, причем

а закон распределения величины стремится к нормальному (гауссову) при . Поэтому среднеарифметическое нескольких независимых измерений

является приближенным значением измеряемой величины, причем с тем большей надежностью, чем больше число измерений .

Однако равенство не является точным, и нельзя даже строго указать предел его ошибки; в принципе может сколь угодно сильно отличаться от хотя вероятность такого события ничтожно мала.

Ошибка приближенного равенства (2) носит вероятностный характер и описывается доверительным интервалом Р, т. е. границей, которую с доверительной вероятностью не превышает разность . Символически это записывают следующим образом:

Доверительный интервал зависит от закона распределения (а тем самым от постановки эксперимента), от числа измерений , а также от выбранной доверительной вероятности . Из (3) видно, что чем ближе к единице, тем шире оказывается доверительный интервал.

Доверительную вероятность выбирают, исходя из практических соображений, связанных с применениями полученных результатов. Например, если мы делаем игрушечный воздушный змей, то вероятность благополучного полета нас устроит, а если конструируем самолет, то даже вероятность недостаточна. Во многих физических измерениях считается достаточной.

Замечание 1. Пусть требуется найти величину z, но измерять удобнее величину связанную с ней известным соотношением например, нас интересует джоулево тепло, а измерять легче ток. При этом следует помнить, что

так, среднее значение переменного тока равно нулю, а средний джоулев нагрев отличен от нуля. Поэтому, если мы вычислим сначала а затем положим это будет грубая ошибка. Следует по каждому измерению вычислять и далее обрабатывать полученные значения .

Ширина доверительного интервала. Если известна плотность распределения величины то доверительный интервал можно определить из (3), разрешая уравнение

относительно . Выше отмечалось, что при распределение стремится к нормальному

здесь - дисперсия распределения, а величину называют стандартным отклонением или просто стандартом.

Подставляя (5) в (4) и полагая , т. е. измеряя доверительный интервал в долях стандарта, получим соотношение

(6)

Интеграл ошибок, стоящий в правой части (6), табулирован, так что из этого соотношения можно определить доверительный интервал . Зависимость дается в таблице 23 строкой, соответствующей

Из таблицы 23 видно, что доверительный интервал соответствует доверительной вероятности так что отклонение от более чем на маловероятно. Но отклонение более чем на довольно вероятно, поскольку ширине соответствует

Таким образом, если известна дисперсия то нетрудно определить стандарт и, тем самым, абсолютную ширину доверительного интервала . В этом случае даже при выполнении одного измерения можно оценить случайную ошибку , а увеличение числа измерений позволяет уменьшать доверительный интервал, поскольку

Критерий Стьюдента. Чаще всего дисперсия D? неизвестна, поэтому выполнить оценку ошибки указанным выше способом обычно не удается. При этом точность однократного измерения неизвестна. Однако, если измерение повторено несколько раз, можно приближенно найти дисперсию:

Точность этого выражения невелика по двум причинам: во-первых, число членов суммы обычно мало; во-вторых, использование замены вносит ошибку значительную при малых n. Более хорошее приближение дает так называемая несмещенная оценка дисперсии:

где величину s называют стандартом выборки.

Оценка (8) также является приближенной, поэтому нельзя пользоваться формулой (6), заменяя в ней на Надо вносить в нее поправку, тем большую, чем меньше . Если распределение считать нормальным при любых , то связь доверительного интервала со стандартом выборки устанавливается критерием Стьюдента:

где коэффициенты Стьюдента представлены в таблице 23.

Таблица 23

Коэффициенты Стьюдента

Очевидно, при больших с хорошей точностью выполняется . Поэтому при критерий Стьюдента переходит в формулу (6); выше отмечалось, что этой формуле соответствует строка таблицы 23. Однако при малых доверительный интервал (8) оказывается много шире, чем по критерию (6).

Пример 1. Выбрано и выполнено 3 измерения; по таблице 23 доверительный интервал равен

К сожалению, не все физики и инженеры знакомы с понятием доверительного интервала и критерием Стьюдента. Нередко встречаются экспериментальные работы, в которых при малом числе измерений пользуются критерием или даже считают, что значение является погрешностью величины , и вдобавок оценивают дисперсию по формуле (7).

Для приведенного выше йримера при первой ошибке был бы дан ответ при второй а при третьей что сильно отличается от правильного значения.

Замечание 2. Зачастую одна и та же величина измерена в разных лабораториях на разном оборудовании. Тогда следует найти среднее и стандарт по формулам (2) и (8), где суммирование проводится по всем измерениям во всех лабораториях, и определить доверительный интервал по критерию Стьюдента.

Нередко при этом суммарный стандарт s оказывается больше, чем стандарты определенные по данным отдельных лабораторий. Это естественно. Каждая лаборатория делает при измерениях систематические ошибки, и часть систематических ошибок в разных лабораториях совпадает, а часть различается. При совместной обработке различающиеся систематические ошибки переходят в разряд случайных, увеличивая стандарт.

Значит, при совместной обработке разнотипных измерений обычно систематическая ошибка значения будет меньше, а случайная больше. Но случайную ошибку можно сколь угодно уменьшить, увеличивая число измерений. Поэтому такой способ позволяет получить окончательный результат с большей точностью.

Замечание 3. Если в разных лабораториях используется оборудование разного класса точности, то при такой совместной обработке надо суммировать с весами

где относятся, как квадраты точности приборов.

Произвольное распределение. Чаще всего число измерений невелико и заранее неясно, можно ли считать распределение нормальным и пользоваться приведенными выше критериями.

Для произвольного распределения справедливо неравенство Чебышева

Отсюда можно оценить доверительный интервал:

Коэффициент в этой оценке приведен в дополнительной строке таблицы 23.

Из таблицы видно, что если в качестве доверительной вероятности принять то для произвольного закона распределения сизвестной дисперсией доверительный интервал не превышает . Для симметричного одновершинного распределения аналогичные оценки показывают, что доверительный интервал не превышает напомним, что для нормального распределения он равен (при выбранном ).

Разумеется, если вместо используют найденное по тем же измерениям значение то надо строить критерий, аналогичный критерию Стьюдента. Оценки при этом будут существенно хуже приведенных.

Проверка нормальности распределения. Из сравнения критериев (6) и (11) видно, что даже при невысокой доверительной вероятности оценки доверительного интервала при произвольном распределении вдвое хуже, чем при нормальном. Чем ближе к единице, тем хуже соотношение этих оценок. Поэтому целесообразно проверять, существенно ли отличается распределение от нормального.

Распространенный способ проверки - исследование так называемых центральных моментов распределения:

Два первых момента, по определению, равны Для нормального распределения два следующих момента равны Обычно ограничиваются этими моментами. Вычисляют их фактические значения по проведенным измерениям и проверяют, согласуются ли они со значениями, соответствующими нормальному распределению.

Удобно вычислять не сами моменты, а составленные из них безразмерные комбинации - асимметрию и эксцесс для нормального распределения они обращаются в нуль. Аналогично дисперсии, вычислим их по несмещенным оценкам:

где s определяется формулой (8). Собственные дисперсии этих величин известны и зависят только от числа измерений:

причем собственное распределение А является симметричным.

Поэтому, если выполняются соотношения

то по критерию Чебышева (11) отличие А и Е от нуля недостоверно, так что можно принять гипотезу о нормальности распределения

Формулы (13)-(15) непосредственно относятся к распределению единичного измерения. На самом деле надо проверить, нормально ли распределение среднеарифметического при выбранном . Для этого делают большое число измерений разбивают их на групп по измерений в каждой и среднее значение в каждой группе рассматривают как единичное измерение. Тогда проверка выполняется по формулам (13)-(15), где вместо надо подставить .

Разумеется, такую тщательную проверку проводят не в каждой измеряемой точке, а лишь во время отработки методики эксперимента.

Замечание 4. Аналогично проверяют любые естественнонаучные гипотезы. Производят большое число экспериментов и выясняют, нет ли среди них событий, маловероятных с точки зрения этой гипотезы. Если найдутся такие события, то гипотезу отвергают, если нет - условно принимают.

Выбор . За счет увеличения числа измерений можно неограниченно уменьшать доверительный интервал. Однако систематическая ошибка при этом не уменьшается, так что суммарная ошибка все равно будет больше Поэтому целесообразно выбрать я так, чтобы ширина доверительного интервала составляла Дальнейшее увеличение числа измерений бессмысленно.

Доверительные интервалы.

Вычисление доверительного интервала базируется на средней ошибке соответствующего параметра. Доверительный интервал показывает, в каких пределах с вероятностью (1-a) находится истинное значение оцениваемого параметра. Здесь a – уровень значимости, (1-a) называют также доверительной вероятностью.

В первой главе мы показали, что, например, для среднего арифметического, истинное среднее по сово­купности примерно в 95% случаев лежит в пределах 2 средних ошибок среднего. Таким образом, границы 95% доверительного интервала для среднего будет отстоять от выборочного среднего на удвоенную среднюю ошибку среднего, т.е. мы умножаем среднюю ошибку среднего на некий коэффициент, зависящий от доверительной вероятности. Для среднего и разности средних берётся коэффициент Стьюдента (критическое значение критерия Стьюдента), для доли и разности долей критическое значение критерия z. Произведение коэффициента на среднюю ошибку можно назвать предельной ошибкой данного параметра, т.е. максимальную, которую мы можем получить при его оценке.

Доверительный интервал для среднего арифметического : .

Здесь - выборочное среднее;

Средняя ошибка среднего арифметического;

s – выборочное среднее квадратическое отклонение;

n

f = n -1 (коэффициент Стьюдента).

Доверительный интервал для разности средних арифметических :

Здесь - разность выборочных средних;

- средняя ошибка разности средних арифметических;

s 1 ,s 2 – выборочные средние квадратические отклонения;

n 1 ,n 2

Критическое значение критерия Стьюдента при заданных уровне значимости a и числе степеней свободы f=n 1 +n 2 -2 (коэффициент Стьюдента).

Доверительный интервал для доли :

.

Здесь d – выборочная доля;

– средняя ошибка доли;

n – объём выборки (численность группы);

Доверительный интервал для разности долей :

Здесь - разность выборочных долей;

– средняя ошибка разности средних арифметических;

n 1 ,n 2 – объёмы выборок (численности групп);

Критическое значение критерия z при заданном уровне значимости a ( , , ).

Вычисляя доверительные интервалы для разности показателей, мы, во-первых, непосредственно видим возможные значения эффекта, а не только его точечную оценку. Во-вторых, можем сделать вывод о принятии или опровержении нулевой гипотезы и, в-третьих, можем сделать вывод о мощности критерия.

При проверке гипотез с помощью доверительных интервалов надо придерживаться следующего правила:

Если 100(1-a)-процентный доверительный интервал разности средних не содержит нуля, то различия статистически значимы на уровне значимости a; напротив, если этот интервал содержит ноль, то различия статистически не значимы.

Действительно, если этот интервал содержит ноль, то, значит, сравниваемый показатель может оказаться как больше, так и меньше в одной из групп, по сравнению с другой, т.е. наблюдаемые различия случайны.

По месту, где находится ноль внутри доверительного интервала, можно судить о мощности критерия. Если ноль близок к нижней или верхней границе интервала, то возможно при большей численности сравниваемых групп, различия достигли бы статистической значимости. Если ноль близок к середине интервала, то, значит, равновероятно и увеличение и уменьшение показателя в экспериментальной группе, и, вероятно, различий действительно нет.

Примеры:

Сравнить операционную летальность при применении двух разных видов анестезии: с применением первого вида анестезии оперировалось 61 человек, умерло 8, с применением второго – 67 человек, умерло 10.

d 1 = 8/61 = 0,131; d 2 = 10/67 = 0,149; d1-d2 = - 0,018.

Разность летальностей сравниваемых методов будет находиться в интервале (-0,018 - 0,122; -0,018 + 0,122) или (-0,14 ; 0,104) с вероятностью 100(1-a) = 95%. Интервал содержит ноль, т.е. гипотезу об одинаковой летальности при двух разных видах анестезии отвергнуть нельзя.

Таким образом, летальность может и уменьшится до 14% и увеличиться до 10,4% с вероятностью 95%, т.е. ноль находится примерно по середине интервала, поэтому можно утверждать, что, скорее всего, действительно не отличаются по летальности эти два метода.

В рассмотренном ранее примере сравнивалось среднее время нажатия при теппинг-тесте в четырёх группах студентов, отличающихся по экзаменационной оценке. Вычислим доверительные интервалы среднего времени нажатия для студентов, сдавших экзамен на 2 и на 5 и доверительный интервал для разности этих средних.

Коэффициенты Стьюдента находим по таблицам распределения Стьюдента (см. приложение): для первой группы: = t(0,05;48) = 2,011; для второй группы: = t(0,05;61) = 2,000. Таким образом, доверительные интервалы для первой группы: = (162,19-2,011*2,18 ; 162,19+2,011*2,18) = (157,8 ; 166,6) , для второй группы (156,55-2,000*1,88 ; 156,55+2,000*1,88) = (152,8 ; 160,3). Итак, для сдавших экзамен на 2, среднее время нажатия лежит в пределах от 157,8 мс до 166,6 мс с вероятностью 95%, для сдавших экзамен на 5 – от 152,8 мс до 160,3 мс с вероятностью 95%.

Проверять нулевую гипотезу можно и по доверительным интервалам для средних, а не только для разности средних. Например, как в нашем случае, если доверительные интервалы для средних перекрываются, то нулевую гипотезу отвергнуть нельзя. Для того чтобы отвергнуть гипотезу на выбранном уровне значимости, соответствующие доверительные интервалы не должны перекрываться.

Найдём доверительный интервал для разности среднего времени нажатия в группах сдавших экзамен на 2 и на 5. Разность средних: 162,19 – 156,55 = 5,64. Коэффициент Стьюдента: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Групповые средние квадратические отклонения будут равны: ; . Вычисляем среднюю ошибку разности средних: . Доверительный интервал: =(5,64-1,982*2,87 ; 5,64+1,982*2,87) = (-0,044 ; 11,33).

Итак, разница среднего времени нажатия в группах, сдавших экзамен на 2 и на 5, будет находиться в интервале от -0,044 мс до 11,33 мс. В этот интервал входит ноль, т.е. среднее время нажатия у отлично сдавших экзамен, может и увеличиться и уменьшится по сравнению с неудовлетворительно сдавшими, т.е. нулевую гипотезу отвергнуть нельзя. Но ноль находится очень близко к нижней границе, время нажатия гораздо вероятнее всё-таки уменьшается у отлично сдавших. Таким образом, можно сделать вывод, что различия в среднем времени нажатия между сдавшими на 2 и на 5 всё-таки есть, просто мы не смогли их обнаружить при данном изменении среднего времени, разбросе среднего времени и объёмах выборок.



Мощность критерия – это вероятность отвергнуть неверную нулевую гипотезу, т.е. найти различия там, где они действительно есть.

Мощность критерия определяется исходя из уровня значимости, величины различий между группами, разброса значений в группах и объёма выборок.

Для критерия Стьюдента и дисперсионного анализа можно воспользоваться диаграммами чувствительности.

Мощность критерия можно использовать при предварительном определении необходимой численности групп.

Доверительный интервал показывает, в каких пределах с заданной вероятностью находится истинное значение оцениваемого параметра.

С помощью доверительных интервалов можно проверять статистические гипотезы и делать выводы о чувствительности критериев.

ЛИТЕРАТУРА.

Гланц С. – Глава 6,7.

Реброва О.Ю. – с.112-114, с.171-173, с.234-238.

Сидоренко Е. В. – с.32-33.

Вопросы для самопроверки студентов.

1. Что такое мощность критерия?

2. В каких случаях необходимо оценить мощность критериев?

3. Способы расчёта мощности.

6. Как проверить статистическую гипотезу с помощью доверительного интервала?

7. Что можно сказать о мощности критерия при расчёте доверительного интервала?

Задачи.

Теоремы 1 и 2 хотя и являются общими, т. е. сформулированы при достаточно широких предположениях, они не дают возможности установить, насколько близки оценки к оцениваемым параметрам. Из факта, что -оценки являются состоятельными, следует только то, что при увеличении объема выборки значение P (|θ * – θ | < δ), δ < 0, приближается к 1.

Возникают следующие вопросы.

1) Каким должен быть объем выборки п, чтобы заданная точность
|θ * – θ | = δ была гарантирована с заранее принятой вероятностью?

2) Какова точность оценки, если объем выборки известен и вероятность безошибочности вывода задана?

3) Какова вероятность того, что при заданном объеме выборки будет обеспечена заданная точность оценки?

Введем несколько новых определений.

Определение. Вероятность γ выполнения неравенства, |θ *– θ | < δ называется доверительной вероятностью или надежностью оценки θ .

Перейдем от неравенства |θ *–θ | < δ к двойному неравенству. Известно, что . Поэтому доверительную вероятность можно записать в виде

Так как θ (оцениваемый параметр) – число постоянное, а θ * – величина случайная, понятие доверительной вероятности сформулировать так: доверительной вероятностью γ называется вероятность того, что интервал (θ *– δ, θ *+ δ) накрывает оцениваемый параметр.

Определение. Случайный интервал (θ *–δ , θ *+δ ), в пределах которого с вероятностью γ находится неизвестный оцениваемый параметр, называется доверительным интервалом İ , соответствующим коэффициенту доверия γ,

İ= (θ*– δ, θ*+ δ ). (3)

Надежность оценки γ может задаваться заранее, тогда, зная закон распределения изучаемой случайной величины, можно найти доверительный интервал İ . Решается и обратная задача, когда по заданному İ находится соответствующая надежность оценки.

Пусть, например, γ = 0,95; тогда число р = 1 – у = 0,05 показывает, с какой вероятностью заключение о надежности оценки ошибочно. Число р=1–γ называется уровнем значимости. Уровень значимости задается заранее в зависимости от конкретного случая. Обычно р принимают равным 0,05; 0,01; 0,001.

Выясним, как построить доверительный интервал для математического ожидания нормально распределенного признака. Было показано, что

Оценим математическое ожидание с помощью выборочной средней учитывая, что также имеет нормальное распределение*. Имеем

(4)

а по формуле (12.9.2) получаем

Принимая во внимание (13.5.12), получим

(5)

Пусть известна вероятность γ . Тогда

Для удобства пользования таблицей функции Лапласа положим тогда а

Интервал

(7)

накрывает параметр а = М (Х ) с вероятностью γ .

В большинстве случаев среднее квадратическое отклонение σ(Х) исследуемого признака неизвестно. Поэтому вместо σ (Х ) при большой выборке (n > 30) применяют исправленное выборочное среднее квадратическое отклонение s , являющееся, в свою очередь оценкой σ (X ), доверительный интервал будет иметь вид

İ =

Пример. С вероятностью γ = 0,95 найти доверительный интервал для М (Х ) – длины колоса ячменя сорта «Московский 121». Распределение задается таблицей, в которой" вместо интервалов изменения (х i , х i + 1) взяты числа , см. Считать, что случайная величина X подчинена нормальному распределению.

Решение. Выборка большая (n = 50). Имеем

Найдем точность оценки

Определим доверительные границы:

Таким образом, с надежностью γ = 0,95 математическое ожидание заключено в доверительном интервале I = (9,5; 10,3).

Итак, в случае большой выборки (n > 30), когда исправленное среднее квадратическое отклонение незначительно отклоняется от среднего квадратического отклонения значения признака в генеральной совокупности, можно найти доверительный интервал. Но делать большую выборку удается не всегда и это не всегда целесообразно. Из (7) видно, что чем меньше п, тем шире доверительный интервал, т. е. I зависит от объема выборки п.

Английский статистик Госсет (псевдоним Стьюдент) доказал, что в случае нормального распределения признака X в генеральной совокупности нормирования случайная величина

(8)

зависит только от объема выборки. Была найдена функция распределения случайной величины Т и вероятность P (T < t γ ), t γ – точность оценки. Функция, определяемая равенством

s (n , t γ ) = P (|T | < t γ ) = γ (9)

названа t-распределением Стьюдента с п – 1 степенями свободы. Формула (9) связывает случайную величину Т, доверительный интервал İ и доверительную вероятность γ . Зная две из них, можно найти третью. Учитывая (8), имеем

(10)

Неравенство в левой части (13.7.10) заменим равносильным ему неравенством . В результате получим

(11)

где t γ =t (γ ,n ). Для функции t γ составлены таблицы (см. Приложение 5). При n >30 числа t γ и t, найденные по таблице функции Лапласа, практически совпадают.

Доверительный интервал для оценки среднего квадратического отклонения σ x в случае нормального распределения.

Теорема. Пусть известно, что случайная величина имеет нормальное распределение. Тогда для оценки параметра σ х этого закона имеет место равенство

(12)

где γ – доверительная вероятность, зависящая от объема выборки п и точности оценки β .

Функция γ = Ψ (n , β ) хорошо изучена. С ее помощью определяют β = β (γ ,п ). Для β = β (γ ,п ) составлены таблицы, по которым по известным п (объему выборки) и γ (доверительной вероятности) определяется β .

Пример. Для оценки параметра нормально распределенной случайной величины была сделана выборка (дневной удой 50 коров) и вычислено s = 1,5. Найти доверительный интервал, накрывающий с вероятностью γ = 0,95.

Решение. По таблице β (γ , п) для n = 50 и γ = 0,95 находим β = 0,21 (см. Приложение 6).

В соответствии с неравенством (13) найдем границы доверительного интервала. Имеем

1,5 – 0,21·1,5 = 1,185; 1,5 + 0,21·1,5 = 1,185;