Вариационный ряд называется. Статистическое изучение вариационных рядов и расчет средних величин. Ряды распределения и группировки

Вариационный ряд - это статистический ряд, показывающий распределение изучаемого явления по величине какого-либо количественного признака. Например, больных по возрасту, по срокам лечения, новорожденных по весу и т.п.

Варианта - отдельные значения признака, по которому проводится группировка (обозначается V ) .

Частота- число, показывающее, как часто встречается та или иная варианта (обозначается P ) . Сумма всех частот показывает общее число наблюдений и обозначается n . Разность между наибольшей и наименьшей вариантой вариационного ряда называется размахом или амплитудой .

Различают вариационные ряды:

1. Прерывные (дискретные) и непрерывные.

Ряд считается непрерывным, если группировочный признак может выражаться дробными величинами (вес, рост т.п.), прерывным, если группировочный признак выражается только целым числом (дни нетрудоспособности, число ударов пульса и т.п.).

2.Простые и взвешенные.

Простой вариационный ряд представляет собой ряд, в котором количественное значение варьирующего признака встречается один раз. Во взвешенном вариационном ряду количественные значения варьирующего признака повторяются с определённой частотой.

3. Сгруппированные (интервальные) и несгруппированые.

Сгруппированный ряд имеет варианты, объединённые в группы, объединяющие их по величине в пределах определённого интервала. В несгруппированном ряду каждой отдельной варианте соответствует определённая частота.

4. Четные и нечетные.

В чётных вариационных рядах сумма частот или общее число наблюдений выражено чётным числом, в нечётных ― нечётным.

5. Симметричные и асимметричные.

В симметричном вариационном ряду все виды средних величин совпадают или очень близки (мода, медиана, среднее арифметическое).

В зависимости от характера изучаемых явлений, от конкретных задач и целей статистического исследования, а также от содержания исходного материала, в санитарной статистике применяются следующие виды средних величин:

структурные средние (мода, медиана);

средняя арифметическая;

средняя гармоническая;

средняя геометрическая;

средняя прогрессивная.

Мода (М о ) - величина варьирующего признака, которая более часто встречается в изучаемой совокупности т.е. варианта, соответствующая наибольшей частоте. Находят ее непосредственно по структуре вариационного ряда, не прибегая к каким-либо вычислениям. Она обычно является величиной очень близкой к средней арифметической и весьма удобна в практической деятельности.

Медиана (М е ) - делящая вариационный ряд (ранжированный, т.е. значения вариант располагаются в порядке возрастания или убывания) на две равные половины. Медиана вычисляется при помощи так называемого нечетного ряда, который получают путем последовательного суммирования частот. Если сумма частот соответствует четному числу, тогда за медиану условно принимают среднюю арифметическую из двух средних значений.

Мода и медиана применяются в случае незамкнутой совокупности, т.е. когда наибольшая или наименьшая варианты не имеют точной количественной характеристики (например, до 15 лет, 50 и старше и т.п.). В этом случае среднюю арифметическую (параметрические характеристики) рассчитать нельзя.

Средня я арифметическая - самая распространенная величина. Средняя арифметическая обозначается чаще через М .

Различают среднюю арифметическую простую и взвешенную.

Средняя арифметическая простая вычисляется:

― в тех случаях, когда совокупность представлена простым перечнем знаний признака у каждой единицы;

― если число повторений каждой варианты нет возможности определить;

― если числа повторений каждой варианты близки между собой.

Средняя арифметическая простая исчисляется по формуле:

где V - индивидуальные значения признака; n - число индивидуальных значений;
- знак суммирования.

Таким образом, простая средняя представляет собой отношение суммы вариант к числу наблюдений.

Пример: определить среднюю длительность пребывания на койке 10 больных пневмонией:

16 дней - 1 больной; 17–1; 18–1; 19–1; 20–1; 21–1; 22–1; 23–1; 26–1; 31–1.

койко-дня.

Средняя арифметическая взвешенная исчисляется в тех случаях, когда индивидуальные значения признака повторяются. Ее можно вычислять двояким способом:

1. Непосредственным (среднеарифметическим или прямым способом) по формуле:

,

где P - частота (число случаев) наблюдений каждой варианты.

Таким образом, средняя арифметическая взвешенная представляет собой отношение суммы произведений вариант на частоты к числу наблюдений.

2. С помощью вычисления отклонений от условной средней (по способу моментов).

Основой для вычисления взвешенной средней арифметической является:

― сгруппированный материал по вариантам количественного признака;

― все варианты должны располагаться в порядке возрастания или убывания величины признака (ранжированный ряд).

Для вычисления по способу моментов обязательным условием является одинаковый размер всех интервалов.

По способу моментов средняя арифметическая вычисляется по формуле:

,

где М о - условная средняя, за которую чаще принимают величину признака, соответствующую наибольшей частоте, т.е. которая чаще повторяется (Мода).

i - величина интервала.

a - условное отклонение от условий средней, представляющее собой последовательный ряд чисел (1, 2 и т.д.) со знаком + для вариант больших условной средней и со знаком–(–1, –2 и т.д.) для вариант, которые ниже условной средней. Условное же отклонение от варианты, принятой за условную среднюю равно 0.

P - частоты.

- общее число наблюдений или n.

Пример: определить средний рост мальчиков 8 лет непосредственным способом (таблица1).

Т а б л и ц а 1

Рост в см

мальчиков P

Центральная

варианта V

Центральная варианта ― середина интервала ― определяется как полу сумма начальных значений двух соседних групп:

;
и т.д.

Произведение VP получают путем умножения центральных вариант на частоты
;
и т.д. Затем полученные произведения складывают и получают
, которую делят на число наблюдений (100) и получают среднюю арифметическую взвешенную.

см.

Эту же задачу решим по способу моментов, для чего составляется следующая таблица 2:

Т а б л и ц а 2

Рост в см (V)

мальчиков P

n=100

В качестве М о принимаем 122, т.к. из 100 наблюдений у 33 человек рост был 122см. Находим условные отклонения (a) от условной средней в соответствии с вышесказанным. Затем получаем произведение условных отклонений на частоты (aP) и суммируем полученные величины (
). В итоге получится 17. Наконец, данные подставляем в формулу:

При изучении варьирующего признака нельзя ограничиваться только вычислением средних величин. Необходимо вычислять и показатели, характеризующие степень разнообразия изучаемых признаков. Величина того или иного количественного признака неодинакова у всех единиц статистической совокупности.

Характеристикой вариационного ряда является среднее квадратичное отклонение (), которое показывает разброс (рассеивание) изучаемых признаков относительно средней арифметической, т.е. характеризует колеблемость вариационного ряда. Оно может определяться непосредственным способом по формуле:

Среднее квадратичное отклонение равняется квадратному корню из суммы произведений квадратов отклонений каждой варианты от средней арифметической (V–M) 2 на свои частоты деленной на сумму частот (
).

Пример вычисления: определить среднее число больничных листов, выдаваемых в поликлинике за день (таблица 3).

Т а б л и ц а 3

Число больничных

листов, выданных

врачом за день (V)

Число врачей (Р)

;

В знаменателе при числе наблюдений менее 30 необходимо от
отнимать единицу.

Если ряд сгруппирован с равными интервалами, тогда можно определить среднее квадратичное отклонение по способу моментов:

,

где i - величина интервала;

- условное отклонение от условной средней;

P - частоты вариант соответствующих интервалов;

- общее число наблюдений.

Пример вычисления : Определить среднюю длительность пребывания больных на терапевтической койке (по способу моментов) (таблица 4):

Т а б л и ц а 4

Число дней

пребывания на койке (V)

больных (Р)

;

Бельгийский статистик А. Кетле обнаружил, что вариации массовых явлений подчиняются закону распределения ошибок, открытому почти одновременно К. Гауссом и П. Лапласом. Кривая, отображающая это распределение, имеет вид колокола. По нормальному закону распределения колеблемость индивидуальных значений признака находится в пределах
, что охватывает 99,73% всех единиц совокупности.

Подсчитано, что если к средней арифметической прибавить и отнять 2, то в пределах полученных величин находится 95,45% всех членов вариационного ряда и, наконец, если к средней арифметической прибавить и отнять 1, то в пределах полученных величин будут находиться 68,27% всех членов данного вариационного ряда. В медицине с величиной
1связано понятие нормы. Отклонение от средней арифметической больше, чем на 1, но меньше, чем на 2является субнормальным, а отклонение больше, чем на 2ненормальным (выше или ниже нормы).

В санитарной статистике правило трех сигм применяется при изучении физического развития, оценке деятельности учреждений здравоохранения, оценке здоровья населения. Это же правило широко применяется в народном хозяйстве при определении стандартов.

Таким образом, среднее квадратичное отклонение служит для:

― измерения дисперсии вариационного ряда;

― характеристики степени разнообразия признаков, которые определяются коэффициентом вариации:

Если коэффициент вариации более 20% - сильное разнообразие, от 20 до 10% - среднее, менее 10% - слабое разнообразие признаков. Коэффициент вариации в известной мере является критерием надежности средней арифметической.

Метод группировок позволяет также измерить вариацию (изменчивость, колеблемость) признаков. При относительно малом числе единиц совокупности вариация измеряется на основе ранжированного ряда единиц, образующих совокупность. Ряд называется ранжированным, если единицы расположены по возрастанию (убыванию) признака.

Однако ранжированные ряды довольно малопоказательны тогда, когда необходима сравнительная характеристика вариации. Кроме того, во многих случаях приходится иметь дело со статистическими совокупностями, состоящими из большого числа единиц, которые практически трудно представить в виде конкретного ряда. В связи с этим для первоначального общего ознакомления со статистическими данными и особенно для облегчения изучения вариации признаков исследуемые явления и процессы обычно объединяют в группы, а результаты группировки оформляют в виде групповых таблиц.

Если в групповой таблице имеется всего две графы - группы по выделенному признаку (варианты) и численности групп (частоты или частости), она называется рядом распределения.

Ряд распределения - простейшая разновидность структурной группировки по одному признаку, отображенная в групповой таблице с двумя графами, в которых содержатся варианты и частоты признака. Во многих случаях с такой структурной группировки, т.е. с составления рядов распределения, начинается изучение исходного статистического материала.

Структурная группировка в виде ряда распределения может быть превращена в подлинную структурную группировку, если выделенные группы будут охарактеризованы не только частотами, но и другими статистическими показателями. Главное предназначение рядов распределения - изучение вариации признаков. Теорию рядов распределения подробно разрабатывает математическая статистика.

Ряды распределения делят на атрибутивные (группировка по атрибутивным признакам, например деление населения по полу, национальности, семейному положению и т.д.) и вариационные (группировка по количественным признакам).

Вариационный ряд представляет собой групповую таблицу, которая содержит две графы: группировку единиц по одному количественному признаку и численность единиц в каждой группе. Интервалы в вариационном ряду образуются обычно равные и закрытые. Вариационным рядом является следующая группировка населения России по величине среднедушевых денежных доходов (табл. 3.10).

Таблица 3.10

Распределение численности населения России по величине среднедушевых доходов в 2004-2009 гг.

Группы населения по величине среднедушевых денежных доходов, руб./мес

Численность населения в группе, в % к итогу

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Свыше 25 000,0

Все население

Вариационные ряды в свою очередь подразделяются на дискретные и интервальные. Дискретные вариационные ряды объединяют варианты дискретных признаков, изменяющихся в узких пределах. Примером дискретного вариационного ряда может служить распределение российских семей по числу имеющихся детей.

Интервальные вариационные ряды объединяют варианты либо непрерывных признаков, либо изменяющихся в широких пределах дискретных признаков. Интервальным является вариационный ряд распределения населения России по величине среднедушевых денежных доходов.

Дискретные вариационные ряды на практике применяются не слишком часто. Между тем составление их несложно, поскольку состав групп определяется конкретными вариантами, которыми реально обладают изучаемые группировочные признаки.

Более широко распространены интервальные вариационные ряды. При их составлении возникает сложный вопрос о количестве групп, а также о величине интервалов, которые должны быть установлены.

Принципы решения этого вопроса изложены в главе о методологии построения статистических группировок (см. параграф 3.3).

Вариационные ряды представляют собой средство свертывания или сжатия многообразной информации в компактную форму, по ним можно составить достаточно ясное суждение о характере вариации, изучить различия признаков явлений, входящих в исследуемую совокупность. Но важнейшее значение вариационных рядов состоит в том, что на их основе исчисляются особые обобщающие характеристики вариации (см. главу 7).

Совокупность значений изученного в данном эксперименте или наблюдении параметра, проранжированных по величине (возрастания или убывания) называется вариационным рядом.

Предположим, что мы измерили артериальное давление у десяти пациентов с целью получить верхний порог АД: систолическое давление, т.е. только одно число.

Представим, что серия наблюдений (статистическая совокупность) артериального систолического давления в 10-ти наблюдениях имеет следующий вид (табл. 1):

Таблица 1

Составляющие вариационного ряда называются вариантами. Варианты представляют собой числовое значение изучаемого признака.

Построение из статистической совокупности наблюдений вариационного ряда - только первый шаг к осмыслению особенностей всей совокупности. Далее необходимо определить средний уровень изучаемого количественного признака (средний уровень белка крови, средний вес пациентов, среднее время наступления наркоза и т.д.)

Средний уровень измеряют с помощью критериев, которые носят название средних величин. Средняя величина - обобщающая числовая характеристика качественно однородных величин, характеризующая одним числом всю статистическую совокупность по одному признаку. Средняя величина выражает то общее, что характерно для признака в данной совокупности наблюдений.

Общеупотребительными являются три вида средних величин: мода (), медиана () и среднеарифметическая величина ().

Для определения любой средней величины необходимо использовать результаты индивидуальных наблюдений, записав их в виде вариационного ряда (табл. 2).

Мода - значение, наиболее часто встречающееся в серии наблюдений. В нашем примере мода = 120. Если в вариационном ряду нет повторяющихся значений, то говорят, что мода отсутствует. Если несколько значений повторяются одинаковое количество раз, то в качестве моды берут наименьшее из них.

Медиана - значение, делящее распределение на две равные части, центральное или срединное значение серии наблюдений, упорядоченных по возрастанию или убыванию. Так, если в вариационном ряду 5 значений, то его медиана равна третьему члену вариационного ряда, если в ряду четное количество членов, то медиана представляет собой среднее арифметическое двух его центральных наблюдений, т.е. если в ряду 10 наблюдений, то медиана равна среднему арифметическому 5 и 6 наблюдения. В нашем примере.

Заметим важную особенность моды и медианы: на их величины не оказывают влияние числовые значения крайних вариант.

Средняя арифметическая величина рассчитывается по формуле:

где - наблюденная величина в -том наблюдении, а - число наблюдений. Для нашего случая.

Средняя арифметическая величина обладает тремя свойствами:

Средняя занимает серединное положение в вариационном ряду. В строго симметричном ряду.

Средняя является обобщающей величиной и за средней не видны случайные колебания, различия в индивидуальных данных. Она отражает то типичное, что характерно для всей совокупности.

Сумма отклонений всех вариант от средней равна нулю: . Отклонение вариант от средней обозначается.

Вариационный ряд состоит из вариант и соответствующих им частот. Из десяти полученных значений цифра 120 встретилась 6 раз, 115 - 3 раза, 125 - 1 раз. Частота () - абсолютная численность отдельных вариант в совокупности, указывающая, сколько раз встречается данная варианта в вариационном ряду.

Вариационный ряд может быть простым (частоты = 1) или сгруппированным укороченным, по 3-5 вариант. Простой ряд используется при малом числе наблюдений (), сгруппированный - при большом числе наблюдений ().

​ Вариационный ряд – ряд, в котором сопоставлены (по степени возрастания или убывания) варианты и соответствующие им частоты

​Варианты – отдельные количественные выражения признака. Обозначаются латинской буквой V . Классическое понимание термина "варианта" предполагает, что вариантой называется каждое уникальное значение признака, без учета количества повторов.

Например, в вариационном ряду показателей систолического артериального давления, измеренного у десяти пациентов:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

вариантами являются только 6 значений:

110, 120, 130, 140, 160, 170.

​Частота – число, показывающее, сколько раз повторяется варианта. Обозначается латинской буквой P . Сумма всех частот (которая, разумеется, равна числу всех исследуемых) обозначается как n .

    В нашем примере частоты будут принимать следующие значения:
  • для варианты 110 частота Р = 1 (значение 110 встречается у одного пациента),
  • для варианты 120 частота Р = 2 (значение 120 встречается у двух пациентов),
  • для варианты 130 частота Р = 3 (значение 130 встречается у трех пациентов),
  • для варианты 140 частота Р = 2 (значение 140 встречается у двух пациентов),
  • для варианты 160 частота Р = 1 (значение 160 встречается у одного пациента),
  • для варианты 170 частота Р = 1 (значение 170 встречается у одного пациента),

Виды вариационных рядов:

  1. простой - это ряд, в котором каждая варианта встречается только по одному разу (все частоты при этом равны 1);
  2. взвешенный - ряд, в котором одна или несколько вариант встречаются неоднократно.

Вариационный ряд служит для описания больших массивов чисел, именно в этой форме изначально представляются собранные данные большинства медицинских исследований. Для того, чтобы охарактеризовать вариационный ряд, рассчитываются специальные показатели, в том числе средние величины, показатели вариабельности (так называемой, дисперсии), показатели репрезентативности выборочных данных.

Показатели вариационного ряда

1) Средняя арифметическая - это обобщающий показатель, характеризующий размер изучаемого признака. Средняя арифметическая обозначается как M , представляет собой самый распространенный вид средней. Средняя арифметическая рассчитывается как отношение суммы значений показателей всех единиц наблюдения к числу всех исследуемых. Методика расчета средней арифметической различается для простого и взвешенного вариационного ряда.

Формула для расчета простой средней арифметической:

Формула для расчета взвешенной средней арифметической:

M = Σ(V * P)/ n

​ 2) Мода – еще одна средняя величина вариационного ряда, соответствующая наиболее часто повторяющейся варианте. Или, если выразиться по другому, это варианта, которой соответствует наибольшая частота. Обозначается как Мо . Мода рассчитывается только для взвешенных рядов, так как в простых рядах ни одна из вариант не повторяется и все частоты равны единице.

Например, в вариационном ряду значений частоты сердечных сокращений:

80, 84, 84, 86, 86, 86, 90, 94;

значение моды составляет 86, так как данная варианта встречается 3 раза, следовательно ее частота - наибольшая.

3) Медиана – значение варианты, делящей вариационный ряд пополам: по обе стороны от нее находится равное число вариант. Медиана также, как и средняя арифметическая и мода, относится к средним величинам. Обозначается как Me

4) Среднее квадратическое отклонение (синонимы: стандартное отклонение, сигмальное отклонение, сигма) - мера вариабельности вариационного ряда. Является интегральным показателем, объединяющим все случаи отклонения вариант от средней. Фактически, отвечает на вопрос: насколько далеко и как часто варианты распространяются от средней арифметической. Обозначается греческой буквой σ ("сигма") .

При численности совокупности более 30 единиц, стандартное отклонение рассчитывается по следующей формуле:

Для малых совокупностей - 30 единиц наблюдения и менее - стандартное отклонение рассчитывается по другой формуле:

Вариационный ряд – это ряд числовых значений признака.

Основные характеристики вариационного ряда: v – варианта, р – частота ее встречаемости.

Виды вариационного ряда:

    по частоте встречаемости варианты: простой – варианта встречается один раз, взвешенный – варианта встречается два и более раз;

    по расположению варианты: ранжированный – варианты расположены в порядке убывания и возрастания, неранжированный – варианты записаны без определенного порядка;

    по объединению вариант в группы: сгруппированный – варианты объединены в группы, несгруппированный – варианты необъединены в группы;

    по величине варианты: непрерывный – варианты выражены целым и дробным числом, дискретный – варианты выражены целым числом, сложный – варианты представлены относительной или средней величиной.

Вариационный ряд составляется и оформляется с целью расчета средних величин.

Форма записи вариационного ряда:

8. Средние величины, виды, методика расчета, применение в здравоохранении

Средние величины – совокупная обобщающая характеристика количественных признаков. Применение средних величин :

1. Для характеристики организации работы лечебно-профилактических учреждений и оценки их деятельности:

а) в поликлинике: показатели нагрузки врачей, среднее число посещений, среднее число жителей на участке;

б) в стационаре: среднее число дней работы койки в году; средняя длительность пребывания в стационаре;

в) в центре гигиены, эпидемиологии и общественного здоровья: средняя площадь (или кубатура) на 1 человека, средние нормы питания (белки, жиры, углеводы, витамины, минеральные соли, калории), санитарные нормы и нормативы и т.д.;

2. Для характеристики физического развития (основных антропометрических признаков морфологических и функциональных);

3. Для определения медико-физиологических показателей организма в норме и патологии в клинических и экспериментальных исследованиях.

4. В специальных научных исследованиях.

Отличие средних величин от показателей:

1. Коэффициенты характеризуют альтернативный признак, встречающийся только у некоторой части статистического коллектива, который может иметь место или не иметь место.

Средние величины охватывают признаки, присущие всем членам коллектива, но в разной степени (вес, рост, дни лечения в больнице).

2. Коэффициенты применяются для измерения качественных признаков. Средние величины – для варьирующих количественных признаков.

Виды средних величин:

    средняя арифметическая, ее характеристики – среднее квадратическое отклонение и средняя ошибка

    мода и медиана. Мода (Мо) – соответствует величине признака, который чаще других встречается в данной совокупности. Медиана (Ме) – величина признака, занимающая срединное значение в данной совокупности. Она делит ряд на 2 равные части по числу наблюдений. Средняя арифметическая величина (М) – в отличие от моды и медианы опирается на все произведенные наблюдения, поэтому является важной характеристикой для всего распределения.

    другие виды средних величин, которые применяются в специальных исследованиях: средняя квадратическая, кубическая, гармоническая, геометрическая, прогрессивная.

Средняя арифметическая характеризует средний уровень статистической совокупности.

Для простого ряда, где

∑v – сумма вариант,

n – число наблюдений.

для взвешенного ряда, где

∑vр – сумма произведений каждой варианты на частоту ее встречаемости

n – число наблюдений.

Среднее квадратическое отклонение средней арифметической или сигма (σ) характеризует разнообразие признака

- для простого ряда

Σd 2 – сумма квадратов разности средней арифметической и каждой варианты (d = │M-V│)

n – число наблюдений

- для взвешенная ряда

∑d 2 p – сумма произведений квадратов разности средней арифметической и каждой варианты на частоту ее встречаемости,

n – число наблюдений.

О степени разнообразия можно судить по величине коэффициента вариации
. Более 20% - сильное разнообразие, 10-20% - среднее разнообразие, менее 10% - слабое разнообразие.

Если к средней арифметической величине прибавить и отнять от нее одну сигму (М ± 1σ), то при нормальном распределении в этих пределах будет находиться не менее 68,3% всех вариант (наблюдений), что считается нормой для изучаемого явления. Если к 2 ± 2σ, то в этих пределах будет находиться 95,5% всех наблюдений, а если к М ± 3σ, то в этих пределах будет находиться 99,7% всех наблюдений. Таким образом, среднее квадратическое отклонение является стандартным отклонением, позволяющим предвидеть вероятность появления такого значения изучаемого признака, которое находится в пределах заданных границ.

Средняя ошибка средней арифметической или ошибка репрезентативности. Для простого, взвешенного рядов и по правилу моментов:

.

Для расчета средних величин необходимо: однородность материала, достаточное число наблюдений. Если число наблюдений меньше 30, в формулах расчета σ и m используют n-1.

При оценке полученного результата по размеру средней ошибки пользуются доверительным коэффициентом, которые дает возможность определить вероятность правильного ответа, то есть он указывает на то, что полученная величина ошибки выборки будет не больше действительной ошибки, допущенной вследствие сплошного наблюдения. Следовательно, с увеличением доверительной вероятности увеличивается ширина доверительного интервала, что, в свою очередь повышает доверительность суждения, опорность полученного результата.