Найти е среднее. Как рассчитать среднюю величину. Особенности работы с негативными числами

В статистике используют различные виды средних величин, которые делятся на два больших класса:

Степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадра-тическая, средняя кубическая);

Структурные средние (мода, медиана).

Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения, поэтому их называют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней величины – средняя арифметическая. Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Вычисление данной величины сводится к суммированию всех значений варьирующего признака и делению полученной суммы на общее количество единиц совокупности. Например, пять рабочих выполняли заказ на изготовление деталей, при этом первый изготовил 5 деталей, второй – 7, третий – 4, четвертый – 10, пятый– 12. Поскольку в исходных данных значение каждого варианта встречалось только один раз, для опреде-

ления средней выработки одного рабочего следует применить формулу простой средней арифметической:

т. е. в нашем примере средняя выработка одного рабочего равна

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную. Например, рассчитаем средний возраст студентов в группе из 20 человек, возраст которых варьируется от 18 до 22 лет, где xi – варианты осредняемого признака, fi – частота, которая показывает, сколько раз встречается i-е значение в совокупности (табл. 5.1).

Таблица 5.1

Средний возраст студентов

Применяя формулу средней арифметической взвешенной, получаем:


Для выбора средней арифметической взвешенной существует определенное правило: если имеется ряд данных по двум показателям, для одного из которых надо вычислить

среднюю величину, и при этом известны численные значения знаменателя ее логической формулы, а значения числителя неизвестны, но могут быть найдены как произведение этих показателей, то средняя величина должна высчитывать-ся по формуле средней арифметической взвешенной.

В некоторых случаях характер исходных статистических данных таков, что расчет средней арифметической теряет смысл и единственным обобщающим показателем может служить только другой вид средней величины – средняя гармоническая. В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность при расчете обобщающих статистических показателей в связи с повсеместным внедрением электронно-вычислительной техники. Большое практическое значение приобрела средняя гармоническая величина, которая тоже бывает простой и взвешенной. Если известны численные значения числителя логической формулы, а значения знаменателя неизвестны, но могут быть найдены как частное деление одного показателя на другой, то средняя величина вычисляется по формуле средней гармонической взвешенной.

Например, пусть известно, что автомобиль прошел первые 210 км со скоростью 70 км/ч, а оставшиеся 150 км со скоростью 75 км/ч. Определить среднюю скорость автомобиля на протяжении всего пути в 360 км, используя формулу средней арифметической, нельзя. Так как вариантами являются скорости на отдельных участках xj = 70 км/ч и Х2 = 75 км/ч, а весами (fi) считаются соответствующие отрезки пути, то произведения вариантов на веса не будут иметь ни физического, ни экономического смысла. В данном случае смысл приобретают частные от деления отрезков пути на соответствующие скорости (варианты xi), т. е. затраты времени на прохождение отдельных участков пути (fi/ xi). Если отрезки пути обозначить через fi, то весь путь выразиться как?fi, а время, затраченное на весь путь, – как? fi/ xi , Тогда средняя скорость может быть найдена как частное от деления всего пути на общие затраты времени:

В нашем примере получим:

Если при использовании средней гармонической веса всех вариантов (f) равны, то вместо взвешенной можно использовать простую (невзвешенную) среднюю гармоническую:

где xi – отдельные варианты; n – число вариантов осредняемого признака. В примере со скоростью простую среднюю гармоническую можно было бы применить, если бы были равны отрезки пути, пройденные с разной скоростью.

Любая средняя величина должна вычисляться так, чтобы при замене ею каждого варианта осредняемого признака не изменялась величина некоторого итогового, обобщающего показателя, который связан с осредняемым показателем. Так, при замене фактических скоростей на отдельных отрезках пути их средней величиной (средней скоростью) не должно измениться общее расстояние.

Форма (формула) средней величины определяется характером (механизмом) взаимосвязи этого итогового показателя с осредняемым, поэтому итоговый показатель, величина которого не должна изменяться при замене вариантов их средней величиной, называется определяющим показателем. Для вывода формулы средней нужно составить и решить уравнение, используя взаимосвязь осредняемого показателя с определяющим. Это уравнение строится путем замены вариантов осредняемого признака (показателя) их средней величиной.

Кроме средней арифметической и средней гармонической в статистике используются и другие виды (формы) средней величины. Все они являются частными случаями степенной средней. Если рассчитывать все виды степенных средних величин для одних и тех же данных, то значения

их окажутся одинаковыми, здесь действует правило мажо-рантности средних. С увеличением показателя степени средних увеличивается и сама средняя величина. Наиболее часто применяемые в практических исследованиях формулы вычисления различных видов степенных средних величин представлены в табл. 5.2.

Таблица 5.2

Виды степенных средних


Средняя геометрическая применяется, когда имеется n коэффициентов роста, при этом индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста. Средняя геометрическая простая рассчитывается по формуле

Формула средней геометрической взвешенной имеет следующий вид:

Приведенные формулы идентичны, но одна применяется при текущих коэффициентах или темпах роста, а вторая – при абсолютных значениях уровней ряда.

Средняя квадратическая применяется при расчете с величинами квадратных функций, используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения и вычисляется по формуле

Средняя квадратическая взвешенная рассчитывается по другой формуле:

Средняя кубическая применяется при расчете с величинами кубических функций и вычисляется по формуле

средняя кубическая взвешенная:

Все рассмотренные выше средние величины могут быть представлены в виде общей формулы:

где – средняя величина; – индивидуальное значение; n – число единиц изучаемой совокупности; k – показатель степени, определяющий вид средней.

При использовании одних и тех же исходных данных, чем больше k в общей формуле степенной средней, тем больше средняя величина. Из этого следует, что между величинами степенных средних существует закономерное соотношение:

Средние величины, описанные выше, дают обобщенное представление об изучаемой совокупности и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспорно. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов, поэтому кроме рассмотренных средних в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употребительными являются структурные, или описательные, средние – мода (Мо) и медиана (Ме).

Мода – величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой-либо товар. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле

где х0 – нижняя граница интервала; h – величина интервала; fm – частота интервала; fm_ 1 – частота предшествующего интервала; fm+ 1 – частота следующего интервала.

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой – больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ряда решается просто. Если всем единицам ряда придать порядковые номера, то порядковый номер медианного варианта определяется как (п +1) / 2 с нечетным числом членов п. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих порядковые номера n / 2 и n / 2 + 1.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле

где X0 – нижняя граница интервала; h – величина интервала; fm – частота интервала; f – число членов ряда;

M-1 – сумма накопленных членов ряда, предшествующих данному.

Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на 4 равные части, а децили – на 10 равных частей. Квартилей насчитывается три, а децилей – девять.

Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака. Эти, не очень характерные для совокупности значения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.

Для того чтобы найти среднее значение в Excel (при том неважно числовое, текстовое, процентное или другое значение) существует много функций. И каждая из них обладает своими особенностями и преимуществами. Ведь в данной задаче могут быть поставлены определенные условия.

Например, средние значения ряда чисел в Excel считают с помощью статистических функций. Можно также вручную ввести собственную формулу. Рассмотрим различные варианты.

Как найти среднее арифметическое чисел?

Чтобы найти среднее арифметическое, необходимо сложить все числа в наборе и разделить сумму на количество. Например, оценки школьника по информатике: 3, 4, 3, 5, 5. Что выходит за четверть: 4. Мы нашли среднее арифметическое по формуле: =(3+4+3+5+5)/5.

Как это быстро сделать с помощью функций Excel? Возьмем для примера ряд случайных чисел в строке:

Или: сделаем активной ячейку и просто вручную впишем формулу: =СРЗНАЧ(A1:A8).

Теперь посмотрим, что еще умеет функция СРЗНАЧ.


Найдем среднее арифметическое двух первых и трех последних чисел. Формула: =СРЗНАЧ(A1:B1;F1:H1). Результат:



Среднее значение по условию

Условием для нахождения среднего арифметического может быть числовой критерий или текстовый. Будем использовать функцию: =СРЗНАЧЕСЛИ().

Найти среднее арифметическое чисел, которые больше или равны 10.

Функция: =СРЗНАЧЕСЛИ(A1:A8;">=10")


Результат использования функции СРЗНАЧЕСЛИ по условию ">=10":

Третий аргумент – «Диапазон усреднения» - опущен. Во-первых, он не обязателен. Во-вторых, анализируемый программой диапазон содержит ТОЛЬКО числовые значения. В ячейках, указанных в первом аргументе, и будет производиться поиск по прописанному во втором аргументе условию.

Внимание! Критерий поиска можно указать в ячейке. А в формуле сделать на нее ссылку.

Найдем среднее значение чисел по текстовому критерию. Например, средние продажи товара «столы».

Функция будет выглядеть так: =СРЗНАЧЕСЛИ($A$2:$A$12;A7;$B$2:$B$12). Диапазон – столбец с наименованиями товаров. Критерий поиска – ссылка на ячейку со словом «столы» (можно вместо ссылки A7 вставить само слово "столы"). Диапазон усреднения – те ячейки, из которых будут браться данные для расчета среднего значения.

В результате вычисления функции получаем следующее значение:

Внимание! Для текстового критерия (условия) диапазон усреднения указывать обязательно.

Как посчитать средневзвешенную цену в Excel?

Как мы узнали средневзвешенную цену?

Формула: =СУММПРОИЗВ(C2:C12;B2:B12)/СУММ(C2:C12).


С помощью формулы СУММПРОИЗВ мы узнаем общую выручку после реализации всего количества товара. А функция СУММ - сумирует количесвто товара. Поделив общую выручку от реализации товара на общее количество единиц товара, мы нашли средневзвешенную цену. Этот показатель учитывает «вес» каждой цены. Ее долю в общей массе значений.

Среднее квадратическое отклонение: формула в Excel

Различают среднеквадратическое отклонение по генеральной совокупности и по выборке. В первом случае это корень из генеральной дисперсии. Во втором – из выборочной дисперсии.

Для расчета этого статистического показателя составляется формула дисперсии. Из нее извлекается корень. Но в Excel существует готовая функция для нахождения среднеквадратического отклонения.


Среднеквадратическое отклонение имеет привязку к масштабу исходных данных. Для образного представления о вариации анализируемого диапазона этого недостаточно. Чтобы получить относительный уровень разброса данных, рассчитывается коэффициент вариации:

среднеквадратическое отклонение / среднее арифметическое значение

Формула в Excel выглядит следующим образом:

СТАНДОТКЛОНП (диапазон значений) / СРЗНАЧ (диапазон значений).

Коэффициент вариации считается в процентах. Поэтому в ячейке устанавливаем процентный формат.

По дисциплине: Статистика

Вариант № 2

Средние величины, применяемые в статистике

Введение………………………………………………………………………….3

Теоретическое задание

Средняя величина в статистике, ее сущность и условия применения.

1.1. Сущность средней величины и условия применения………….4

1.2. Виды средних величин……………………………………………8

Практическое задание

Задача 1,2,3………………………………………………………………………14

Заключение……………………………………………………………………….21

Список используемой литературы……………………………………………...23

Введение

Данная контрольная работа состоит из двух частей – теоретической и практической. В теоретической части будет подробно рассмотрена такая важная статистическая категория как средняя величина с целью выявления её сущности и условий применения, а также выделения видов средних и способов их расчёта.

Статистика, как известно, изучает массовые социально-экономические явления. Каждое из этих явлений может иметь различное количественное выражение одного и того же признака. Например, заработная плата одной и той же профессии рабочих или цены на рынке на один и тот же товар и т.д. Средние величины характеризуют качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др.

Для изучения какой-либо совокупности по варьирующим (количественно изменяющимся) признакам статистика использует средние величины.

Сущность средней величины

Средняя величина - это обобщающая количественная характеристика совокупности однотипных явлений по одному варьирующему признаку. В экономической практике используется широкий круг показателей, вычисленных в виде средних величин.

Важнейшее свойство средней величины заключается в том, что она представляет значение определенного признака во всей совокупности одним числом, несмотря на количественные различия его у отдельных единиц совокупности, и выражает то общее, что присуще всем единицам изучаемой совокупности. Таким образом, через характеристику единицы совокупности она характеризует всю совокупность в целом.

Средние величины связаны с законом больших чисел. Суть этой связи заключается в том, что при осреднении случайные отклонения индивидуальных величин в силу действия закона больших чисел взаимопогашаются и в средней выявляется основная тенденция развития, необходимость, закономерность. Средние величины позволяют сравнивать показатели, относящиеся к совокупностям с различной численностью единиц.

В современных условиях развития рыночных отношений в экономике средние служат инструментом изучения объективных закономерностей социально-экономических явлений. Однако в экономическом анализе нельзя ограничиваться лишь средними показателями, так как за общими благоприятными средними могут скрываться и крупные серьезные недостатки в деятельности отдельных хозяйствующих субъектов, и ростки нового, прогрессивного. Например, распределение населения по доходу позволяет выявлять формирование новых социальных групп. Поэтому наряду со средними статистическими данными необходимо учитывать особенности отдельных единиц совокупности.

Средняя величина являются равнодействующей всех факторов, оказывающих влияние на изучаемое явление. То есть, при расчете средних величин взаимопогашаются влияние случайных (пертурбационных, индивидуальных) факторов и, таким образом, возможно определение закономерности, присущей исследуемому явлению. Адольф Кетле подчеркивал, что значение метода средних величин состоит в возможности перехода от единичного к общему, от случайного к закономерному, и существование средних величин является категорией объективной действительности.

Статистика изучает массовые явления и процессы. Каждое из таких явлений обладает как общими для всей совокупности, так и особенными, индивидуальными свойствами. Различие между индивидуальными явлениями называют вариацией. Другое свойство массовых явлений - присущая им близость характеристик отдельных явлений. Итак, взаимодействие элементов совокупности приводит к ограничению вариации хотя бы части их свойств. Эта тенденция существует объективно. Именно в её объективности заключается причина широчайшего применения средних величин на практике и в теории.

Средней величиной в статистике называется обобщающий показатель, характеризующий типичный уровень явления в конкретных условиях места и времени, отражающий величину варьирующего признака в расчёте на единицу качественно однородной совокупности.

В экономической практике используется широкий круг показателей, вычисленный в виде средних величин.

С помощью метода средних величин статистика решает много задач.

Главное значение средних состоит в их обобщающей функции, то есть замене множества различных индивидуальных значений признака средней величиной, характеризующей всю совокупность явлений.

Если средняя величина обобщает качественно однородные значения признака, то она является типической характеристикой признака в данной совокупности.

Однако неправильно сводить роль средних величин только к характеристике типичных значений признаков в однородных по данному признаку совокупностях. На практике значительно чаще современная статистика использует средние величины, обобщающие явно однородные явления.

Средняя величина национального дохода на душу населения, средняя урожайность зерновых культур по всей стране, среднее потребление разных продуктов питания – это характеристики государства как единой народнохозяйственной системы, это так называемые системные средние.

Системные средние могут характеризовать как пространственные или объектные системы, существующие одномоментно (государство, отрасль, регион, планета Земля и т.д.), так и динамические системы, протяжённые во времени (год, десятилетие, сезон и т.д.).

Важнейшее свойство средней величины заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности. Значения признака отдельных единиц совокупности колеблются в ту или иную сторону под влиянием множества факторов, среди которых могут быть как основные, так и случайные. Например, курс акций корпорации в целом определяется ее финансовым положением. В то же время, в отдельные дни и на отдельных биржах эти акции в силу сложившихся обстоятельств могут продаваться по более высокому или заниженному курсу. Сущность средней в том и заключается, что в ней взаимопогашаются отклонения значений признака отдельных единиц совокупности, обусловленные действием случайных факторов, и учитываются изменения, вызванные действием факторов основных. Это позволяет средней отражать типичный уровень признака и абстрагироваться от индивидуальных особенностей, присущих отдельным единицам.

Вычисление среднего - один из распространённых приёмов обобщения; средний показатель отражает то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости.

Средняя – это сводная характеристика закономерностей процесса в тех условиях, в которых он протекает.

Каждая средняя характеризует изучаемую совокупность по какому-либо одному признаку, но для характеристики любой совокупности, описания её типических черт и качественных особенностей нужна система средних показателей. Поэтому в практике отечественной статистики для изучения социально-экономических явлений, как правило, исчисляется система средних показателей. Так, например, показатель средней заработной платы оцениваются совместно с показателями средней выработки, фондовооружённости и энерговооружённости труда, степенью механизации и автоматизации работ и др.

Средняя должна вычисляться с учётом экономического содержания исследуемого показателя. Поэтому для конкретного показателя, используемого в социально экономическом анализе, можно исчислить только одно истинное значение средней на базе научного способа расчёта.

Средняя величина это один из важнейших обобщающих статистических показателей, характеризующий совокупность однотипных явлений по какому-либо количественно варьирующему признаку. Средние в статистике это обобщающие показатели, числа, выражающие типичные характерные размеры общественных явлений по одному количественно варьирующему признаку.

Виды средних величин

Виды средних величин различаются прежде всего тем, какое свойство, какой параметр исходной варьирующей массы индивидуальных значений признака должен быть сохранен неизменным.

Средняя арифметическая

Средней арифметической величиной называется такое среднее значение признака, при вычислении которого общий объём признака в совокупности остаётся неизменным. Иначе можно сказать, что средняя арифметическая величина – среднее слагаемое. При её вычислении общий объём признака мысленно распределяется поровну между всеми единицами совокупности.

Средняя арифметическая применяется, если известны значения осредняемого признака (х) и количество единиц совокупности с определённым значением признака (f).

Средняя арифметическая бывает простой и взвешенной.

Средняя арифметическая простая

Простая используется, если каждое значение признака х встречается один раз, т.е. для каждого х значение признака f=1, или если исходные данные не упорядочены и неизвестно, сколько единиц имеют определённые значения признака.

Формула средней арифметической простой имеет вид.

,

Тема 5. Средние величины как статистические показатели

Понятие средней величины. Область применения средних величин в статистическом исследовании

Средние величины используются на этапе обработки и обобщения полученных первичных статистических данных. Потребность определения средних величин связана с тем, что у различных единиц исследуемых совокупностей индивидуальные значения одного и того же признака, как правило, неодинаковы.

Средней величиной называют показатель, который характеризует обобщенное значение признака или группы признаков в исследуемой совокупности.

Если исследуется совокупность с качественно однородными признаками, то средняя величина выступает здесь как типическая средняя . Например, для групп работников определенной отрасли с фиксированным уровнем дохода определяется типическая средняя расходов на предметы первой необходимости, т.е. типическая средняя обобщает качественно однородные значения признака в данной совокупности, каковым является доля расходов у работников данной группы на товары первой необходимости.

При исследовании совокупности с качественно разнородными признаками на первый план может выступить нетипичность средних показателей. Такими, к примеру, являются средние показатели произведенного национального дохода на душу населения (разные возрастные группы), средние показатели урожайности зерновых культур по всей территории России (районы разных климатических зон и разных зерновых культур), средние показатели рождаемости населения по всем регионам страны, средние температуры за определенный период и т.д. Здесь средние величины обобщают качественно разнородные значения признаков или системных пространственных совокупностей (международное сообщество, континент, государство, регион, район и т.д.) или динамических совокупностей, протяженных во времени (век, десятилетие, год, сезон и т.д.). Такие средние величины называют системными средними .

Таким образом, значение средних величин состоит в их обобщающей функции. Средняя величина заменяет большое число индивидуальных значений признака, обнаруживая общие свойства, присущие всем единицам совокупности. Это, в свою очередь, позволяет избежать случайных причин и выявить общие закономерности, обусловленные общими причинами.

Виды средних величин и методы их расчета

На этапе статистической обработки могут быть поставлены самые различные задачи исследования, для решения которых нужно выбрать соответствующую среднюю. При этом необходимо руководствоваться следующим правилом: величины, которые представляют собой числитель и знаменатель средней, должны быть логически связаны между собой.

    степенные средние ;

    структурные средние .

Введем следующие условные обозначения:

Величины, для которых исчисляется средняя;

Средняя, где черта сверху свидетельствует о том, что имеет место осреднение индивидуальных значений;

Частота (повторяемость индивидуальных значений признака).

Различные средние выводятся из общей формулы степенной средней:

(5.1)

при k = 1 - средняя арифметическая; k = -1 - средняя гармоническая; k = 0 - средняя геометрическая; k = -2 - средняя квадратическая.

Средние величины бывают простые и взвешенные. Взвешенными средними называют величины, которые учитывают, что некоторые варианты значений признака могут иметь различную численность, в связи с чем каждый вариант приходится умножать на эту численность. Иными словами, «весами» выступают числа единиц совокупности в разных группах, т.е. каждый вариант «взвешивают» по своей частоте. Частоту f называют статистическим весом или весом средней .

Средняя арифметическая - самый распространенный вид средней. Она используется, когда расчет осуществляется по несгруппированным статистическим данным, где нужно получить среднее слагаемое. Средняя арифметическая - это такое среднее значение признака, при получении которого сохраняется неизменным общий объем признака в совокупности.

Формула средней арифметической (простой ) имеет вид

где n - численность совокупности.

Например, средняя заработная плата работников предприятия вычисляется как средняя арифметическая:


Определяющими показателями здесь являются заработная плата каждого работника и число работников предприятия. При вычислении средней общая сумма заработной платы осталась прежней, но распределенной как бы между всеми работниками поровну. К примеру, необходимо вычислить среднюю заработную плату работников небольшой фирмы, где заняты 8 человек:

При расчете средних величин отдельные значения признака, который осредняется, могут повторяться, поэтому расчет средней величины производится по сгруппированным данным. В этом случае речь идет об использовании средней арифметической взвешенной , которая имеет вид

(5.3)

Так, нам необходимо рассчитать средний курс акций какого-то акционерного общества на торгах фондовой биржи. Известно, что сделки осуществлялись в течение 5 дней (5 сделок), количество проданных акций по курсу продаж распределилось следующим образом:

    1 - 800 ак. - 1010 руб.

    2 - 650 ак. - 990 руб.

    3 - 700 ак. - 1015 руб.

    4 - 550 ак. - 900 руб.

    5 - 850 ак. - 1150 руб.

Исходным соотношением для определения среднего курса стоимости акций является отношение общей суммы сделок (ОСС) к количеству проданных акций (КПА):

ОСС = 1010 ·800+990·650+1015·700+900·550+1150·850= 3 634 500;

КПА = 800+650+700+550+850=3550.

В этом случае средний курс стоимости акций был равен

Необходимо знать свойства арифметической средней, что очень важно как для ее использования, так и при ее расчете. Можно выделить три основных свойства, которые наиболее всего обусловили широкое применение арифметической средней в статистико-экономических расчетах.

Свойство первое (нулевое ): сумма положительных отклонений индивидуальных значений признака от его среднего значения равна сумме отрицательных отклонений. Это очень важное свойство, поскольку оно показывает, что любые отклонения (как с +, так и с -), вызванные случайными причинами, взаимно будут погашены.

Доказательство:

Свойство второе (минимальное ): сумма квадратов отклонений индивидуальных значений признака от средней арифметической меньше, чем от любого другого числа (а), т.е. есть число минимальное.

Доказательство.

Составим сумму квадратов отклонений от переменной а:

(5.4)

Чтобы найти экстремум этой функции, необходимо ее производную по а приравнять нулю:

Отсюда получаем:

(5.5)

Следовательно, экстремум суммы квадратов отклонений достигается при . Этот экстремум - минимум, так как функция не может иметь максимума.

Свойство третье : средняя арифметическая постоянной величины равна этой постоянной: при а = const.

Кроме этих трех важнейших свойств средней арифметической существуют так называемые расчетные свойства , которые постепенно теряют свою значимость в связи с использованием электронно-вычислительной техники:

    если индивидуальное значение признака каждой единицы умножить или разделить на постоянное число, то средняя арифметическая увеличится или уменьшится во столько же раз;

    средняя арифметическая не изменится, если вес (частоту) каждого значения признака разделить на постоянное число;

    если индивидуальные значения признака каждой единицы уменьшить или увеличить на одну и ту же величину, то средняя арифметическая уменьшится или увеличится на ту же самую величину.

Средняя гармоническая . Эту среднюю называют обратной средней арифметической, поскольку эта величина используется при k = -1.

Простая средняя гармоническая используется тогда, когда веса значений признака одинаковы. Ее формулу можно вывести из базовой формулы, подставив k = -1:

К примеру, нам нужно вычислить среднюю скорость двух автомашин, прошедших один и тот же путь, но с разной скоростью: первая - со скоростью 100 км/ч, вторая - 90 км/ч. Применяя метод средней гармонической, мы вычисляем среднюю скорость:

В статистической практике чаще используется гармоническая взвешенная, формула которой имеет вид

Данная формула используется в тех случаях, когда веса (или объемы явлений) по каждому признаку не равны. В исходном соотношении для расчета средней известен числитель, но неизвестен знаменатель.

5.1. Понятие средней величины

Средняя величина – это обобщающий показатель, характеризующий типический уровень явления. Он выражает величину признака, отнесенную к единице совокупности.

Средняя всегда обобщает количественную вариацию признака, т.е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами. В отличие от средней абсолютная величина, характеризующая уровень признака отдельной единицы совокупности, не позволяет сравнивать значения признака у единиц, относящихся к разным совокупностям. Так, если нужно сопоставить уровни оплаты труда работников на двух предприятиях, то нельзя сравнивать по данному признаку двух работников разных предприятий. Оплата труда выбранных для сравнения работников может быть не типичной для этих предприятий. Если же сравнивать размеры фондов оплаты труда на рассматриваемых предприятиях, то не учитывается численность работающих и, следовательно, нельзя определить, где уровень оплаты труда выше. В конечном итоге сравнить можно лишь средние показатели, т.е. сколько в среднем получает один работник на каждом предприятии. Таким образом, возникает необходимость расчета средней величины как обобщающей характеристики совокупности.

Вычисление среднего – один из распространенных приемов обобщения; средний показатель отрицает то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае. В способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей.

Для того, чтобы средний показатель был действительно типизирующим, он должен рассчитываться с учетом определенных принципов.

Остановимся на некоторых общих принципах применения средних величин.
1. Средняя должна определяться для совокупностей, состоящих из качественно однородных единиц.
2. Средняя должна исчисляться для совокупности, состоящей из достаточно большого числа единиц.
3. Средняя должна рассчитываться для совокупности, единицы которой находятся в нормальном, естественном состоянии.
4. Средняя должна вычисляться с учетом экономического содержания исследуемого показателя.

5.2. Виды средних и способы их вычисления

Рассмотрим теперь виды средних величин, особенности их исчисления и области применения. Средние величины делятся на два больших класса: степенные средние, структурные средние.

К степенным средним относятся такие наиболее известные и часто применяемые виды, как средняя геометрическая, средняя арифметическая и средняя квадратическая.

В качестве структурных средних рассматриваются мода и медиана.

Остановимся на степенных средних. Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными. Простая средняя считается по не сгруппированным данным и имеет следующий общий вид:

где X i – варианта (значение) осредняемого признака;

n – число вариант.

Взвешенная средняя считается по сгруппированным данным и имеет общий вид

,

где X i – варианта (значение) осредняемого признака или серединное значение интервала, в котором измеряется варианта;
m – показатель степени средней;
f i – частота, показывающая, сколько раз встречается i-e значение осредняемого признака.

Приведем в качестве примера расчет среднего возраста студентов в группе из 20 человек:


Средний возраст рассчитаем по формуле простой средней:

Сгруппируем исходные данные. Получим следующий ряд распределения:

В результате группировки получаем новый показатель – частоту, указывающую число студентов в возрасте Х лет. Следовательно, средний возраст студентов группы будет рассчитываться по формуле взвешенной средней:

Общие формулы расчета степенных средних имеют показатель степени (m). В зависимости от того, какое значение он принимает, различают следующие виды степенных средних:
средняя гармоническая, если m = -1;
средняя геометрическая, если m –> 0;
средняя арифметическая, если m = 1;
средняя квадратическая, если m = 2;
средняя кубическая, если m = 3.

Формулы степенных средних приведены в табл. 4.4.

Если рассчитать все виды средних для одних и тех же исходных данных, то значения их окажутся неодинаковыми. Здесь действует правило мажорантности средних: с увеличением показателя степени m увеличивается и соответствующая средняя величина:

В статистической практике чаще, чем остальные виды средних взвешенных, используются средние арифметические и средние гармонические взвешенные.

Таблица 5.1

Виды степенных средних

Вид степенной
средней
Показатель
степени (m)
Формула расчета
Простая Взвешенная
Гармоническая -1
Геометрическая 0
Арифметическая 1
Квадратическая 2
Кубическая 3

Средняя гармоническая имеет более сложную конструкцию, чем средняя арифметическая. Среднюю гармоническую применяют для расчетов тогда, когда в качестве весов используются не единицы совокупности – носители признака, а произведения этих единиц на значения признака (т.е. m = Xf). К средней гармонической простой следует прибегать в случаях определения, например, средних затрат труда, времени, материалов на единицу продукции, на одну деталь по двум (трем, четырем и т.д.) предприятиям, рабочим, занятым изготовлением одного и того же вида продукции, одной и той же детали, изделия.

Главное требование к формуле расчета среднего значения заключается в том, чтобы все этапы расчета имели реальное содержательное обоснование; полученное среднее значение должно заменить индивидуальные значения признака у каждого объекта без нарушения связи индивидуальных и сводных показателей. Иначе говоря, средняя величина должна исчисляться так, чтобы при замене каждого индивидуального значения осредняемого показателя его средней величиной оставался без изменения некоторый итоговый сводный показатель, связанный тем или другим образом с осредняемым . Этот итоговый показатель называется определяющим, поскольку характер его взаимосвязи с индивидуальными значениями определяет конкретную формулу расчета средней величины. Покажем это правило на примере средней геометрической.

Формула средней геометрической

используется чаще всего при расчете среднего значения по индивидуальным относительным величинам динамики.

Средняя геометрическая применяется, если задана последовательность цепных относительных величин динамики, указывающих, например, на рост объема производства по сравнению с уровнем предыдущего года: i 1 , i 2 , i 3 ,..., i n . Очевидно, что объем производства в последнем году определяется начальным его уровнем (q 0) и последующим наращиванием по годам:

q n =q 0 × i 1 × i 2 ×...×i n .

Приняв q n в качестве определяющего показателя и заменяя индивидуальные значения показателей динамики средними, приходим к соотношению

Отсюда

5.3. Структурные средние

Особый вид средних величин – структурные средние – применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен (например, если бы в рассмотренном примере отсутствовали данные и об объеме производства, и о сумме затрат по группам предприятий).

В качестве структурных средних чаще всего используют показатели моды – наиболее часто повторяющегося значения признака – и медианы – величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианного уровня, а у другой – не меньше его.

Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Если же данные о значениях признака Х представлены в виде упорядоченных интервалов его изменения (интервальных рядов), расчет моды и медианы несколько усложняется. Поскольку медианное значение делит всю совокупность на две равные по численности части, оно оказывается в каком-то из интервалов признака X. С помощью интерполяции в этом медианном интервале находят значение медианы:

,

где X Me – нижняя граница медианного интервала;
h Me – его величина;
(Sum m)/2 – половина от общего числа наблюдений или половина объема того показателя, который используется в качестве взвешивающего в формулах расчета средней величины (в абсолютном или относительном выражении);
S Me-1 – сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала;
m Me – число наблюдений или объем взвешивающего признака в медианном интервале (также в абсолютном либо относительном выражении).

В нашем примере могут быть получены даже три медианных значения – исходя из признаков количества предприятий, объема продукции и общей суммы затрат на производство:

Таким образом, у половины предприятий уровень себестоимость единицы продукции превышает 125,19 тыс. руб., половина всего объема продукции производится с уровнем затрат на изделие больше 124,79 тыс. руб. и 50 % общей суммы затрат образуется при уровне себестоимости одного изделия выше 125,07 тыс. руб. Заметим также, что наблюдается некоторая тенденция к росту себестоимости, так как Ме 2 = 124,79 тыс. руб., а средний уровень равен 123,15 тыс. руб.

При расчете модального значения признака по данным интервального ряда надо обращать внимание на то, чтобы интервалы были одинаковыми, поскольку от этого зависит показатель повторяемости значений признака X. Для интервального ряда с равными интервалами величина моды определяется как

где Х Mo – нижнее значение модального интервала;
m Mo – число наблюдений или объем взвешивающего признака в модальном интервале (в абсолютном либо относительном выражении);
m Mo -1 – то же для интервала, предшествующего модальному;
m Mo+1 – то же для интервала, следующего за модальным;
h – величина интервала изменения признака в группах.

Для нашего примера можно рассчитать три модальных значения исходя из признаков числа предприятий, объема продукции и суммы затрат. Во всех трех случаях модальный интервал один и тот же, так как для одного и того же интервала оказываются наибольшими и число предприятий, и объем продукции, и общая сумма затрат на производство:

Таким образом, чаще всего встречаются предприятия с уровнем себестоимости 126,75 тыс. руб., чаще всего выпускается продукция с уровнем затрат 126,69 тыс. руб., и чаще всего затраты на производство объясняются уровнем себестоимости в 123,73 тыс. руб.

5.4. Показатели вариации

Конкретные условия, в которых находится каждый из изучаемых объектов, а также особенности их собственного развития (социальные, экономические и пр.) выражаются соответствующими числовыми уровнями статистических показателей. Таким образом, вариация, т.е. несовпадение уровней одного и того же показателя у разных объектов, имеет объективный характер и помогает познать сущность изучаемого явления.

Для измерения вариации в статистике применяют несколько способов.

Наиболее простым является расчет показателя размаха вариации Н как разницы между максимальным (X max) и минимальным (X min) наблюдаемыми значениями признака:

H=X max - X min .

Однако размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается.

Более строгими характеристиками являются показатели колеблемости относительно среднего уровня признака. Простейший показатель такого типа – среднее линейное отклонение Л как среднее арифметическое значение абсолютных отклонений признака от его среднего уровня:

При повторяемости отдельных значений Х используют формулу средней арифметической взвешенной:

(Напомним, что алгебраическая сумма отклонений от среднего уровня равна нулю.)

Показатель среднего линейного отклонения нашел широкое применение на практике. С его помощью анализируются, например, состав работающих, ритмичность производства, равномерность поставок материалов, разрабатываются системы материального стимулирования. Но, к сожалению, этот показатель усложняет расчеты вероятностного типа, затрудняет применение методов математической статистики. Поэтому в статистических научных исследованиях для измерения вариации чаще всего применяют показатель дисперсии.

Дисперсия признака (s 2) определяется на основе квадратической степенной средней:

.

Показатель s, равный , называется средним квадратическим отклонением.

В общей теории статистики показатель дисперсии является оценкой одноименного показателя теории вероятностей и (как сумма квадратов отклонений) оценкой дисперсии в математической статистике, что позволяет использовать положения этих теоретических дисциплин для анализа социально-экономических процессов.

Если вариация оценивается по небольшому числу наблюдений, взятых из неограниченной генеральной совокупности, то и среднее значение признака определяется с некоторой погрешностью. Расчетная величина дисперсии оказывается смещенной в сторону уменьшения. Для получения несмещенной оценки выборочную дисперсию, полученную по приведенным ранее формулам, надо умножить на величину n / (n - 1). В итоге при малом числе наблюдений (< 30) дисперсию признака рекомендуется вычислять по формуле

Обычно уже при n > (15÷20) расхождение смещенной и несмещенной оценок становится несущественным. По этой же причине обычно не учитывают смещенность и в формуле сложения дисперсий.

Если из генеральной совокупности сделать несколько выборок и каждый раз при этом определять среднее значение признака, то возникает задача оценки колеблемости средних. Оценить дисперсию среднего значения можно и на основе всего одного выборочного наблюдения по формуле

,

где n – объем выборки; s 2 – дисперсия признака, рассчитанная по данным выборки.

Величина носит название средней ошибки выборки и является характеристикой отклонения выборочного среднего значения признака Х от его истинной средней величины. Показатель средней ошибки используется при оценке достоверности результатов выборочного наблюдения.

Показатели относительного рассеивания. Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей). Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической, умножаемое на 100%.

1. Коэффициентом осцилляции отражает относительную колеблемость крайних значений признака вокруг средней

.

2. Относительное линейное отключение характеризует долю усредненного значения признака абсолютных отклонений от средней величины

.

3. Коэффициент вариации:

является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин.

В статистике совокупности, имеющие коэффициент вариации больше 30–35 %, принято считать неоднородными.

У такого способа оценки вариации есть и существенный недостаток. Действительно, пусть, например, исходная совокупность рабочих, имеющих средний стаж 15 лет, со средним квадратическим отклонением s = 10 лет, «состарилась» еще на 15 лет. Теперь = 30 лет, а среднеквадратическое отклонение по-прежнему равно 10. Совокупность, ранее бывшая неоднородной (10/15 × 100 = 66,7%), со временем оказывается, таким образом, вполне однородной (10/30 × 100 = 33,3 %).

Боярский А.Я. Теоретические исследования по статистике: Сб. Науч. Трудов.– М.: Статистика,1974. С. 19–57.

Предыдущая