Что значит усредненный. Что такое среднее арифметическое число. Среднее значение — позднее изобретение

В большинстве случаев данные концентрируются вокруг некоей центральной точки. Таким образом, чтобы описать любой набор данных, достаточно указать средне значение. Рассмотрим последовательно три числовые характеристики, которые используются для оценки среднего значения распределения: среднее арифметическое, медиана и мода.

Среднее арифметическое

Среднее арифметическое (часто называемое просто средним) - наиболее распространенная оценка среднего значения распределения. Она является результатом деления суммы всех наблюдаемых числовых величин на их количество. Для выборки, состоящей из чисел Х 1 , Х 2 , …, Х n , выборочное среднее (обозначаемое символом ) равно = (Х 1 + Х 2 + … + Х n ) / n , или

где - выборочное среднее, n - объем выборки, X i – i-й элемент выборки.

Скачать заметку в формате или , примеры в формате

Рассмотрим вычисление среднего арифметического значения пятилетней среднегодовой доходности 15 взаимных фондов с очень высоким уровнем риска (рис. 1).

Рис. 1. Среднегодовая доходность 15 взаимных фондов с очень высоким уровнем риска

Выборочное среднее вычисляется следующим образом:

Это хороший доход, особенно по сравнению с 3–4% дохода, который получили вкладчики банков или кредитных союзов за тот же период времени. Если упорядочить значения доходности, то легко заметить, что восемь фондов имеют доходность выше, а семь - ниже среднего значения. Среднее арифметическое играет роль точки равновесия, так что фонды с низкими доходами уравновешивают фонды с высокими доходами. В вычислении среднего задействованы все элементы выборки. Ни одна из других оценок среднего значения распределения не обладает этим свойством.

Когда следует вычислять среднее арифметическое. Поскольку среднее арифметическое зависит от всех элементов выборки, наличие экстремальных значений значительно влияет на результат. В таких ситуациях среднее арифметическое может исказить смысл числовых данных. Следовательно, описывая набор данных, содержащий экстремальные значения, необходимо указывать медиану либо среднее арифметическое и медиану. Например, если удалить из выборки доходность фонда RS Emerging Growth, выборочное среднее доходности 14 фондов уменьшится почти на 1% и составит 5,19%.

Медиана

Медиана представляет собой срединное значение упорядоченного массива чисел. Если массив не содержит повторяющихся чисел, то половина его элементов окажется меньше, а половина - больше медианы. Если выборка содержит экстремальные значения, для оценки среднего значения лучше использовать не среднее арифметическое, а медиану. Чтобы вычислить медиану выборки, ее сначала необходимо упорядочить.

Эта формула неоднозначна. Ее результат зависит от четности или нечетности числа n :

  • Если выборка содержит нечетное количество элементов, медиана равна (n+1)/2 -му элементу.
  • Если выборка содержит четное количество элементов, медиана лежит между двумя средними элементами выборки и равна среднему арифметическому, вычисленному по этим двум элементам.

Чтобы вычислить медиану выборки, содержащей данные о доходности 15 взаимных фондов с очень высокий уровнем риска, сначала необходимо упорядочить исходные данные (рис. 2). Тогда медиана будет напротив номера среднего элемента выборки; в нашем примере №8. В Excel есть специальная функция =МЕДИАНА(), которая работает и с неупорядоченными массивами тоже.

Рис. 2. Медиана 15 фондов

Таким образом, медиана равна 6,5. Это означает, что доходность одной половины фондов с очень высоким уровнем риска не превышает 6,5, а доходность второй половины - превышает ее. Обратите внимание на то, что медиана, равная 6,5, ненамного больше среднего значения, равного 6,08.

Если удалить из выборки доходность фонда RS Emerging Growth, то медиана оставшихся 14 фондов уменьшится до 6,2%, то есть не так значительно, как среднее арифметическое (рис. 3).

Рис. 3. Медиана 14 фондов

Мода

Термин был впервые введен Пирсоном в 1894 г. Мода - это число, которое чаще других встречается в выборке (наиболее модное). Мода хорошо описывает, например, типичную реакцию водителей на сигнал светофора о прекращении движения. Классический пример использования моды - выбор размера выпускаемой партии обуви или цвета обоев. Если распределение имеет несколько мод, то говорят, что оно мультимодально или многомодально (имеет два или более «пика»). Мультимодальность распределения дает важную информацию о природе исследуемой переменной. Например, в социологических опросах, если переменная представляет собой предпочтение или отношение к чему-то, то мультимодальность может означать, что существуют несколько определенно различных мнений. Мультимодальность также служит индикатором того, что выборка не является однородной и наблюдения, возможно, порождены двумя или более «наложенными» распределениями. В отличие от среднего арифметического, выбросы на моду не влияют. Для непрерывно распределенных случайных величин, например, для показателей среднегодовой доходности взаимных фондов, мода иногда вообще не существует (или не имеет смысла). Поскольку эти показатели могут принимать самые разные значения, повторяющиеся величины встречаются крайне редко.

Квартили

Квартили - это показатели, которые чаще всего используются для оценки распределения данных при описании свойств больших числовых выборок. В то время как медиана разделяет упорядоченный массив пополам (50% элементов массива меньше медианы и 50% - больше), квартили разбивают упорядоченный набор данных на четыре части. Величины Q 1 , медиана и Q 3 являются 25-м, 50-м и 75-м перцентилем соответственно. Первый квартиль Q 1 - это число, разделяющее выборку на две части: 25% элементов меньше, а 75% - больше первого квартиля.

Третий квартиль Q 3 - это число, разделяющее выборку также на две части: 75% элементов меньше, а 25% - больше третьего квартиля.

Для расчета квартилей в версиях Excel до 2007 г. использовалась функция =КВАРТИЛЬ(массив;часть). Начиная с версии Excel2010 применяются две функции:

  • =КВАРТИЛЬ.ВКЛ(массив;часть)
  • =КВАРТИЛЬ.ИСКЛ(массив;часть)

Эти две функции дают немного различные значения (рис. 4). Например, при вычислении квартилей выборки, содержащей данные о среднегодовой доходности 15 взаимных фондов с очень высоким уровнем риска Q 1 = 1,8 или –0,7 для КВАРТИЛЬ.ВКЛ и КВАРТИЛЬ.ИСКЛ, соответственно. Кстати функция КВАРТИЛЬ, использовавшаяся ранее соответствует современной функции КВАРТИЛЬ.ВКЛ. Для расчета квартилей в Excel с помощью вышеприведенных формул массив данных можно не упорядочивать.

Рис. 4. Вычисление квартилей в Excel

Подчеркнем еще раз. Excel умеет рассчитывать квартили для одномерного дискретного ряда , содержащего значения случайной величины. Расчет квартилей для распределения на основе частот приведен ниже в разделе .

Среднее геометрическое

В отличие от среднего арифметического среднее геометрическое позволяет оценить степень изменения переменной с течением времени. Среднее геометрическое - это корень n -й степени из произведения n величин (в Excel используется функция =СРГЕОМ):

G = (X 1 * X 2 * … * X n) 1/n

Похожий параметр – среднее геометрическое значение нормы прибыли – определяется формулой:

G = [(1 + R 1) * (1 + R 2) * … * (1 + R n)] 1/n – 1,

где R i – норма прибыли за i -й период времени.

Например, предположим, что объем вложенных средств в исходный момент времени равен 100 000 долл. К концу первого года он падает до уровня 50 000 долл., а к концу второго года восстанавливается до исходной отметки 100 000 долл. Норма прибыли этой инвестиции за двухлетний период равна 0, поскольку первоначальный и финальный объем средств равны между собой. Однако среднее арифметическое годовых норм прибыли равно = (–0,5 + 1) / 2 = 0,25 или 25%, поскольку норма прибыли в первый год R 1 = (50 000 – 100 000) / 100 000 = –0,5, а во второй R 2 = (100 000 – 50 000) / 50 000 = 1. В то же время, среднее геометрическое значение нормы прибыли за два года равно: G = [(1–0,5) * (1+1)] 1/2 – 1 = ½ – 1 = 1 – 1 = 0. Таким образом, среднее геометрическое точнее отражает изменение (точнее, отсутствие изменений) объема инвестиций за двухлетний период, чем среднее арифметическое.

Интересные факты. Во-первых, среднее геометрическое всегда будет меньше среднего арифметического тех же чисел. За исключением случая, когда все взятые числа равны друг другу. Во-вторых, рассмотрев свойства прямоугольного треугольника, можно понять, почему среднее называется геометрическим. Высота прямоугольного треугольника, опущенная на гипотенузу, есть среднее пропорциональное между проекциями катетов на гипотенузу, а каждый катет есть среднее пропорциональное между гипотенузой и его проекцией на гипотенузу (рис. 5). Это даёт геометрический способ построения среднего геометрического двух (длин) отрезков: нужно построить окружность на сумме этих двух отрезков как на диаметре, тогда высота, восставленная из точки их соединения до пересечения с окружностью, даст искомую величину:

Рис. 5. Геометрическая природа среднего геометрического (рисунок из Википедии)

Второе важное свойство числовых данных - их вариация , характеризующая степень дисперсии данных. Две разные выборки могут отличаться как средними значениями, так и вариациями. Однако, как показано на рис. 6 и 7, две выборки могут иметь одинаковые вариации, но разные средние значения, либо одинаковые средние значения и совершенно разные вариации. Данные, которым соответствует полигон В на рис. 7, изменяются намного меньше, чем данные, по которым построен полигон А.

Рис. 6. Два симметричных распределения колоколообразной формы с одинаковым разбросом и разными средними значениями

Рис. 7. Два симметричных распределения колоколообразной формы с одинаковыми средними значениями и разным разбросом

Существует пять оценок вариации данных:

  • размах,
  • межквартильный размах,
  • дисперсия,
  • стандартное отклонение,
  • коэффициент вариации.

Размах

Размахом называется разность между наибольшим и наименьшим элементами выборки:

Размах = Х Max – Х Min

Размах выборки, содержащей данные о среднегодовой доходности 15 взаимных фондов с очень высоким уровнем риска, можно вычислить, используя упорядоченный массив (см. рис. 4): Размах = 18,5 – (–6,1) = 24,6. Это значит, что разница между наибольшей и наименьшей среднегодовой доходностью фондов с очень высоким уровнем риска равна 24,6% .

Размах позволяет измерить общий разброс данных. Хотя размах выборки является весьма простой оценкой общего разброса данных, его слабость заключается в том, что он никак не учитывает, как именно распределены данные между минимальным и максимальным элементами. Этот эффект хорошо прослеживается на рис. 8, который иллюстрирует выборки, имеющие одинаковый размах. Шкала В демонстрирует, что если выборка содержит хотя бы одно экстремальное значение, размах выборки оказывается весьма неточной оценкой разброса данных.

Рис. 8. Сравнение трех выборок, имеющих одинаковый размах; треугольник символизирует опору весов, и его расположение соответствует среднему значению выборки

Межквартильный размах

Межквартильный, или средний, размах - это разность между третьим и первым квартилями выборки:

Межквартильный размах = Q 3 – Q 1

Эта величина позволяет оценить разброс 50% элементов и не учитывать влияние экстремальных элементов. Межквартильный размах выборки, содержащей данные о среднегодовой доходности 15 взаимных фондов с очень высоким уровнем риска, можно вычислить, используя данные на рис. 4 (например, для функции КВАРТИЛЬ.ИСКЛ): Межквартильный размах = 9,8 – (–0,7) = 10,5. Интервал, ограниченный числами 9,8 и –0,7, часто называют средней половиной.

Следует отметить, что величины Q 1 и Q 3 , а значит, и межквартильный размах, не зависят от наличия выбросов, поскольку при их вычислении не учитывается ни одна величина, которая была бы меньше Q 1 или больше Q 3 . Суммарные количественные характеристики, такие как медиана, первый и третий квартили, а также межквартильный размах, на которые не влияют выбросы, называются устойчивыми показателями.

Хотя размах и межквартильный размах позволяют оценить общий и средний разброс выборки соответственно, ни одна из этих оценок не учитывает, как именно распределены данные. Дисперсия и стандартное отклонение лишены этого недостатка. Эти показатели позволяют оценить степень колебания данных вокруг среднего значения. Выборочная дисперсия является приближением среднего арифметического, вычисленного на основе квадратов разностей между каждым элементом выборки и выборочным средним. Для выборки Х 1 , Х 2 , … Х n выборочная дисперсия (обозначаемая символом S 2 задается следующей формулой:

В общем случае выборочная дисперсия - это сумма квадратов разностей между элементами выборки и выборочным средним, деленная на величину, равную объему выборки минус один:

где - арифметическое среднее, n - объем выборки, X i - i -й элемент выборки X . В Excel до версии 2007 для расчета выборочной дисперсии использовалась функция =ДИСП(), с версии 2010 используется функция =ДИСП.В().

Наиболее практичной и широко распространенной оценкой разброса данных является стандартное выборочное отклонение . Этот показатель обозначается символом S и равен квадратному корню из выборочной дисперсии:

В Excel до версии 2007 для расчета стандартного выборочного отклонения использовалась функция =СТАНДОТКЛОН(), с версии 2010 используется функция =СТАНДОТКЛОН.В(). Для расчета этих функций массив данных может быть неупорядоченным.

Ни выборочная дисперсия, ни стандартное выборочное отклонение не могут быть отрицательными. Единственная ситуация, в которой показатели S 2 и S могут быть нулевыми, - если все элементы выборки равны между собой. В этом совершенно невероятном случае размах и межквартильный размах также равны нулю.

Числовые данные по своей природе изменчивы. Любая переменная может принимать множество разных значений. Например, разные взаимные фонды имеют разные показатели доходности и убытков. Вследствие изменчивости числовых данных очень важно изучать не только оценки среднего значения, которые по своей природе являются суммарными, но и оценки дисперсии, характеризующие разброс данных.

Дисперсия и стандартное отклонение позволяют оценить разброс данных вокруг среднего значения, иначе говоря, определить, сколько элементов выборки меньше среднего, а сколько - больше. Дисперсия обладает некоторыми ценными математическими свойствами. Однако ее величина представляет собой квадрат единицы измерения - квадратный процент, квадратный доллар, квадратный дюйм и т.п. Следовательно, естественной оценкой дисперсии является стандартное отклонение, которое выражается в обычных единицах измерений - процентах дохода, долларах или дюймах.

Стандартное отклонение позволяет оценить величину колебаний элементов выборки вокруг среднего значения. Практически во всех ситуациях основное количество наблюдаемых величин лежит в интервале плюс-минус одно стандартное отклонение от среднего значения. Следовательно, зная среднее арифметическое элементов выборки и стандартное выборочное отклонение, можно определить интервал, которому принадлежит основная масса данных.

Стандартное отклонение доходности 15 взаимных фондов с очень высоким уровнем риска равно 6,6 (рис. 9). Это значит, что доходность основной массы фондов отличается от среднего значения не более чем на 6,6% (т.е. колеблется в интервале от – S = 6,2 – 6,6 = –0,4 до + S = 12,8). Фактически в этом интервале лежит пятилетняя среднегодовая доходность 53,3% (8 из 15) фондов.

Рис. 9. Стандартное выборочное отклонение

Обратите внимание на то, что в процессе суммирования квадратов разностей элементы выборки, лежащие дальше от среднего значения, приобретают больший вес, чем элементы, лежащие ближе. Это свойство является основной причиной того, что для оценки среднего значения распределения чаще всего используется среднее арифметическое значение.

Коэффициент вариации

В отличие от предыдущих оценок разброса, коэффициент вариации является относительной оценкой. Он всегда измеряется в процентах, а не в единицах измерения исходных данных. Коэффициент вариации, обозначаемый символами CV, измеряет рассеивание данных относительно среднего значения. Коэффициент вариации равен стандартному отклонению, деленному на среднее арифметическое и умноженному на 100%:

где S - стандартное выборочное отклонение, - выборочное среднее.

Коэффициент вариации позволяет сравнить две выборки, элементы которых выражаются в разных единицах измерения. Например, управляющий службы доставки корреспонденции намеревается обновить парк грузовиков. При погрузке пакетов следует учитывать два вида ограничений: вес (в фунтах) и объем (в кубических футах) каждого пакета. Предположим, что в выборке, содержащей 200 пакетов, средний вес равен 26,0 фунтов, стандартное отклонение веса 3,9 фунтов, средний объем пакета 8,8 кубических футов, а стандартное отклонение объема 2,2 кубических фута. Как сравнить разброс веса и объема пакетов?

Поскольку единицы измерения веса и объема отличаются друг от друга, управляющий должен сравнить относительный разброс этих величин. Коэффициент вариации веса равен CV W = 3,9 / 26,0 * 100% = 15%, а коэффициент вариации объема CV V = 2,2 / 8,8 * 100% = 25% . Таким образом, относительный разброс объема пакетов намного больше относительного разброса их веса.

Форма распределения

Третье важное свойство выборки - форма ее распределения. Это распределение может быть симметричным или асимметричным. Чтобы описать форму распределения, необходимо вычислить его среднее значение и медиану. Если эти два показателя совпадают, переменная считается симметрично распределенной. Если среднее значение переменной больше медианы, ее распределение имеет положительную асимметрию (рис. 10). Если медиана больше среднего значения, распределение переменной имеет отрицательную асимметрию. Положительная асимметрия возникает, когда среднее значение увеличивается до необычайно высоких значений. Отрицательная асимметрия возникает, когда среднее значение уменьшается до необычайно малых значений. Переменная является симметрично распределенной, если она не принимает никаких экстремальных значений ни в одном из направлений, так что большие и малые значения переменной уравновешивают друг друга.

Рис. 10. Три вида распределений

Данные, изображенные на шкале А, имеют отрицательную асимметрию. На этом рисунке виден длинный хвост и перекос влево, вызванные наличием необычно малых значений. Эти крайне малые величины смещают среднее значение влево, и оно становится меньше медианы. Данные, изображенные на шкале Б, распределены симметрично. Левая и правая половины распределения являются своими зеркальными отражениями. Большие и малые величины уравновешивают друг друга, а среднее значение и медиана равны между собой. Данные, изображенные на шкале В, имеют положительную асимметрию. На этом рисунке виден длинный хвост и перекос вправо, вызванные наличием необычайно высоких значений. Эти слишком большие величины смещают среднее значение вправо, и оно становится больше медианы.

В Excel описательные статистики можно получить с помощью надстройки Пакет анализа . Пройдите по меню Данные Анализ данных , в открывшемся окне выберите строку Описательная статистика и кликните Ok . В окне Описательная статистика обязательно укажите Входной интервал (рис. 11). Если вы хотите увидеть описательные статистики на том же листе, что и исходные данные, выберите переключатель Выходной интервал и укажите ячейку, куда следует поместить левый верхний угол выводимых статистик (в нашем примере $C$1). Если вы хотите вывести данные на новый лист или в новую книгу, достаточно просто выбрать соответствующий переключатель. Поставьте галочку напротив Итоговая статистика . По желанию также можно выбрать Уровень сложности, k-й наименьший и k-й наибольший .

Если на вкладе Данные в области Анализ у вас не отображается пиктограмма Анализ данных , нужно предварительно установить надстройку Пакет анализа (см., например, ).

Рис. 11. Описательные статистики пятилетней среднегодовой доходности фондов с очень высоким уровнями риска, вычисленные с помощью надстройки Анализ данных программы Excel

Excel вычисляет целый ряд статистик, рассмотренных выше: среднее, медиану, моду, стандартное отклонение, дисперсию, размах (интервал ), минимум, максимум и объем выборки (счет ). Кроме того, Excel вычисляет некоторые новые для нас статистики: стандартную ошибку, эксцесс и асимметричность. Стандартная ошибка равна стандартному отклонению, деленному на квадратный корень объема выборки. Асимметричность характеризует отклонение от симметричности распределения и является функцией, зависящей от куба разностей между элементами выборки и средним значением. Эксцесс представляет собой меру относительной концентрации данных вокруг среднего значения по сравнению с хвостами распределения и зависит от разностей между элементами выборки и средним значением, возведенных в четвертую степень.

Вычисление описательных статистик для генеральной совокупности

Среднее значение, разброс и форма распределения, рассмотренные выше, представляют собой характеристики, определяемые по выборке. Однако, если набор данных содержит числовые измерения всей генеральной совокупности, можно вычислить ее параметры. К числу таких параметров относятся математическое ожидание, дисперсия и стандартное отклонение генеральной совокупности.

Математическое ожидание равно сумме всех значений генеральной совокупности, деленной на объем генеральной совокупности:

где µ - математическое ожидание, X i - i -е наблюдение переменной X , N - объем генеральной совокупности. В Excel для вычисления математического ожидания используется та же функция, что и для среднего арифметического: =СРЗНАЧ().

Дисперсия генеральной совокупности равна сумме квадратов разностей между элементами генеральной совокупности и мат. ожиданием, деленной на объем генеральной совокупности:

где σ 2 – дисперсия генеральной совокупности. В Excel до версии 2007 для вычисления дисперсии генеральной совокупности используется функция =ДИСПР(), начиная с версии 2010 =ДИСП.Г().

Стандартное отклонение генеральной совокупности равно квадратному корню, извлеченному из дисперсии генеральной совокупности:

В Excel до версии 2007 для вычисления стандартного отклонения генеральной совокупности используется функция =СТАНДОТКЛОНП(), начиная с версии 2010 =СТАНДОТКЛОН.Г(). Обратите внимание на то, что формулы для дисперсии и стандартного отклонения генеральной совокупности отличаются от формул для вычисления выборочной дисперсии и стандартного отклонения. При вычислении выборочных статистик S 2 и S знаменатель дроби равен n – 1 , а при вычислении параметров σ 2 и σ - объему генеральной совокупности N .

Эмпирическое правило

В большинстве ситуаций крупная доля наблюдений концентрируется вокруг медианы, образуя кластер. В наборах данных, имеющих положительную асимметрию, этот кластер расположен левее (т.е. ниже) математического ожидания, а в наборах, имеющих отрицательную асимметрию, этот кластер расположен правее (т.е. выше) математического ожидания. У симметричных данных математическое ожидание и медиана совпадают, а наблюдения концентрируются вокруг математического ожидания, формируя колоколообразное распределение. Если распределение не имеет ярко выраженной асимметрии, а данные концентрируются вокруг некоего центра тяжести, для оценки изменчивости можно применять эмпирическое правило, которое гласит: если данные имеют колоколообразное распределение, то приблизительно 68% наблюдений отстоят от математического ожидания не более чем на одно стандартное отклонение, приблизительно 95% наблюдений отстоят от математического ожидания не более чем на два стандартных отклонения и 99,7% наблюдений отстоят от математического ожидания не более чем на три стандартных отклонения.

Таким образом, стандартное отклонение, представляющее собой оценку среднего колебания вокруг математического ожидания, помогает понять, как распределены наблюдения, и идентифицировать выбросы. Из эмпирического правила следует, что для колоколообразных распределений лишь одно значение из двадцати отличается от математического ожидания больше, чем на два стандартных отклонения. Следовательно, значения, лежащие за пределами интервала µ ± 2σ , можно считать выбросами. Кроме того, только три из 1000 наблюдений отличаются от математического ожидания больше чем на три стандартных отклонения. Таким образом, значения, лежащие за пределами интервала µ ± 3σ практически всегда являются выбросами. Для распределений, имеющих сильную асимметрию или не имеющих колоколообразной формы, можно применять эмпирическое правило Бьенамэ-Чебышева.

Более ста лет назад математики Бьенамэ и Чебышев независимо друг от друга открыли полезное свойство стандартного отклонения. Они обнаружили, что для любого набора данных, независимо от формы распределения, процент наблюдений, лежащих на расстоянии не превышающем k стандартных отклонений от математического ожидания, не меньше (1 – 1/ k 2)*100% .

Например, если k = 2, правило Бьенамэ-Чебышева гласит, что как минимум (1 – (1/2) 2) х 100% = 75% наблюдений должно лежать в интервале µ ± 2σ . Это правило справедливо для любого k , превышающего единицу. Правило Бьенамэ-Чебышева носит весьма общий характер и справедливо для распределений любого вида. Оно указывает минимальное количество наблюдений, расстояние от которых до математического ожидания не превышает заданной величины. Однако, если распределение имеет колоколообразную форму, эмпирическое правило более точно оценивает концентрацию данных вокруг математического ожидания.

Вычисление описательных статистик для распределения на основе частот

Если исходные данные недоступны, единственным источником информации становится распределение частот. В таких ситуациях можно вычислить приближенные значения количественных показателей распределения, таких как среднее арифметическое, стандартное отклонение, квартили.

Если выборочные данные представлены в виде распределения частот, приближенное значение среднего арифметического можно вычислить, предполагая, что все значения внутри каждого класса сосредоточены в средней точке класса:

где - выборочное среднее, n - количество наблюдений, или объем выборки, с - количество классов в распределении частот, m j - средняя точка j -гo класса, f j - частота, соответствующая j -му классу.

Для вычисления стандартного отклонения по распределению частот также предполагается, что все значения внутри каждого класса сосредоточены в средней точке класса.

Чтобы понять, как определяются квартили ряда на основе частот, рассмотрим расчет нижнего квартиля на основе данных за 2013 г. о распределении населения России по величине среднедушевых денежных доходов (рис. 12).

Рис. 12. Доля населения России со среднедушевыми денежными доходами в среднем за месяц, рублей

Для расчета первого квартиля интервального вариационного ряда можно воспользоваться формулой:

где Q1 – величина первого квартиля, хQ1 – нижняя граница интервала, содержащего первый квартиль (интервал определяется по накопленной частоте, первой превышающей 25%); i – величина интервала; Σf – сумма частот всей выборки; наверное, всегда равна 100%; SQ1–1 – накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль; fQ1 – частота интервала, содержащего нижний квартиль. Формула для третьего квартиля отличается тем, что во всех местах вместо Q1 нужно использовать Q3, а вместо ¼ подставить ¾.

В нашем примере (рис. 12) нижний квартиль находится в интервале 7000,1 – 10 000, накопленная частота которого равна 26,4%. Нижняя граница этого интервала – 7000 руб., величина интервала – 3000 руб., накопленная частота интервала, предшествующего интервалу, содержащему нижний квартиль – 13,4%, частота интервала, содержащего нижний квартиль – 13,0%. Таким образом: Q1 = 7000 + 3000 * (¼ * 100 – 13,4) / 13 = 9677 руб.

Ловушки, связанные с описательными статистиками

В этой заметке мы рассмотрели, как описать набор данных с помощью различных статистик, оценивающих его среднее значение, разброс и вид распределения. Следующим этапом является анализ и интерпретация данных. До сих пор мы изучали объективные свойства данных, а теперь переходим к их субъективной трактовке. Исследователя подстерегают две ошибки: неверно выбранный предмет анализа и неправильная интерпретация результатов.

Анализ доходности 15 взаимных фондов с очень высоким уровнем риска является вполне беспристрастным. Он привел к совершенно объективным выводам: все взаимные фонды имеют разную доходность, разброс доходности фондов колеблется от –6,1 до 18,5, а средняя доходность равна 6,08. Объективность анализа данных обеспечивается правильным выбором суммарных количественных показателей распределения. Было рассмотрено несколько способов оценки среднего значения и разброса данных, указаны их преимущества и недостатки. Как же выбрать правильную статистику, обеспечивающую объективный и беспристрастный анализ? Если распределение данных имеет небольшую асимметрию, следует ли выбирать медиану, а не среднее арифметическое? Какой показатель более точно характеризует разброс данных: стандартное отклонение или размах? Следует ли указывать на положительную асимметрию распределения?

С другой стороны, интерпретация данных является субъективным процессом. Разные люди приходят к разным выводам, истолковывая одни и те же результаты. У каждого своя точка зрения. Кто-то считает суммарные показатели среднегодовой доходности 15 фондов с очень высоким уровнем риска хорошими и вполне доволен полученным доходом. Другим может показаться, что эти фонды имеют слишком низкую доходность. Таким образом, субъективность следует компенсировать честностью, нейтральностью и ясностью выводов.

Этические проблемы

Анализ данных неразрывно связан с этическими вопросами. Следует критически относиться к информации, распространяемой газетами, радио, телевидением и Интерентом. Со временем вы научитесь скептически относиться не только к результатам, но и к целям, предмету и объективности исследований. Лучше всего об этом сказал известный британский политик Бенджамин Дизраэли: «Существуют три вида лжи: ложь, наглая ложь и статистика».

Как было отмечено в заметке этические проблемы возникают при выборе результатов, которые следует привести в отчете. Следует публиковать как положительные, так и отрицательные результаты. Кроме того, делая доклад или письменный отчет, результаты необходимо излагать честно, нейтрально и объективно. Следует различать неудачную и нечестную презентации. Для этого необходимо определить, каковы были намерения докладчика. Иногда важную информацию докладчик пропускает по невежеству, а иногда - умышленно (например, если он применяет среднее арифметическое для оценки среднего значения явно асимметричных данных, чтобы получить желаемый результат). Нечестно также замалчивать результаты, которые не соответствуют точке зрения исследователя.

Используются материалы книги Левин и др. Статистика для менеджеров. – М.: Вильямс, 2004. – с. 178–209

Функция КВАРТИЛЬ оставлена для совмещения с более ранними версиями Excel

В математике среднее арифметическое значение чисел (или просто среднее) — это сумма всех чисел в данном наборе, разделенная на их количество. Это наиболее обобщенное и распространенное понятие средней величины. Как вы уже поняли, чтобы найти нужно суммировать все данные вам числа, а полученный результат разделить на количество слагаемых.

Что такое среднее арифметическое?

Давайте рассмотрим пример.

Пример 1 . Даны числа: 6, 7, 11. Нужно найти их среднее значение.

Решение.

Для начала найдем сумму всех данных чисел.

Теперь разделим получившуюся сумму на количество слагаемых. Так как у нас слагаемых три, соответственно, мы будем делить на три.

Следовательно, среднее значение чисел 6, 7 и 11 — это 8. Почему именно 8? Да потому, что сумма 6, 7 и 11 будет такая же, как трех восьмерок. Это отлично видно на иллюстрации.

Среднее значение чем-то напоминает «выравнивание» ряда чисел. Как видите, кучки карандашей стали одного уровня.

Рассмотрим еще один пример, чтобы закрепить полученные знания.

Пример 2. Даны числа: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Нужно найти их среднее арифметическое значение.

Решение.

Находим сумму.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Делим на количество слагаемых (в этом случае — 15).

Следовательно, среднее значение данного ряда чисел равно 22.

Теперь рассмотрим отрицательные числа. Вспомним, как их суммировать. Например, у вас есть два числа 1 и -4. Найдем их сумму.

1 + (-4) = 1 - 4 = -3

Зная это, рассмотрим еще один пример.

Пример 3. Найти среднее значение ряда чисел: 3, -7, 5, 13, -2.

Решение.

Находим сумму чисел.

3 + (-7) + 5 + 13 + (-2) = 12

Так как слагаемых 5, разделим получившуюся сумму на 5.

Следовательно, среднее арифметическое значение чисел 3, -7, 5, 13, -2 равно 2,4.

В наше время технологического прогресса гораздо удобнее использовать для нахождения среднего значения компьютерные программы. Microsoft Office Excel — одна из них. Искать среднее значение в Excel быстро и просто. Тем более, эта программа входит в пакет программ от Microsoft Office. Рассмотрим краткую инструкцию, значение с помощью этой программы.

Для того чтобы посчитать среднее значение ряда чисел, необходимо использовать функцию AVERAGE. Синтаксис для этой функции:
= Average (argument1, argument2, ... argument255)
где argument1, argument2, ... argument255 — это либо числа, либо ссылки на ячейки (под ячейками подразумеваются диапазоны и массивы).

Чтобы было более понятно, опробуем полученные знания.

  1. Введите числа 11, 12, 13, 14, 15, 16 в ячейки С1 - С6.
  2. Выделите ячейку С7, нажав на нее. В этой ячейке у нас будет отображаться среднее значение.
  3. Щелкните на вкладке «Формулы».
  4. Выберите More Functions > Statistical для того, чтобы открыть
  5. Выберите AVERAGE. После этого должно открыться диалоговое окно.
  6. Выделите и перетащите туда ячейки С1-С6, чтобы задать диапазон в диалоговом окне.
  7. Подтвердите свои действия клавишей «ОК».
  8. Если вы все сделали правильно, в ячейке С7 у вас должен появиться ответ - 13,7. При нажатии на ячейку C7 функция (= Average (C1: C6)) будет отображаться в строке формул.

Очень удобно использовать эту функцию для ведения учета, накладных или когда вам просто нужно найти среднее значение из очень длинного ряда чисел. Поэтому ее часто используют в офисах и крупных компаниях. Это позволяет сохранять порядок в записях и дает возможность быстро посчитать что-либо (например, средний доход за месяц). Также с помощью Excel можно найти среднее значение функции.

Предположим, что нужно найти среднее число дней для выполнения задач, различными сотрудниками. Или вы хотите вычисление интервала времени 10 лет Средняя температура в определенный день. Вычисление среднего значения ряда чисел несколькими способами.

Среднее функция меры центральной тенденции, в которой находится центр ряда чисел в статистическое распределение. Три большинство общих критериями центральной тенденции выступают.

    Среднее Среднее арифметическое и вычисляется путем добавления ряда чисел и затем деления количества этих чисел. Например среднее значение 2, 3, 3, 5, 7 и 10 имеет 30, разделенных на 6, 5;

    Медиана Средний номер ряда чисел. Половина чисел имеют значения, которые больше, чем Медиана, а половина чисел имеют значения, которые меньше, чем Медиана. Например медиана 2, 3, 3, 5, 7 и 10 - 4.

    Режим Наиболее часто встречающееся число в группе чисел. Например режим 2, 3, 3, 5, 7 и 10 - 3.

Эти три меры центральной тенденции симметричную распределение ряда чисел, являются одни и те же. В асимметричное распределение ряда чисел они могут быть разными.

Вычисление среднего значения ячеек, расположенных непрерывно в одной строке или одном столбце

Выполните следующие действия.

Вычисление среднего значения ячеек, расположенных вразброс

Для выполнения этой задачи используется функция СРЗНАЧ . Скопируйте в приведенной ниже таблице на пустой лист.

Вычисление среднего взвешенного значения

СУММПРОИЗВ и сумм . Пример vThis вычисляет среднюю цену единицы измерения, оплаченная через три покупки, где находится каждый покупки для различное количество единиц измерения по различным ценам за единицу.

Скопируйте в приведенной ниже таблице на пустой лист.

Вычисление среднего значения чисел, без учета нулевых значений

Для выполнения этой задачи используются функции СРЗНАЧ и если . Скопируйте приведенную ниже таблицу и имейте в виду, что в этом примере чтобы проще было понять, скопируйте его на пустой лист.

В математике среднее арифметическое значение чисел (или просто среднее) - это сумма всех чисел в данном наборе, разделенная на их количество. Это наиболее обобщенное и распространенное понятие средней величины. Как вы уже поняли, чтобы найти среднее значение, нужно суммировать все данные вам числа, а полученный результат разделить на количество слагаемых.

Что такое среднее арифметическое?

Давайте рассмотрим пример.

Пример 1 . Даны числа: 6, 7, 11. Нужно найти их среднее значение.

Решение.

Для начала найдем сумму всех данных чисел.

Теперь разделим получившуюся сумму на количество слагаемых. Так как у нас слагаемых три, соответственно, мы будем делить на три.

Следовательно, среднее значение чисел 6, 7 и 11 - это 8. Почему именно 8? Да потому, что сумма 6, 7 и 11 будет такая же, как трех восьмерок. Это отлично видно на иллюстрации.

Среднее значение чем-то напоминает «выравнивание» ряда чисел. Как видите, кучки карандашей стали одного уровня.

Рассмотрим еще один пример, чтобы закрепить полученные знания.

Пример 2. Даны числа: 3, 7, 5, 13, 20, 23, 39, 23, 40, 23, 14, 12, 56, 23, 29. Нужно найти их среднее арифметическое значение.

Решение.

Находим сумму.

3 + 7 + 5 + 13 + 20 + 23 + 39 + 23 + 40 + 23 + 14 + 12 + 56 + 23 + 29 = 330

Делим на количество слагаемых (в этом случае - 15).

Следовательно, среднее значение данного ряда чисел равно 22.

Теперь рассмотрим отрицательные числа. Вспомним, как их суммировать. Например, у вас есть два числа 1 и -4. Найдем их сумму.

1 + (-4) = 1 – 4 = -3

Зная это, рассмотрим еще один пример.

Пример 3. Найти среднее значение ряда чисел: 3, -7, 5, 13, -2.

Решение.

Находим сумму чисел.

3 + (-7) + 5 + 13 + (-2) = 12

Так как слагаемых 5, разделим получившуюся сумму на 5.

Следовательно, среднее арифметическое значение чисел 3, -7, 5, 13, -2 равно 2,4.

В наше время технологического прогресса гораздо удобнее использовать для нахождения среднего значения компьютерные программы. Microsoft Office Excel - одна из них. Искать среднее значение в Excel быстро и просто. Тем более, эта программа входит в пакет программ от Microsoft Office. Рассмотрим краткую инструкцию, как найти среднее арифметическое значение с помощью этой программы.

Для того чтобы посчитать среднее значение ряда чисел, необходимо использовать функцию AVERAGE. Синтаксис для этой функции:
= Average (argument1, argument2, ... argument255)
где argument1, argument2, ... argument255 - это либо числа, либо ссылки на ячейки (под ячейками подразумеваются диапазоны и массивы).

Чтобы было более понятно, опробуем полученные знания.

  1. Введите числа 11, 12, 13, 14, 15, 16 в ячейки С1 – С6.
  2. Выделите ячейку С7, нажав на нее. В этой ячейке у нас будет отображаться среднее значение.
  3. Щелкните на вкладке «Формулы».
  4. Выберите More Functions > Statistical для того, чтобы открыть выпадающий список.
  5. Выберите AVERAGE. После этого должно открыться диалоговое окно.
  6. Выделите и перетащите туда ячейки С1–С6, чтобы задать диапазон в диалоговом окне.
  7. Подтвердите свои действия клавишей «ОК».
  8. Если вы все сделали правильно, в ячейке С7 у вас должен появиться ответ – 13,7. При нажатии на ячейку C7 функция (= Average (C1: C6)) будет отображаться в строке формул.

Очень удобно использовать эту функцию для ведения учета, накладных или когда вам просто нужно найти среднее значение из очень длинного ряда чисел. Поэтому ее часто используют в офисах и крупных компаниях. Это позволяет сохранять порядок в записях и дает возможность быстро посчитать что-либо (например, средний доход за месяц). Также с помощью Excel можно найти среднее значение функции.

Среднее арифметическое

У этого термина существуют и другие значения, см. среднее значение.

Сре́днее арифмети́ческое (в математике и статистике) множества чисел - сумма всех чисел, делённая на их количество. Является одной из наиболее распространённых мер центральной тенденции.

Предложена (наряду со средним геометрическим и средним гармоническим) ещё пифагорейцами.

Частными случаями среднего арифметического являются среднее (генеральной совокупности) и выборочное среднее (выборки).

Введение

Обозначим множество данных X = (x 1 , x 2 , …, x n ), тогда выборочное среднее обычно обозначается горизонтальной чертой над переменной (x ¯ {\displaystyle {\bar {x}}} , произносится «x с чертой»).

Для обозначения среднего арифметического всей совокупности используется греческая буква μ. Для случайной величины, для которой определено среднее значение, μ есть вероятностное среднее или математическое ожидание случайной величины. Если множество X является совокупностью случайных чисел с вероятностным средним μ, тогда для любой выборки x i из этой совокупности μ = E{x i } есть математическое ожидание этой выборки.

На практике разница между μ и x ¯ {\displaystyle {\bar {x}}} в том, что μ является типичной переменной, потому что видеть можно скорее выборку, а не всю генеральную совокупность. Поэтому, если выборку представлять случайным образом (в терминах теории вероятностей), тогда x ¯ {\displaystyle {\bar {x}}} (но не μ) можно трактовать как случайную переменную, имеющую распределение вероятностей на выборке (вероятностное распределение среднего).

Обе эти величины вычисляются одним и тем же способом:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n) . {\displaystyle {\bar {x}}={\frac {1}{n}}\sum _{i=1}^{n}x_{i}={\frac {1}{n}}(x_{1}+\cdots +x_{n}).}

Если X - случайная переменная, тогда математическое ожидание X можно рассматривать как среднее арифметическое значений в повторяющихся измерениях величины X . Это является проявлением закона больших чисел. Поэтому выборочное среднее используется для оценки неизвестного математического ожидания.

В элементарной алгебре доказано, что среднее n + 1 чисел больше среднего n чисел тогда и только тогда, когда новое число больше чем старое среднее, меньше тогда и только тогда, когда новое число меньше среднего, и не меняется тогда и только тогда, когда новое число равно среднему. Чем больше n , тем меньше различие между новым и старым средними значениями.

Заметим, что имеется несколько других «средних» значений, в том числе среднее степенное, среднее Колмогорова, гармоническое среднее, арифметико-геометрическое среднее и различные средне-взвешенные величины (например, среднее арифметическое взвешенное, среднее геометрическое взвешенное, среднее гармоническое взвешенное).

Примеры

  • Для трёх чисел необходимо сложить их и разделить на 3:
x 1 + x 2 + x 3 3 . {\displaystyle {\frac {x_{1}+x_{2}+x_{3}}{3}}.}
  • Для четырёх чисел необходимо сложить их и разделить на 4:
x 1 + x 2 + x 3 + x 4 4 . {\displaystyle {\frac {x_{1}+x_{2}+x_{3}+x_{4}}{4}}.}

Или проще 5+5=10, 10:2. Потому что мы складывали 2 числа, а значит, сколько чисел складываем, на столько и делим.

Непрерывная случайная величина

Для непрерывно распределённой величины f (x) {\displaystyle f(x)} среднее арифметическое на отрезке [ a ; b ] {\displaystyle } определяется через определённый интеграл:

F (x) ¯ [ a ; b ] = 1 b − a ∫ a b f (x) d x {\displaystyle {\overline {f(x)}}_{}={\frac {1}{b-a}}\int _{a}^{b}f(x)dx}

Некоторые проблемы применения среднего

Отсутствие робастности

Основная статья: Робастность в статистике

Хотя среднее арифметическое часто используется в качестве средних значений или центральных тенденций, это понятие не относится к робастной статистике, что означает, что среднее арифметическое подвержено сильному влиянию «больших отклонений». Примечательно, что для распределений с большим коэффициентом асимметрии среднее арифметическое может не соответствовать понятию «среднего», а значения среднего из робастной статистики (например, медиана) может лучше описывать центральную тенденцию.

Классическим примером является подсчёт среднего дохода. Арифметическое среднее может быть неправильно истолковано в качестве медианы, из-за чего может быть сделан вывод, что людей с большим доходом больше, чем на самом деле. «Средний» доход истолковывается таким образом, что доходы большинства людей находятся вблизи этого числа. Этот «средний» (в смысле среднего арифметического) доход является выше, чем доходы большинства людей, так как высокий доход с большим отклонением от среднего делает сильный перекос среднего арифметического (в отличие от этого, средний доход по медиане «сопротивляется» такому перекосу). Однако, этот «средний» доход ничего не говорит о количестве людей вблизи медианного дохода (и не говорит ничего о количестве людей вблизи модального дохода). Тем не менее, если легкомысленно отнестись к понятиям «среднего» и «большинство народа», то можно сделать неверный вывод о том, что большинство людей имеют доходы выше, чем они есть на самом деле. Например, отчёт о «среднем» чистом доходе в Медине, штат Вашингтон, подсчитанный как среднее арифметическое всех ежегодных чистых доходов жителей, даст на удивление большое число из-за Билла Гейтса. Рассмотрим выборку (1, 2, 2, 2, 3, 9). Среднее арифметическое равно 3.17, но пять значений из шести ниже этого среднего.

Сложный процент

Основная статья: Окупаемость инвестиций

Если числа перемножать , а не складывать , нужно использовать среднее геометрическое, а не среднее арифметическое. Наиболее часто этот казус случается при расчёте окупаемости инвестиций в финансах.

Например, если акции в первый год упали на 10 %, а во второй год выросли на 30 %, тогда некорректно вычислять «среднее» увеличение за эти два года как среднее арифметическое (−10 % + 30 %) / 2 = 10 %; правильное среднее значение в этом случае дают совокупные ежегодные темпы роста, по которым годовой рост получается только около 8,16653826392 % ≈ 8,2 %.

Причина этого в том, что проценты имеют каждый раз новую стартовую точку: 30 % - это 30 % от меньшего, чем цена в начале первого года, числа: если акции в начале стоили $30 и упали на 10 %, они в начале второго года стоят $27. Если акции выросли на 30 %, они в конце второго года стоят $35.1. Арифметическое среднее этого роста 10 %, но поскольку акции выросли за 2 года всего на $5.1, средний рост в 8,2 % даёт конечный результат $35.1:

[$30 (1 - 0.1) (1 + 0.3) = $30 (1 + 0.082) (1 + 0.082) = $35.1]. Если же использовать таким же образом среднее арифметическое значение 10 %, мы не получим фактическое значение: [$30 (1 + 0.1) (1 + 0.1) = $36.3].

Сложный процент в конце 2 года: 90 % * 130 % = 117 % , то есть общий прирост 17 %, а среднегодовой сложный процент 117 % ≈ 108.2 % {\displaystyle {\sqrt {117\%}}\approx 108.2\%} , то есть среднегодовой прирост 8,2 %.

Направления

Основная статья: Статистика направлений

При расчёте среднего арифметического значений некоторой переменной, изменяющейся циклически (например, фаза или угол), следует проявлять особую осторожность. Например, среднее чисел 1° и 359° будет равно 1 ∘ + 359 ∘ 2 = {\displaystyle {\frac {1^{\circ }+359^{\circ }}{2}}=} 180°. Это число неверно по двум причинам.

  • Во-первых, угловые меры определены только для диапазона от 0° до 360° (или от 0 до 2π при измерении в радианах). Таким образом, ту же пару чисел можно было бы записать как (1° и −1°) или как (1° и 719°). Средние значения каждой из пар будут отличаться: 1 ∘ + (− 1 ∘) 2 = 0 ∘ {\displaystyle {\frac {1^{\circ }+(-1^{\circ })}{2}}=0^{\circ }} , 1 ∘ + 719 ∘ 2 = 360 ∘ {\displaystyle {\frac {1^{\circ }+719^{\circ }}{2}}=360^{\circ }} .
  • Во-вторых, в данном случае, значение 0° (эквивалентное 360°) будет геометрически лучшим средним значеним, так как числа отклоняются от 0° меньше, чем от какого-либо другого значения (у значения 0° наименьшая дисперсия). Сравните:
    • число 1° отклоняется от 0° всего на 1°;
    • число 1° отклоняется от вычисленного среднего, равного 180°, на 179°.

Среднее значение для циклической переменной, рассчитанное по приведённой формуле, будет искусственно сдвинуто относительно настоящего среднего к середине числового диапазона. Из-за этого среднее рассчитывается другим способом, а именно, в качестве среднего значения выбирается число с наименьшей дисперсией (центральная точка). Также вместо вычитания используется модульное расстояние (то есть, расстояние по окружности). Например, модульное расстояние между 1° и 359° равно 2°, а не 358° (на окружности между 359° и 360°==0° - один градус, между 0° и 1° - тоже 1°, в сумме - 2°).

Средневзвешенное значение - что это и как его вычислить?

В процессе изучения математики школьники знакомятся с понятием среднего арифметического. В дальнейшем в статистике и некоторых других науках студенты сталкиваются и с вычислением других средних значений. Какими они могут быть и чем отличаются друг от друга?

Средние величины: смысл и различия

Не всегда точные показатели дают понимание ситуации. Для того чтобы оценить ту или иную обстановку, нужно подчас анализировать огромное количество цифр. И тогда на помощь приходят средние значения. Именно они позволяют оценить ситуацию в общем и целом.

Со школьных времен многие взрослые помнят о существовании среднего арифметического. Его очень просто вычислить - сумма последовательности из n членов делится на n. То есть если нужно вычислить среднее арифметическое в последовательности значений 27, 22, 34 и 37, то необходимо решить выражение (27+22+34+37)/4, поскольку в расчетах используется 4 значения. В данном случае искомая величина будет равна 30.

Часто в рамках школьного курса изучают и среднее геометрическое. Расчет данного значения базируется на извлечении корня n-ной степени из произведения n-членов. Если брать те же числа: 27, 22, 34 и 37, то результат вычислений будет равен 29,4.

Среднее гармоническое в общеобразовательной школе обычно не является предметом изучения. Тем не менее оно используется довольно часто. Эта величина обратна среднему арифметическому и рассчитывается как частное от n - количества значений и суммы 1/a 1 +1/a 2 +...+1/a n . Если снова брать тот же ряд чисел для расчета, то гармоническое составит 29,6.

Средневзвешенное значение: особенности

Однако все вышеперечисленные величины могут быть использованы не везде. Например, в статистике при расчете некоторых средних значений важную роль имеет "вес" каждого числа, используемого в вычислениях. Результаты являются более показательными и корректными, поскольку учитывают больше информации. Эта группа величин носит общее название "средневзвешенное значение". Их в школе не проходят, поэтому на них стоит остановиться поподробнее.

Прежде всего, стоит рассказать, что подразумевается под "весом" того или иного значения. Проще всего объяснить это на конкретном примере. Два раза в день в больнице происходит замер температуры тела у каждого пациента. Из 100 больных в разных отделениях госпиталя у 44 будет нормальная температура - 36,6 градусов. У еще 30 будет повышенное значение - 37,2, у 14 - 38, у 7 - 38,5, у 3 - 39, и у двух оставшихся - 40. И если брать среднее арифметическое, то эта величина в общем по больнице будет составлять больше 38 градусов! А ведь почти у половины пациентов совершенно нормальная температура. И здесь корректнее будет использовать средневзвешенное значение, а "весом" каждой величины будет количество людей. В этом случае результатом расчета будет 37,25 градусов. Разница очевидна.

В случае средневзвешенных расчетов за "вес" может быть принято количество отгрузок, число работающих в тот или иной день людей, в общем, все что угодно, что может быть измерено и повлиять на конечный результат.

Разновидности

Средневзвешенное значение соотносится со средним арифметическим, рассмотренным в начале статьи. Однако первая величина, как уже было сказано, учитывает также вес каждого числа, использованного в расчетах. Помимо этого существуют также средневзвешенное геометрическое и гармоническое значения.

Имеется еще одна интересная разновидность, используемая в рядах чисел. Речь идет о взвешенном скользящем среднем значении. Именно на его основе рассчитываются тренды. Помимо самих значений и их веса там также используется периодичность. И при вычислении среднего значения в какой-то момент времени также учитываются величины за предыдущие временные отрезки.

Расчет всех этих значений не так уж и сложен, однако на практике обычно используется только обычное средневзвешенное значение.

Способы расчета

В век повальной компьютеризации нет необходимости вычислять средневзвешенное значение вручную. Однако нелишним будет знать формулу расчета, чтобы можно было проверить и при необходимости откорректировать полученные результаты.

Проще всего будет рассмотреть вычисление на конкретном примере.

Необходимо узнать, какая же средняя оплата труда на этом предприятии с учетом количества рабочих, получающих тот или иной заработок.

Итак, расчет средневзвешенного значения производится с помощью такой формулы:

x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

Для примера же вычисление будет таким:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Очевидно, что нет особых сложностей с тем, чтобы вручную рассчитать средневзвешенное значение. Формула же для вычисления этой величины в одном из самых популярных приложений с формулами - Excel - выглядит как функция СУММПРОИЗВ (ряд чисел; ряд весов)/СУММ (ряд весов).

Как найти среднее значение в excel?

как найти среднее арифметическое в excel?

Владимир09854

Проще простого. Для того, чтобы найти среднее значение в excel, понадобится всего лишь 3 ячейки. В первую мы запишем одно число, во вторую - другое. А в третьей ячейке мы забьем формулу, которая нам выдаст среднее значение между этими двумя числами из первой и второй ячейки. Если ячейка №1 называется А1, ячейка №2 называется B1, то в ячейке с формулой нужно записать так:

Такой формулой вычисляется среднее арифметическое двух чисел.

Для красоты наших обсчетов можно выделить ячейки линиями, в виде таблички.

Есть еще в самом экселе функция определения среднего значения, но я пользуюсь дедовским методом и ввожу нужную мне формулу. Таким образом я уверен, что эксель посчитает именно так как мне надо, а не придумает какое-то там свое округление.

M3sergey

Это очень просто, если данные уже внесены в ячейки. Если вас интересует просто число, достаточно выделить нужный диапазон /диапазоны, и внизу справа в строке состояния появится значение суммы этих чисел, их среднее арифметическое и их количество.

Можно выделить пустую ячейку, нажать на треугольничек (раскрывающийся список) "Автосумма" и выбрать там "Среднее", после чего согласится с предложенным диапазоном для расчета, или выбрать свой.

Наконец, можно воспользоваться формулами напрямую - нажать "Вставить функцию" рядом со строкой формул и адресом ячейки. Функция СРЗНАЧ находится в категории "Статистические", и принимает в качестве аргументов как числа, так и ссылки на ячейки и др. Там же можно выбрать более сложные варианты, например, СРЗНАЧЕСЛИ - расчет среднего по условию.

Найти среднее значение в excel является довольно простой задачей. Здесь нужно понимать - хотите ли вы использовать это среднее значение в каких-то формулах или нет.

Если вам нужно получить только значение, то достаточно выделить необходимый диапазон чисел, после чего excel автоматически посчитает среднее значение - оно будет выводится в строке состояния, заголовок "Среднее".

В том случае, когда вы хотите использовать полученный результат в формулах, можно поступить так:

1) Суммировать ячейки с помощью функции СУММ и разделить всё это на количество чисел.

2) Более правильный вариант - воспользоваться специальной функцией, которая называется СРЗНАЧ. Аргументами данной функции могут быть числа, заданные последовательно, либо диапазон чисел.

Владимир тихонов

обводите значения, которые будут участвовать в расчёте,нажимаете вкладку "Формулы", там увидите слева есть "Автосумма" и рядом с ней треугольник, направленный вниз. щёлкаете на этот треугольник и выбираете "Среднее". Вуаля, готово) внизу столбика увидите среднее значение:)

Екатерина муталапова

Начнём сначала и по порядку. Что значит среднее значение?

Среднее значение - это значение, которое является средним арифметическим значением, т.е. вычисляется сложением набора чисел с последующим делением всей суммы чисел на их количество. Например, для чисел 2, 3, 6, 7, 2 будет 4 (сумму чисел 20 делим на их количество 5)

В таблице Excel лично мне, проще всего было пользоваться формулой =СРЗНАЧ. Чтобы рассчитать среднее значение, необходимо ввести данные в таблицу, под столбцом данных написать функцию =СРЗНАЧ(), а в скобках указываем диапазон чисел в ячейках, выделив столбец с данными. После этого нажимаем ВВОД, либо просто кликаем левой кнопкой мышки на любой ячейке. Результат отобразится в ячейке под столбцом. С виду описано непонятно, но по факту - минутное дело.

Искатель приключений 2000

Программа Ecxel является многообразной, поэтому есть несколько вариантов, которые позволят вам найти средние значение:

Первый вариант. Вы просто суммируете все ячейки и делите на их количество;

Второй вариант. Воспользоваться специальной командой, напишете в требуемой ячейки формулу "=СРЗНАЧ(а тут укажите диапазон ячеек)";

Третий вариант. Если вы выделите требуемый диапазон, то обратите внимание, что на страничке внизу, также выводится среднее значение в данных ячейках.

Таким образом, способов найти среднее значение очень много, вам просто нужно выбрать оптимальный для вас и пользоваться им постоянно.

В Excel c помощью функции СРЗНАЧ можно рассчитать среднее арифметическое простое. Для этого нужно вбить ряд значений. Нажать равно и выбрать в Категории Статистические, среди которых выбрать функцию СРЗНАЧ

Также с помощью статистических формул можно рассчитать среднее арифметическое взвешенное, которое считается более точным. Для его расчета нам понадобятся значения показателя и частота.

Как найти среднее значение в Excel?

Ситуация такая. Имеется следующая таблица:

В столбиках, закрашенных красным цветом содержатся численные значения оценок по предметам. В столбце "Средний балл" требуется подсчитать их среднее значение.
Проблема вот в чем: всего предметов 60-70 и часть из них на другом листе.
Я смотрела в другом документе уже подсчитано среднее, а в ячейке стоит формула типа
="имя листа"!|Е12
но это делал какой-то программист, которого уволили.
Подскажите, пожалуйста, кто разбирается в этом.

Гектор

В строке фцнкций вставляешь из предложеннвх функций "СРЗНАЧ" и выбираешь откуда те надо высчитать (B6:N6) для Иванова, к примеру. Про соседние листы точно не знаю, но наверняка это содержится в стандартной виндовской справке

Подскажите как вычислить среднее значение в ворде

Подскажите пожалуйста как вычислить среднее значение в ворде. А именно среднее значение оценок, а не количества людей получивших оценки.

Юля павлова

Word может многое с помощью макросов. Нажми ALT+F11 и пиши программу-макрос..
Кроме того Вставка-Объект...позволит использовать другие программы, хоть Excel, для создания листа с таблицей внутри Word-документа.
Но в данном случае тебе надо в колонке таблицы записать твои числа, а в нижнюю ячейку той же колонки занести среднее, правильно?
Для этого в нижнюю ячейку вставляешь поле.
Вставка-Поле... -Формула
Содержимое поля
[=AVERAGE(ABOVE)]
выдает среднее от суммы выше лежащих ячеек.
Если поле выделить и нажать правую кнопку мыши, то его можно Обновлять, если числа изменились,
просматривать код или значение поля, изменять код непосредственно в поле.
Если что-то испортится, удали всё поле в ячейке и создай заново.
AVERAGE означает среднее, ABOVE - около, то есть ряд выше лежащих ячеек.
Всё это я не знала сама, но легко обнаружила в HELP, разумеется, немного соображая.

В 1906 году великий ученый и известный специалист по евгенике Фрэнсис Гальтон посетил ежегодную выставку достижений животноводства и птицеводства в западной Англии, где совершенно случайно провел интересный эксперимент.

Как отмечает Джеймс Суровецки, автор книги «Мудрость толпы», на ярмарке Гальтона заинтересовало одно соревнование, в рамках которого люди должны были угадать вес забитого быка. Назвавший наиболее близкое к истинному число объявлялся победителем.

Гальтон был известен своим презрением к интеллектуальным способностям обычных людей. Он считал, что только настоящие эксперты смогут сделать точные утверждения о весе быка. А 787 участников соревнования не были экспертами.

Ученый собирался доказать некомпетентность толпы, вычислив среднее число из ответов участников. Каково же было его удивление, когда оказалось, что полученный им результат почти в точности соответствовал настоящему весу быка!

Среднее значение — позднее изобретение

Конечно, точность ответа поразила исследователя. Но еще более примечательным является тот факт, что Гальтон вообще догадался воспользоваться средним значением.

В сегодняшнем мире средние, и так называемые медианные показатели встречаются на каждом шагу: средняя температура в Нью-Йорке в апреле равняется 52 градусам по Фаренгейту; Стивен Карри в среднем зарабатывает 30 очков за игру; медианный семейный доход в США составляет $51 939/год.

Однако же идея о том, что множество различных результатов можно репрезентировать одним числом, довольна нова. До 17-ого века средние числа вообще не использовались.

Каким же образом появилась и развилась концепция средних и медианных значений? И как ей удалось стать главной измерительной методикой в наше время?

Преобладание средних значений над медианными имело далеко идущие последствия для на нашего понимания информации. И нередко оно приводило людей в заблуждение.

Среднее и медианное значения

Представьте, что вы рассказываете историю о четырех людях, ужинавших прошлым вечером с вами в ресторане. Одному из них вы бы дали 20 лет, другому — 30, третьему — 40, а четвертому — 50. Что вы скажете об их возрасте в своей истории?

Скорее всего, вы назовете их средний возраст.

Среднее значение часто используется для передачи информации о чем-либо, а также для описания некоего множества измерений. Технически, среднее значение — это то, что математики называют «средним арифметическим» — сумма всех измерений, разделенная на число измерений.

Хотя слово «среднее» (average) часто используется как синоним слова «медианное» (median), последним чаще обозначается середина чего-либо. Это слово происходит от латинского «medianus», что значит «середина».

Медианное значение в Древней Греции

История медианного значения берет свое начало с учения древнегреческого математика Пифагора. Для Пифагора и его школы медиана имела четкое определение и сильно отличалась от того, как мы понимаем среднее значение сегодня. Оно использовалось только в математике, а не в анализе данных.

В школе пифагорейцев медианное значение было средним числом в трехчленной последовательности чисел, находящемся в «равном» отношении с соседними членами. «Равное» отношение могло означать одинаково расстояние. Например, число 4 в ряду 2,4,6. Однако оно также могло выражать геометрическую прогрессию, например 10 в последовательности 1,10,100.

Статистик Черчилль Эйзенхарт объясняет, что в Древней Греции, медианное значение не использовалось в качестве репрезентирующего или заменяющего какой-либо набор чисел. Оно просто обозначало середину, и часто использовалось в математических доказательствах.

Эйзенхарт посвятил целых десять лет изучению среднего и медианного значений. Изначально он пытался отыскать репрезентирующую функцию медианы в ранних научных построениях. Однако вместо этого он обнаружил, что большинство ранних физиков и астрономов опирались на единичные, умело проведенные измерения, и у них не было методологии, позволявшей выбрать лучший результат среди множества наблюдений.

Современные исследователи основывают свои выводы на сборе больших объемов данных, как, например, биологи, изучающие человеческий геном. Древние ученые же могли провести несколько измерений, но выбирали лишь самое лучшее для построения своих теорий.

Как писал историк астрономии Отто Нойгебауэр, «это согласуется с осознанным стремлением античных людей минимизировать количество эмпирических данных в науке, потому что они не верили в точность непосредственных наблюдений».

Например, греческий математик и астроном Птолемей вычислил угловой диаметр Луны, используя метод наблюдения и теорию движения земли. Его результат был равен 31’20. Сегодня же мы знаем, что диаметр Луны колеблется от 29’20 до 34’6 в зависимости от расстояния от Земли. Птолемей в своих вычислениях использовал мало данных, но у него были все основания полагать, что они были точными.

Эйзенхарт пишет: «Необходимо иметь в виду, что связь между наблюдением и теорией в античности была иной, нежели сегодня. Результаты наблюдений понимались не как факты, под которые должна подстраиваться теория, но как конкретные случаи, которые могут быть полезны лишь в качестве иллюстративных примеров истинности теории»

В конце концов, ученые обратятся к репрезентативным измерениям данных, но изначально ни средние, ни медианные значения не использовались в этой роли. Со времен античности до сегодняшнего дня в качестве такого репрезентативного средства использовался другой математический концепт — полусумма крайних значений.

Полусумма крайних значений

Новые научные средства почти всегда возникают из необходимости решить определенную задачу в какой-либо дисциплине. Необходимость найти лучшее значение среди множества измерений возникло из потребности точно определить географическое положение.

Интеллектуальный гигант 11-ого века Аль-Бируни известен как один из первых людей, использовавших методологию репрезентирующих значений. Аль-Бируни писал, что когда в его распоряжении было множество измерений, и он хотел найти лучшее среди них, он использовал следующее «правило»: нужно отыскать число, соответствующее середине между двумя крайними значениями. При вычислении полусуммы крайних значений не принимаются во внимание все числа между максимальным и минимальным значениями, а находится среднее только для этих двух чисел.

Аль-Бируни применял этот метод в разных областях, в том числе для вычисления долготы города Газни, что находится на территории современного Афганистана, а также в своих исследованиях свойств металлов.

Однако в последние несколько веков полусумма крайних значений используется все реже. На самом деле, в современной науке она и вовсе не актуальна. На место полусуммы пришло медианное значение.

Переход к средним значениям

К началу 19-ого века использование медианного/среднего значения стало распространенным методом нахождения наиболее точно репрезентирующего значения из группы данных. Фридрих фон Гаусс, выдающийся математик своего времени, в 1809-ом году писал: «Считалось, что если некоторое число было определено несколькими прямыми наблюдениями, совершенными в одинаковых условиях, то среднее арифметическое значение является наиболее истинным значением. Если оно и не совсем строгое, то, по крайней мере, оно близко к действительности, и поэтому на него всегда можно положиться».

Почему произошел подобный сдвиг в методологии?

На этот вопрос довольно трудно ответить. В своем исследовании Черчилль Эйзенхарт предполагает, что метод нахождения среднего арифметического мог зародиться в области измерения магнитного отклонения, то есть в отыскании отличия между направлением стрелки компаса, указывающей на север, и реальным севером. Это измерение было крайне важным в эпоху Великих Географических Открытий.

Эйзенхарт выяснил, что до конца 16-ого века большинство измерявших магнетическое отклонение ученых использовали метод ad hoc (от лат. «к этому, для данного случая, для этой цели») при выборе наиболее точного измерения.

Но в 1580-ом году ученый Уильям Боро подошел к проблеме иначе. Он взял восемь различных измерений отклонения и, сравнив их, пришел к выводу, что наиболее точное значение было между 11 ⅓ и 11 ¼ градусами. Вероятно, он вычислил среднее арифметическое, которое находилось в этом диапазоне. Однако сам Боро открыто не называл свой подход новым методом.

До 1635-ого года вообще не было однозначных случаев использования среднего значения в качестве репрезентирующего числа. Однако именно тогда английский астроном Генри Геллибренд взял два различных результата измерения магнетического отклонения. Одно из них было сделано утром (11 градусов), а другое — днем (11 градусов и 32 минуты). Вычисляя наиболее истинное значение, он писал:

«Если мы найдем среднее арифметическое, мы с большой вероятностью можем утверждать, что результат точного измерения должен быть около 11 градусов 16 минут».

Вполне вероятно, что это был первый случай использования среднего значения как наиболее близкого к истинному!

Слово «среднее» (average) применялось в английском языке в начале 16-ого века для обозначения финансовых потерь от ущерба, которое получило судно или перевозимый груз во время плавания. В течение следующих ста лет оно обозначало именно эти потери, которые высчитывались как среднее арифметическое. Например, если корабль во время плавания был поврежден, и команде приходилось выбрасывать за борт некоторые товары, чтобы сохранить вес судна, инвесторы несли финансовые потери, эквивалентные сумме их инвестиции — эти потери вычислялись так же, как среднее арифметическое. Так постепенно значения среднего (average) и среднего арифметического сближались.

Медианное значение

В наши дни среднее значение или среднее арифметическое используются как основной способ для выбора репрезентативного значения множества измерений. Как же это произошло? Почему эта роль не была отведена медианному значению?

Френсис Гальтон был чемпионом медианного значения

Термин «медианное значение» (median) — средний член в ряде чисел, разделяющий этот ряд наполовину — появился примерно в то же время, что и среднее арифметическое. В 1599-ом году математик Эдвард Райт, работавший над проблемой нормального отклонения в компасе, впервые предложил использовать медианное значение.

«…Допустим, множество лучников стреляют в некоторую мишень. Цель впоследствии убирают. Каким образом можно узнать, где была цель? Нужно найти среднее место между всеми стрелами. Аналогично, среди множества результатов наблюдений ближе всего к истине будет то, которое находится посередине».

Медианное значение широко использовалось в девятнадцатом столетии, став обязательной частью любого анализа данных в то время. Им также пользовался и Френсис Гальтон, выдающийся аналитик девятнадцатого века. В истории о взвешивании быка, рассказанной вначале этой статьи, Гальтон изначально использовал медианное значение как представляющее мнение толпы.

Множество аналитиков, включая Гальтона, предпочитали медианное значение, поскольку его легче рассчитать для небольших наборов данных.

Тем не менее, медианное значение никогда не было более популярным, чем среднее. Скорее всего, это произошло из-за особых статистических свойств, присущих среднему значению, а также его отношения к нормальному распределению.

Связь среднего значения и нормального распределения

Когда мы проводим множество измерений, их результаты, как говорят статистики, «нормально распределены». Это значит, что если эти данные нанести на график, то точки на нем будут изображать нечто похожее на колокол. Если их соединить, получится «колоколообразная» кривая. Нормальному распределению соответствуют многие статистические данные, например, рост людей, показатель интеллекта, а также показатель самой высокой годовой температуры.

Когда данные нормально распределены, среднее значение будет очень близким к высшей точке на колоколообразной кривой, и очень большое количество измерений будет близким к среднему значению. Существует даже формула, предсказывающая, как много результатов измерений будут находиться на некотором расстоянии от среднего значения.

Таким образом, вычисление среднего значения дает исследователям много дополнительной информации.

Связь среднего значения со стандартным отклонением дает ему большое преимущество, ведь у медианного значения такой связи нет. Эта связь — важная часть анализа экспериментальных данных и статистической обработки информации. Именно поэтому среднее значение стало ядром статистики и всех наук, полагающихся в своих заключениях на множественные данные.

Преимущество среднего значения также связано с тем, что оно легко вычисляется компьютерами. Хотя медианное значение для небольшой группы данных довольно легко вычислить самостоятельно, все же намного проще написать компьютерную программу, которая находила бы среднее значение. Если вы пользуетесь Microsoft Excel, то наверняка знаете, что медианную функцию не так просто рассчитать, как функцию среднего значения.

В итоге, благодаря большому научному значению и простоте использования среднее значение стало главной репрезентативной величиной. Тем не менее, этот вариант далеко не всегда является самым лучшим.

Преимущества медианного значения

Во многих случаях, когда мы хотим вычислить центральное значение распределения, медианное значение является лучшим показателем. Так происходит потому, что среднее значение во многом определяется крайними результатами измерений.

Многие аналитики считают, что бездумное использование среднего значения отрицательно сказывается на нашем понимании количественной информации. Люди смотрят на среднее значение и думают, что это «норма». Но на самом деле оно может быть определено каким-нибудь одним сильно выдающимся из однородного ряда членом.

Представьте себе аналитика, желающего узнать репрезентативное значение для стоимости пяти домов. Четыре дома стоят $100,000, а пятый — $900,000. Среднее значение, таким образом, будет равняться $200,000, а медианное — $100,000. В этом, как и во многих других случаях, медианное значение дает лучшее понимание того, что можно назвать «стандартом».

Понимая, насколько сильно крайние значения могут сказаться на среднем, для отражения изменений в семейных доходах США используется медианное значение.

Медианные показатель также менее чувствителен к «грязным» данным, с которыми сегодня имеют дело аналитики. Многие статистики и аналитики собирают информацию, опрашивая людей в интернете. Если пользователь случайно добавит в ответ лишний ноль, который превратит 100 в 1000, то эта ошибка намного сильнее скажется на среднем значении, чем на медианном.

Среднее или медианное?

Выбор между медианным и средним значением имеет далеко идущие последствия — от нашего понимания влияния лекарств на здоровье до знаний относительно того, какой семейный бюджет можно назвать стандартным.

Поскольку сбор и анализ данных все больше определяет то, как мы понимаем мир, растет и значение используемых нами величин. В идеальном мире аналитики использовали бы и среднее, и медианное значение для графического выражения данных.

Но мы живем в условиях ограниченного времени и внимания. Из-за этих ограничений часто нам необходимо выбрать лишь что-то одно. И во многих случаях предпочтительней именно медианное значение.