Наиболее часто встречающееся значение признака. Основные статистические категории. Средние показатели ряда динамики, их расчёт

входные, выходные промежуточные данные, обрабатываемые процессором.

Структура оперативной памяти

Оперативная память состоит из ячеек, в каждой из которых может находиться единица информации – машинное слово. Каждая ячейка имеет две характеристики: адрес и содержимое. Через регистр адреса микропроцессора можно обратиться к любой ячейке памяти.

Сегментная модель памяти

Когда-то давно, на заре рождения компьютерной техники, оперативная память была очень маленькой и для ее адресации использовались 2 байта (так называемое «слово»). Такой подход позволял адресовать 64 Кб памяти, и адресация была линейной - для указания адреса использовалось одно-единственное число. Позже, с усовершенствованием техники, производители поняли, что имеется возможность поддерживать большие объемы памяти, но для этого нужно сделать размер адреса больше. Для совместимости с уже написанным программным обеспечением было решено сделать так: адресация теперь двухкомпонентная (сегмент и смещение) , каждая из которых 16-битная, а старые программы как использовали одну 16-битную компоненту и ничего не знают о сегментах, так и продолжают работать


Изм.
Лист
№ докум.
Подпись
Дата
Лист
ППП ПИ 23.00.00 ТО
Логическое строение оперативной памяти

Адресное пространство – это набор адресов, который может формировать процессор. Зачем? Хороший вопрос. Дело в том, что каждая ячейка памяти имеет адрес. И что бы считать (или записать) хранимую в ней информацию, надобно к ней обратится по ее адресу. Адреса делятся на виртуальные (логические) и физические. Физические адреса – это реальные адреса реальных ячеек памяти. Программам глубоко параллельно до таких адресов, так как они оперируют символьными именами, которые затем транслятором преобразовываются в виртуальные адреса. Потом виртуальные адреса преобразовываются в физические.



Логические адреса представляются в шестнадцатеричной форме и состоят из двух частей. Логически оперативная память разделена на сегменты. Так вот первая часть логического адреса – начало сегмента, а вторая – смещение от этого начала (сегмент, смещение)

Логическое строение делится на 5 зон:

1. Conventional memory – основная память;

Начинается с адреса 00000 (0000:0000) и до 90000 (9000:0000). Это занимает 640 Кбайт. В эту область грузится в первую очередь таблица векторов прерываний, начиная с 00000 и занимает 1 Кбайт, далее следуют данные из BIOS (счетчик таймера, буфер клавиатуры и т. д.), а затем уж всякие 16 разрядные программы DOS (для них 640 Кбайт – барьер, за который могут выскочить только 32 разрядные программы). На данные BIOS’а отводится 768 байт.
2. UMA (Upper Memory Area) – верхняя память;

Начинается с адреса А0000 и до FFFFF. Занимает она 384 Кбайт. Сюда грузится информация, связанная с аппаратной частью компьютера. UMA можно разделить на 3 части по 128 Кбайт. Первая часть (от А0000 до BFFFF) предназначена для видеопамяти. В следующую часть (от C0000 до DFFFF) грузятся программы BIOS адаптеров. Последняя часть (от E0000 до FFFFF) зарезервирована для системной BIOS. Дело в том, что последние 128 Кбайт не полностью используются. В большинстве случаев под BIOS задействованы только последние 64 Кбайт. Свободная же часть UMB управляется драйвером EMM386.EXE и используется для нужд операционной системы.
3. HMA (High Memory Area) – область верхней памяти;

Изм.
Лист
№ докум.
Подпись
Дата
Лист
ППП ПИ 23.00.00 ТО
История появления области HMA тянется аж к 80286 процессору, а точнее к ошибке в его схеме. Я уже говорил, что процессоры 8086 и 8087 имели 20 разрядную адресную шину, работали в реальном режиме и могли максимально обратится по адресу FFFFF (FFFF:000F). А вот 80286 процессор имел уже 24 разрядную шину адреса, работал в реальном и защищенном режимах и мог адресовать до 16 Мбайт памяти.
4. XMS (eXtended Memory Specification) – дополнительная память;

Что бы работать в XMS используя DOS, для процессоров был разработан еще один режим – виртуальный. DOS не может переплюнуть барьер в 640 Кбайт, виртуальный режим позволяет разбить дополнительную память на части по

1 Мбайту. В каждую часть грузится по программе DOS и там они варятся в реальном режиме но уже не мешая друг другу выполнятся одновременно. 32 разрядным приложениям на барьер в 640 Кбайт все равно. XMS отвечает за перевод режимов процессора драйвер EMM386.EXE, а за организацию самой области – HIMEM.SYS. Посмотреть, что творится у Вас в XMS можно с помощью SysInfo из набора Norton Utilities.
5. EMS (Expanded Memory Specification) – расширенная память;

Находится эта область в верхней памяти и занимает порядка 64 Кбайт. Использовалась она лишь в старых компах с оперативной памятью до

1 Мбайта. В силу своей спецификации это достаточно медленная область. Дело в том, что расширенная память – это один из многих коммутируемых сегментов. После того, как сегмент заполнится, происходит смена использованного сегмента новым. Но работать можно только с одним сегментом, а это, Вы сами должны понимать, не совсем хорошо, удобно и быстро. Как правило первый сегмент EMS находится по адресу D000.

Логическое строение оперативной памяти в графическом виде.

Изм.
Лист
№ докум.
Подпись
Дата
Лист
ППП ПИ 23.00.00 ТО

4. DRAM – Dynamic Random Access Memory

DRAM - это очень старый тип микросхем оперативной памяти, который сейчас уже давно не применяется. По другому DRAM – это динамическая память с произвольным порядком выборки. Минимальной единицей информации при хранении или передаче данных в компьютере является бит. Каждый бит может быть в двух состояниях: включен (да, 1) или выключен (нет, 0). Любой объем информации в конечном итоге состоит из включенных и выключенных битов. Таким образом, что бы сохранить или передать какой либо объем данных, необходимо сохранить или передать каждый бит, не зависимо от его состояния, этих данных.


Для хранения битов информации в оперативной памяти есть ячейки. Ячейки состоят из конденсаторов и транзисторов. Вот примерная и упрощенная схема ячейки DRAM:

Каждая ячейка способна хранить только один бит. Если конденсатор ячейки заряжен, то это означает, что бит включен, если разряжен – выключен. Если необходимо запомнить один байт данных, то понадобится 8 ячеек (1 байт = 8 битам). Ячейки расположены в матрицах и каждая из них имеет свой адрес, состоящий из номера строки и номера столбца.

Изм.
Лист
№ докум.
Подпись
Дата
Лист
ППП ПИ 23.00.00 ТО

Теперь рассмотрим, как происходит чтение. Сначала на все входы подается сигнал RAS (Row Address Strobe) – это адрес строки. После этого, все данные из этой строки записываются в буфер. Затем на регистр подается сигнал CAS (Column Address Strobe) – это сигнал столбца и происходит выбор бита с соответствующим адресом. Этот бит и подается на выход. Но во время считывания данные в ячейках считанной строки разрушаются и их необходимо перезаписать взяв из буфера.

Теперь запись. Подается сигнал WR (Write) и информация поступает на шину столбца не из регистра, а с информационного входа памяти через коммутатор, определенный адресом столбца. Таким образом, прохождение данных при записи определяется комбинацией сигналов адреса столбца и строки и разрешения записи данных в память. При записи данные из регистра строки на выход не поступают.

Следует учесть то, что матрицы с ячейками расположены вот таким вот образом:

Изм.
Лист
№ докум.
Подпись
Дата
Лист
ППП ПИ 23.00.00 ТО

Это означает, что за один раз будет считан не один бит, а несколько. Если параллельно расположено 8 матриц, то сразу считан будет один байт. Это называется разрядностью. Количество линий, по которым будут передаваться данные от (или на) параллельных матриц, определяется разрядностью шины ввода/вывода микросхемы.
Говоря о работе DRAM необходимо учитывать один момент. Все заключается в том, что конденсаторы не могут бесконечно долго хранить заряд и он в конце концов «стекает», Поэтому конденсаторы необходимо перезаряжать. Операция перезарядки называется Refresh или регенерацией. Происходит эта операция примерно каждые 2 мс и порой занимает до 10 % (а то и больше) рабочего времени процессора.

Важнейшей характеристикой DRAM является быстродействие, а проще говоря продолжительность цикла + время задержки + время доступа, где продолжительность цикла – время, затраченное на передачу данных, время задержки – начальная установка адреса строки и столбца, а время доступа – время поиска самой ячейки. Измеряется эта фигня в наносекундах (одна миллиардная доля секунды). Современные микросхемы памяти имеют быстродействие ниже 10 мс.

Оперативной памятью управляет контроллер, который находится в чипсете материнской платы, а точнее в той его части, которая называется North Bridge.


Изм.
Лист
№ докум.
Подпись
Дата
Лист
ППП ПИ 23.00.00 ТО

А теперь поняв как работает оперативная память, разберемся, зачем же она вообще нужна. После процессора, оперативную память можно считать самым быстродействующим устройством. Поэтому основной обмен данными и происходит между этими двумя девайсами. Вся информация в персональном компьютере хранится на жестком диске. При включении компа в ОЗУ (Оперативное Запоминающее Устройство) с винта записываются драйвера, специальные программы и элементы операционной системы. Затем туда будут записаны те программы – приложения, которые Вы будете запускать. При закрытии этих программ они будут стерты из ОЗУ. Данные, записанные в оперативной памяти, передаются в CPU (Central Processing Unit), там обрабатываются и записываются обратно. И так постоянно: дали команду процессору взять биты по таким то адресам, как то их там обработать и вернуть на место или записать на новое – он так и сделал.

Все это хорошо, до тех пор, пока ячеек ОЗУ хватает. А если нет? Тогда в работу вступает файл подкачки. Этот файл расположен на жестком диске и туда записывается все, что не влезает в ячейки оперативной памяти. Поскольку быстродействие винта значительно ниже ОЗУ, то работа файла подкачки сильно замедляет работу системы. Кроме этого, это снижает долговечность самого жесткого диска.

Увеличение объема памяти не приводит к увеличению ее быстродействия. Изменение объема памяти ни как не повлияет на ее работу. А вот если рассматривать работу системы, то тут дело другое. В том случае, если Вам хватает объема оперативной памяти, то увеличение объема не приведет к увеличению скорости работы системы. Если же ячеек ОЗУ не хватает, то увеличение их количества (проще говоря добавление новой или замене старой на новую с большим объемом линейки памяти) приведет к ускорению работы системы.

Изм.
Лист
№ докум.
Подпись
Дата
Лист
ППП ПИ 23.00.00 ТО

Изм.
Лист
№ докум.
Подпись
Дата
Лист
ППП ПИ 23.00.00 ТО
Интернет ресурсы

http://nikesina.ucoz.ru/

http://www.whatis.ru/

http://wiki.mvtom.ru/

http://www.teryra.com/

http://smartronix.ru/

http://allrefs.net/

http://sonikelf.ru/

http://beginpc.ru/

Список литературы

Практическое руководство системного администратора. (2012)

Эндрю Таненбаум, Тодд Остин - Архитектура компьютера (2013)

В прошлом уроке, и поняли, что она знает многое, кто не понял, забыл или прошел мимо, может перейти по ссылке и освежить свои знания)). Но в теории статистики есть еще одно очень интересное изречение. В мире есть три вида лжи – ложь, наглая ложь и… СТАТИСТИКА!!!

Совершенно противоречивое утверждение другое – статистика знает все . Но отчасти в нем есть доля правды. Все дело в данных, которые были собраны для обработки.

Но об этом поговорим позже…

Однако вернемся к статистическим категориям. Категории или основные статистические термины важная часть науки. И дело здесь в том, что эти термины регулярно употребляются в процессе обработки и анализа данных. Именно в этом кроется их такая важность для статистической науки.

Статистическая совокупность – это группа социально-экономических объектов или явлений общественной жизни объединенных общей связью, но отличающихся друг от друга отдельными признаками. Это наиболее часто встречающее определение совокупности. Включает в себя ее особенности, и что очень важно и другие статистические категории. Попытаемся упростить или понять, что же такое совокупность на примере.
Совокупность это некоторое объединение элементов или явлений или людей и т.п. Мало того что в совокупности как правило много частей или элементом (всегда больше одного), так еще все они в чем-то похожи. Так вот эта похожесть и есть признак, по которому объединили эти элементы. Общее у элементов одно, и масса других характеристик отличающихся.



Вот небольшой такой пример. На картинке у нас изображены условно люди. Это совокупность людей – по этому признаку их и объединили в совокупность. Однако все мы разные и у нас масса признаков, которые отличают нас друг от друга – пол, возраст, образование, семейное положение, уровень доходов, место жительства и так далее.
Вообще в совокупность можно объединить разные элементы, лишь бы было что изучать:
— совокупность школьников – общее учатся в школе, а различия пол, возраст, класс, место учебы и многое другое;
— совокупность деревьев в лесу – общее это деревья, различия возраст, разновидность дерева, высота и т.п.;
— совокупность предприятий – общее предприятия, различия, отрасль, число работников, объем выпуска, объем прибыли и др.
И таких примеров можно привести огромное количество.

Задание. Предположим на картинке представлена совокупность студентов. Опишите ее, почему она является совокупностью, какие есть признаки у студентов. Нет ли на картинке лишних элементов, не относящихся к данной совокупности?

И последний очень важный термин вариация!
Вариация – это колебания признака статистической совокупности. В статистике говорят – признак колеблется или ВАРЬИРУЕТСЯ.
Вариация признака это основа статистической науке. Не было бы вариации, не было бы статистики. Именно потому что признаки изменяются и происходит их изучении. Если не было бы изменений и отличий и все было одинаковым, то изучать было бы нечего и статистики не было.

А дальше мы перейдем к . Но прежде домашние задания.

Контрольное задание. Приведите примеры двух трех совокупностей, выделите в них единицы совокупности и охарактеризуйте их признаками. Приведите пример статистических показателей и вариации признака.

Доклад – Органы государственной статистики в РФ – функции, задачи, структура. – Федеральная служба государственной статистики — http://www.gks.ru/

Среднее есть абстрактная типическая характеристика всей совокупности. Оно уничтожает, погашает, сглаживает случайные и неслучайные колебания, влияние индиви­дуальных особенностей и позволяет представить в одной величине, некоторую общую характеристику реальной совокупности единиц. Основное условие научного использования средних заключается в том, чтобы каждое среднее характеризовало такую совокупность единиц, которая в существенном отношении, и в первую очередь в отношении осредняемых значений признака, была бы качественно однородной. Среди всего многообразия средних практически наибо­лее часто используемой считается среднее арифметическое.

Среднее арифметическое. Среднее арифметическое есть частное от деления суммы всех значений признака на их число. Обознача­ется оно х. Формула для вычисления имеет вид

По следующим данным вычислим среднее число газет, читаемых ежедневно индивидами в выборке, из 10 человек:

Формула (1) для сгруппированных данных преобразуется в следующую:

где n t - частота для i -го значения признака.

Если находят среднюю для интервального ряда.распределения, то в качестве значения признака для каждого интервала условно принимают его середину.

Процедуру вычисления среднего по сгруппированным данным удобно выполнять по следующей схеме (табл. 3).

Существует ряд упрощенных приемов вычисления средних. На с. 163 как промежуточный этап рассмотрено вычисление среднего методом отсчета от условного нуля.

Пример. Вышеприведенные данные о количестве прочитанных газет (см. с. 159) сгруппируем следующим образом:

Медиана. Медианой называется значение признака у той еди­ницы совокупности, которая расположена в середине ряда частот­ного распределения.

Если в ряду четное число членов (2k), то медиана равна средне­му арифметическому из двух серединных значений признака. При нечетном числе членов (2k+ 1) медианным будет значение призна­ка у (k + 1) объекта.

Предположим, что в выборке из 10 человек респонденты проранжированы по стажу работы на данном предприятии:

Серединные ранги 5 и 6, поэтому медиана равна

В интервальном ряду с различными значениями частот вычисление медианы распадается на два этапа: сначала находят медиан­ный интервал, которому соответствует первая из накопленных ча­стот, превышающая половину всего объема совокупности, а затем находят значение медианы по формуле

где Х0 - начало (нижняя граница) медианного интервала; d - ве­личина медианного интервала; n = Sn t - сумма частот (относитель­ных частот) интервалов; n н - частота (относительная), накоплен­ная до медианного интервала; n мe - частота (относительная) меди­анного интервала.


Проведем вычисление по данным табл. 2, где в нижней строке приведены накопленные относительные частоты. Первая из них, превышающая половину совокупности (100/2 = 50%), равна 57,9%. Следовательно, медиана принадлежит интервалу 3-4 года. По­этому

Таким образом, для данной выборки медиана, равная 3,7 года, показывает, что 50% семей имеют соотношение возрастов, меньшее этой величины, а другие 50%-большее. Медиана может быть легко определена графически по кумуляте распределения (см. рис. 3).

Медиана может быть применена для дискретных переменных, хотя дробные значения часто не имеют непосредственной содержа­тельной интерпретации.

По данным распределения рабочих по тарифным разрядам см. с. 156) вычислим медиану этого распределения, используя приведенную выше формулу 1 8 . Получим

Узнали, что 50% рабочих имеют разряд, меньший 3,1, и 50%-больший.

Медиана, как уже отмечалось, делит упорядоченный вариацион­ный ряд на две равные по численности группы.

Наряду с медианой можно рассматривать величины, называемые квантилями, которые делят ряд распределения на 4 равные части, на 10 и т. д.

Квантили, которые делят ряд на 4 равные по объему совокупно­сти, называются квартилями. Различают нижний Q1/4 и верхний квартили (рис. 6). Величина Q 1/2 является медианой. Вычисле­ние квартилей совершенно аналогично вычислению медианы:

где х 0 - минимальная граница интервала, содержащего нижний (верхний) квартиль; n н - частота (относительная частота), накоп­ленная до квартального интервала; n Q - частота (относительная частота) квартального интервала; d - величина квартального ин­тервала.

Процентили делят множество наблюдений на 100 частей с рав­ным числом наблюдений в каждой. Децили делят множество наблю­дений на десять равных частей. Квантили легко вычисляются по распределению накопленных частот (по кумуляте).

Мода. Модой в статистике называется наиболее часто встречаю­щееся значение признака, т. е. значение, с которым наиболее веро­ятно можно встретиться в серии зарегистрированных наблюдений. В дискретном ряду мода (Мо) - это значение с наибольшей частотой.

В интервальном ряду (с равными интервалами) модальным яв­ляется класс с наибольшим числом наблюдений. Значение моды находится в его пределах и вычисляется по формуле

где х 0 - нижняя граница модального интервала; d - величина ин­тервала; n- - частота интервала, предшествующего модальному; n Мо - частота модального класса; n + - частота интервала, следую­щего за модальным.

В совокупностях, в которых может быть произведена лишь опе­рация классификации объектов по какому-нибудь качественному признаку, вычисление моды является единственный способом ука­зать некий центр тяжести совокупности.

К недостаткам моды следует отнести следующие: невозможность совершать над ней алгебраические действия; зависимость ее величи­ны от интервала группировки; возможность существования в ряду распределения нескольких модальных значений признака (см., например, рис. 4, в).

Сравнение средних . Целесообразность использования того или иного типа средней величины зависит по крайней мере от следующих условий: цели усреднения, вида распределения, уровня измерения признака, вычислительных соображений. Цель усреднения свя­зана с содержательной трактовкой рассматриваемой задачи. Однако форма распределения может существенно усложнить исследование средних. Если для симметричного распределения (см. рис. 4, а) мода, медиана и среднее арифметическое тождественны, то для асимметричного распределения это не так. На выбор средней мо­жет повлиять и вид распределения. Например, для ряда с откры­тыми конечными интервалами нельзя вычислять среднее арифмети­ческое, но если распределение близко к симметричному, можно под­считать тождественную ему в этом случае медиану.


1. Средние величины: сущность, значение, виды

Важный вклад в обоснование и развитие теории средних величин внес крупный ученый XIX века Адольф Кетле (1796-1874), член Бельгийской академии наук, член-корреспондент Петербургской академии наук.

Средняя величина - обобщающая характеристика изучаемого признака в исследуемой совокупности. Она определяет его типичный уровень в расчёте на единицу совокупности в конкретных условиях места и времени.

Средняя величина всегда именованная, имеет ту же размерность (единицу измерения), что и признак у отдельных единиц совокупности.

Основным условием научного использования средней величины является качественная однородность совокупности, по которой исчислена средняя.

    степенные (средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратическая, средняя кубическая);

    структурные (мода, медиана).

Степенная средняя – корень степени k из средней всех вариантов, взятых в k –й степени, имеет следующий вид:

где – признак, по которому находится средняя, называется осредняемым признаком,

х i или (х 1 , х 2 …х n ) – величина осредняемого признака у каждой единицы совокупности,

f i – повторяемость индивидуального значения признака.

В зависимости от степени k получаются различные виды степенных средних, формулы расчета которых показаны ниже в таблице 1.

Таблица 1 – Виды степенных средних

Значение k

Наименование средней

Формулы средней

взвешенная

Средняя гармоническая

, w i = x i · f i

Средняя геометрическая

Средняя арифметическая

=

=

Средняя квадратическая

=

=

f i частота повторения индивидуального значения признака (его вес)

Весом может быть и частотость, т.е. отношение частоты повторения индивидуального значения признака к сумме частот:

Выбор вида средней величины:

Средняя арифметическая простая применяется в случае, если индивидуальное значение признака у единиц совокупности на повторяется или встречается одни раз или одинаковое число раз, т.е. когда средняя рассчитывается по несгруппированным данным.

Когда отдельное значение изучаемого признака встречается несколько раз у единиц изучаемой совокупности, тогда частота повторения индивидуальных значений признака (вес) присутствует в расчетных формулах степенных средних. В этом случае они называются формулами взвешенных средних .

Если по условию задачи необходимо, чтобы неизменной оставалась при осреднении суммы величин, обратных, индивидуальным значениям признака, то средняя величина является гармонической средней .

Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменным произведение индивидуальных величин, то следует применить среднюю геометрическую . Средняя геометрическая используется для расчета средних темпов роста в анализе рядов динамики.

Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин, то средняя будет являться квадратической средней величиной . Средняя квадратическая используется для расчета среднего квадратического отклонения при анализе вариации признака в рядах распределения.

Степенные средние разных видов, исчисленные по одной и той же совокупности, имеют различные количественные и чем больше показатель степени k , тем больше и величина соответствующей средней, если все исходные значения признака равны, то и все средние равны этой постоянной:

Гарм. ≤ геом. ≤ арифм. ≤ кв. ≤ куб.

Это свойство степенных средних возрастать с повышением показателя степени определяющей функции называется мажорантностью средних .

Структурные средние применяют в том случае, когда расчет степенных средних невозможен или нецелесообразен.

К структурным средним относят: моду и медиану .

Мода – это наиболее часто встречающееся значение признака у единиц данной совокупности. При наличии вариантов и частот в ряду распределения величина моды соответствует значению признака у наибольшего числа единиц (наибольшей частоте), т.е. для дискретного вариационного ряда мода находится по определению.

Медиана – значение признака у единицы совокупности в середине ранжированного ряда распределения, когда все индивидуальные значения признака изучаемых единиц расположены в порядке их возрастания или убывания.

В случае нечетного числа наблюдений медиана находится по определению, т.е. вариант (где n – число наблюдений). При четном числе наблюдений медиана определяется по формуле:

Для интервального ряда распределения величина моды и медианы рассчитываются по следующим формулам:
;
,

где: - нижняя граница модального или медианного интервала;

- величина интервала;

и
- частоты, предшествующие и следующие за модальным интервалом;

- частота модального или медианного интервала;

- сумма накопленных частот в интервалах, предшествующих медианному.

Расчет медианы по несгруппированным данным производится следующим образом:

1. Индивидуальные значения признака располагаются в возрастающем порядке. 2. Определяется порядковый номер медианы № Ме = (n +1) / 2

    Показатели вариации, сущность, значение, виды. Законы вариации

Для измерения вариации признака применяются различные абсолютные и относительные показатели.

К абсолютным показателям (мера) вариации относятся: размах колебаний, среднее абсолютное отклонение, дисперсия, среднее квадратическое отклонение.

Размах вариации – это разность между максимальным и минимальным значениями признака:
.

Размах вариации показывает, в каких пределах колеблется размер признака, образующего ряд распределения

Среднее абсолютное отклонение (САО) - средняя из абсолютных значений отклонений отдельных вариант от средней.

(простая),
(взвешенная)

Дисперсия- средняя из квадратов отклонений вариантов значений признака от их средней величины:

(простая),
(взвешенная)

Дисперсия может быть разложена на составные элементы, позволяющих оценить влияние различных факторов, обуславливающих вариацию признака

т.е. дисперсия равна разности между средним квадратом значений признака и квадратом средней.

Свойства дисперсии, позволяющие упростить способ ее вычисления:

    Дисперсия постоянной величины равна 0.

    Если все варианты значений признака уменьшить на одно и то же число раз, то дисперсия не уменьшится.

    Если все варианты значений признака уменьшить в одно и то же число раз (k раз), то дисперсия уменьшится в k 2 раз.

Среднее квадратическое отклонение (СКО) представляет собой корень квадратный из дисперсии, показывает насколько в среднем колеблется величина признака у единиц изучаемой совокупности: =

СКО является мерилом надежности. Чем меньше СКО, тем лучше средняя арифметическая отражает собой всю представляемую совокупность.

Размах вариации, САО, СКО являются величинами именованными, т.е. имеют те же единицы измерения, что и индивидуальные значения признака.

Существуют 4 вида дисперсии: общая, межгрупповая, внутригрупповая, групповая.

Дисперсию, вычисляемую для всей совокупности в целом называют общей дисперсией. Она измеряет колеблемость зависимого признака (результатного), вызванную действием на него всех без исключения факторов.

Общая дисперсия равна сумме средней из внутригрупповой и межгрупповой дисперсии:

Если совокупность разбита на группы, то для каждой группы может быть определена своя дисперсия, характеризующая вариацию внутри группы. Групповая дисперсия – средние квадратические отклонения от групповой средней, т.е. от средней величины признака в данной группе.

где j – порядковый номер x и f в пределах группы.

Групповая дисперсия характеризует вариацию признака в пределах группы за счет всех прочих факторов, кроме положенного в основании группировки.

Измерение вариации по совокупности в целом, исчисляем как среднюю из внутригрупповых дисперсии:

где – групповые дисперсии,

n j – число единиц в группах.

Групповые средние отличаются одна от другой и от общей средней, т.е. варьируют. Их вариацию называют межгрупповой вариацией. Для ее характеристики исчисляют средний квадрат отклонений групповых средних от общей средней:

где j групповые средние, – общая средняя, n j – число единиц в группе.

Межгрупповая дисперсия (дисперсия групповых средних) измеряет вариацию результатного признака за счет факторного признака, положенного в основании группировки.

При сравнении колеблемости различных признаков в одной и той же совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной средней арифметической пользуются относительными показателями вариации.

Эти показатели вычисляются как отношение абсолютных показателей вариации к средней арифметической (или медиане)

Коэффициент вариации

Относительное линейное отклонение

Коэффициент осцилляции

Наиболее часто применяемый показатель относительной колеблемости – коэффициент вариации , который показывает среднее отклонение от среднего значения признака в процентах.

Его используют для: сравнительной оценки вариации; характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%, т.е. меньше 33%.

Законы вариации .

Закон вариации индивидуальных значений признака или «правило трех сигм». Бельгийский статистик А.Кетле обнаружил, что вариации некоторых массовых явлений подчиняются закону распределения ошибок, открытому К.Гауссом и П. Лапласом почти одновременно. Кривая, отображающая это распределение, имеет вид колокола (рис.2).

По нормальному закону (термин предложен английским статистиком К.Пирсоном) распределения колеблемость индивидуальных значений признака находится в пределах
(правило трех сигм).

Нормальному закону распределения подчиняются естественные свойства человека (рост, вес, физическая сила), характеристики промышленных изделий (размер, вес, электрическое сопротивление, упругость и т.п.). В сфере быстроизменяющихся общественных явлений действие этого закона проявляется сравнительно редко. Однако, в ряде случаев, использование правила трех сигм практически возможно.

Закон вариации средних величин . Вариация средних величин меньше вариации индивидуальных значений признака. Средние значения признака изменяются в пределах:
, где n – число единиц.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

хорошую работу на сайт">

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Задача 1

В некотором регионе в текущем году было совершено 12 390 преступлений, а в предыдущем году - 11 800 преступлений. Вычислите (в %) темп роста и темп прироста количества преступлений, зарегистрированных в текущем году по отношению к предыдущему. Рассчитайте также коэффициенты преступности за каждый год, если численность населения региона в конце предыдущего года составляла 1 475 000, а в конце текущего года - 1 770 000 чел. Сделайте выводы о динамике преступности в регионе.

Решение: Для получения точной картины преступности огромное значение имеет такой показатель преступности, как динамика, то есть изменение во времени. Динамика преступности характеризуется понятиями абсолютный рост (или снижение) и темпы роста и прироста преступности, для определения которых производится вычисление этих характеристик согласно определенным формулам.

Темпы роста преступности рассчитываются на основе базисных показателей динамики, что предполагает сопоставление данных за ряд лет (а иногда десятилетий, если нужен широкий охват материала) с постоянным базисом, под которым понимается уровень преступности в начальном для анализа периоде. Такой расчет позволяет криминологам в значительной мере гарантировать сопоставимость относительных показателей, вычисляемых в процентах, которые показывают, каким образом соотносится преступность последующих периодов с предыдущим.

В расчете за 100 % принимаются данные исходного года; показатели, полученные за последующие годы, отражают только процент прироста, что делает расчет точным, а картину более объективной; при оперировании относительными данными удается исключить влияние на снижение или рост преступности увеличения или снижения численности жителей, достигших возраста уголовной ответственности.

Темп прироста преступности вычисляется в процентах. Темп прироста преступности показывает, насколько увеличился или уменьшился последующий уровень преступности по сравнению с предыдущим периодом. Принято условное обозначение вектора темпа прироста: если процентное соотношение возрастает, ставится знак "плюс", если снижается - ставится знак "минус".

Применительно к условиям нашей задаче следует применить соответствующие формулы и вычислить рост и прирост преступности.

1) Темп роста преступности исчисляется по формуле^

Тр=U/U2 * 100 %,

где U - показатель уровня преступности, а U2 - показатель уровня преступности предшествующего периода. Так темп роста преступности по условиям задачи составит - 12390/11800*100 %=1,05 %.

2) Темп прироста преступности рассчитывается по следующей формуле:

Тпр=Тр-100 %.

Так темп прироста по условиям задачи составит 1,05 %-100 %= 98,95 %.

Коэффициент преступности - это конкретный обобщающий показатель общего количества учтенных преступлений, соотнесенного с численностью населения. Он расшифровывается как число преступлений на 100 тыс., 10 тыс. или 1 тыс. населения и является объективным измерителем преступности, позволяющим сопоставлять ее уровни в разных регионах и в разные годы.

Коэффициент преступности помогает более адекватно оценить и динамику уровня преступности, рассчитанного на душу населения.

Коэффициент преступности рассчитывается по формуле:

КП = (П х 100000): Н,

где П - абсолютное число учтенных преступлений; а Н - абсолютная численность всего населения.

Оба показателя берутся в одном и том же территориальном и временном объеме. Число преступлений обычно рассчитывается на 100 тыс. населения. Но при малых числах преступлений и населения (в городе, районе, на предприятии) коэффициент преступности может рассчитываться на 10 тыс. или на 1 тыс. жителей. в любом случае эти числа означают размерность рассматриваемого коэффициента, которая обязательно указывается: число преступлений на 100 тыс. или 10 тыс. населения.

Рассчитаем коэффициент преступности применительно к условиям нашей задачи:

1) КП= (12390*100000): 1 770 000 чел. = 700 (в текущем году).

2) КП= (11800*100000): 1 475 000 = 800 (в предыдущем году).

Преступность в регионе снижается, поскольку, анализируя коэффициент преступности, можно сделать вывод, что при увеличении населения в регионе (на 16,6 %), и незначительном увеличении количества преступлений на 1,05 %, в целом прирост преступности снижается (-98,95 %).

Задача 2

Возраст 11 молодых специалистов учреждения, принятых на службу, в текущем году составил соответственно 19,25,21,23,23,23,25,20,18,20,21 лет. Произведите сводку и группировку данных в виде статистической таблицы частот. Для наглядности постройте полигон частот, а также найдите модальное, медианное и среднее значение возраста принятых сотрудников.

Решение: Группировка - это разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка - это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.

Метод группировки основывается на следующих категориях - это группировочный признак, интервал группировки и число групп.

Группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы.

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе.

Определение числа групп .

Число групп приближенно определяется по формуле Стэрджесса:

n = 1 + 3,2log n = 1 + 3,2log(11) = 4.

Ширина интервала составит:

Xmax - максимальное значение группировочного признака в совокупности. Xmin - минимальное значение группировочного признака. Определим границы группы.

Номер группы

Нижняя граница

Верхняя граница

Одно и тоже значение признака служит верхней и нижней границами двух смежных (предыдущей и последующей) групп.

Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.

№ совокупности

Частота fi

Полигон частоты - это график плотности и вероятности случайной величины, представляет собой ломанную соединяющую точки, соответствующие срединным значениям интервалов группировки частотам этих интервалов.

Среднее значение :

Мода льное значение. Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

где x 0 - начало модального интервала; h - величина интервала; f 2 - частота, соответствующая модальному интервалу; f 1 - предмодальная частота; f 3 - послемодальная частота.

Выбираем в качестве начала интервала 19.75, так как именно на этот интервал приходится наибольшее количество.

Наиболее часто встречающееся значение ряда - 20.92.

Медиана . Медиана делит выборку на две части: половина вариант меньше медианы, половина - больше.

В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 19.75-21.5, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).

Таким образом, 50 % единиц совокупности будут меньше по величине 21.28.

Задача 3

Определите требуемый объем выборки для исследования среднего возраста аттестованных сотрудников ФСИН России при условии, что среднее квадратическое отклонение составляет 10 лет, а максимально допустимая ошибка выборки не должна превышать 5 %.

Решение ищем по формуле определения численности выборки для повторного отбора.

Ф(t) = г/2 = 0.95/2 = 0.475 и этому значению по таблице Лапласа соответствует t=1.96.

Оценка среднеквадратического отклонения s = 10; ошибка выборки е = 5.

Задача 4

В следующей таблице даны официальные ведомственные статистические сведения о распределении осужденных по срокам заключения (наказания) за 2002-2011 годы, размещенные на официальном сайте ФСИН России: www.fsin.su. Найдите размах и коэффициент вариации количества осужденных за каждый календарный год и сделайте выводы об однородности структуры данного статистического признака.

Основным показателем, характеризующим однородность данных, является коэффициент вариации. В статистике принято считать, что, если значение коэффициента менее 33 %, то совокупность данных является однородной, если более 33 %, то - неоднородной.

Коэффициент вариации

Поскольку v ? 30 %, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять.

Срок наказания

От 1 до 3 лет

От 3 до 5 лет

От 5 до 10 лет

От 10 до 15 лет

Свыше 15 лет

Максимальное значение (функция МАКС)

Минимальное значение (функция МИН)

Размах вариации

Среднее значение (функция СРЗНАЧ)

Среднее квадратическое отклонение (функция СТАНДАР ЛОНА)

Коэффициент вариации

Простая средняя :

Мода льное значение

Медиана

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 70580. Следовательно, медиана Me = 70580.

Показатели вариации . .

R = X max - X min .

R = 295916-2250 = 293666.

Среднее линейное отклонение

Каждое значение ряда отличается от другого в среднем на 90895.71.

Дисперсия

(средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 103008 в среднем на 107169.83.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>

или

Коэффициент осцилляции

Простая средняя :

Мода

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 76186. Следовательно, медиана Me = 76186.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min

R = 291112-3101 = 288011.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 83422.69.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 97334.29 в среднем на 100750.25.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя :

Мода льное значение. Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 71093. Следовательно, медиана Me = 71093.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min

R = 243852-3856 = 239996.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 68998.08.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 85765.57 в среднем на 82541.55.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

:

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 74588. Следовательно, медиана Me = 74588.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min ,

R = 242984-5304 = 237680.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 73148.73.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 92104.14 в среднем на 82873.1.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 76678. Следовательно, медиана Me = 76678

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 249346-6536 = 242810.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 79680.53.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 99551.71 в среднем на 87389.04.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 76461. Следовательно, медиана Me = 76461.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 254722-6704 = 248018.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 82302.82.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 102346.71 в среднем на 89787.88.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 78959. Следовательно, медиана Me = 78959.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 261334-7635 = 253699.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 83791.55.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 104898.86 в среднем на 91616.15.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 75916. Следовательно, медиана Me = 75916.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 263863-8145 = 255718.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 82767.96.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 103440.71 в среднем на 91207.92.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 78019. Следовательно, медиана Me = 78019.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min

R = 260094-7798 = 252296.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 77827.76.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 99212.29 в среднем на 88081.39.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Простая средняя арифметическая :

Мода . Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Мода отсутствует (все значения ряда индивидуальные).

Медиана . Медиана - значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда.

Находим середину ранжированного ряда: h = (n+1) / 2 = (7+1) / 2 = 4. Этому номеру соответствует значение ряда 72248. Следовательно, медиана Me = 72248.

Показатели вариации . Абсолютные показатели вариации .

Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда.

R = X max - X min .

R = 242137-7173 = 234964.

Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.

Каждое значение ряда отличается от другого в среднем на 70459.02.

Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Среднее квадратическое отклонение (средняя ошибка выборки).

Каждое значение ряда отличается от среднего значения 91375.14 в среднем на 80674.43.

Относительные показатели вариации . К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.

Коэффициент вариации - мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.

Поскольку v>70 %, то совокупность приближается к грани неоднородности, а вариация сильная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична. В таком случае при практических исследованиях различными статистическими приемами приводят совокупность к однородному виду.

Линейный коэффициент вариации или Относительное линейное отклонение - характеризует долю усредненного значения признака абсолютных отклонений от средней величины.

Коэффициент осцилляции - отражает относительную колеблемость крайних значений признака вокруг средней.

Задача 5

В условиях предыдущей задачи произведите перегруппировку заданных интервалов сроков наказания с целью улучшения относительных показателей вариации признака в 2010 году. Постройте гистограммы распределения осужденных по срокам заключения (наказания) за 2010 год до и после произведенной группировки данных и сделайте выводы об однородности структуры исследуемого статистического признака.

Решение:

Поскольку v>30 %, но v<70 %, то вариация умеренная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична.

Совершим перегруппировку данных следующим образом:

В группу 1) входит группы: до года, год, от 1-3 лет соответственно 156978.

В группу 2) входит от группы свыше 3 до 5 лет полностью и 1\5 от группы свыше 5 до 10 лет получаем 1\5*260094+168651=220669,8.

В группу 3) входит 3\5 группы от 5 до 10 т.е. 3\5*260094=156056,4.

Группа 4) (1\5*260094)+(1\5*78019)=67622,6.

Группа 5) 3\5*78019=46811,4.

Группа 6 30744+(1\5*78019)=46347,8.

Гистограмма. Для получения вывода о однородности исследуемого статистического признака Вычислим коэффициент вариации:

Поскольку v>30 %, но v<70 %, то вариация умеренная.

Коэффициент вариации значительно больше 33 %. Следовательно, рассмотренная совокупность неоднородна и средняя для нее недостаточна типична.

Задача 6

Изложить в краткой форме (тезисно, на 1-2 страницах) содержание и результаты недавнего официального статистического исследования в социально-правовой сфере (тематика - на Ваш выбор, ссылки на Интернет-ресурсы - обязательны), сделать выводы и выдвинуть соответствующие статистические гипотезы на краткосрочную перспективу.

В качестве официального статистического исследования было взято исследование о просроченной задолженности по заработной плате на 1 декабря 2015 года.

На 1 декабря 2015 г., по сведениям организаций (не относящихся к субъектам малого предпринимательства), суммарная задолженность по заработной плате по кругу наблюдаемых видов экономической деятельности составила3900 млн. рубл ей и по сравнению с 1 ноября 2015 г. увеличилась на 395 млн. рублей (на 11,3 %).

Просроченная задолженность по заработной плате из-за отсутствия у организаций собственных средств на 1 декабря 2015г. составила3818 млн. рубл ей , или 97,9 % общей суммы просроченной задолженности. По сравнению с 1 ноября 2015г. она увеличилась на 389 млн. рублей (на 11,3 %). Задолженность из-за несвоевременного получения денежных средств из бюджетов всех уровней составила82 млн. рубл ей и увеличилась по сравнению с 1 ноября 2015г. на 6 млн. рублей (на 7,7 %), в том числе задолженность из федерального бюджета составила 62 млн. рублей и снизилась по сравнению с 1 ноября 2015г. на 6 млн. рублей (на 8,6 %),бюджетов субъектов Российской Федерации составила 1,1 млн. рублей (увеличение на 0,2 млн. рублей или на 20,7 %), местных бюджетов - 19 млн. рублей (увеличение на 12 млн. рублей, или в 2,5 раза).

В добыче полезных ископаемых, обрабатывающих производствах, здравоохранении и предоставлении социальных услуг, рыболовстве и рыбоводстве 100 % просроченной задолженности по заработной плате образовано из-за нехватки у организаций собственных средств.

В общем объеме просроченной задолженности по заработной плате 37 % приходится на обрабатывающие производства, 29 % - на строительство, 9 % - на производство и распределение электроэнергии, газа и воды, 7 % - на транспорт, 6 % - на добычу полезных ископаемых, 5 % - на сельское хозяйство, охоту и предоставление услуг в этих областях, лесозаготовки.

Объем просроченной задолженности по заработной плате на 1 декабря 2015г. составил менее 1 % месячного фонда заработной платы работников наблюдаемых видов экономической деятельности.

Задолженность по заработной плате за последний месяц , за который производились начисления, в общем объеме просроченной задолженности составила в среднем 29 %: производстве и распределении электроэнергии, газа и воды - 75 %, деятельности в области образования - 37 %, здравоохранения и предоставления социальных услуг - 35 %, научных исследований и разработок - 32 %, строительства - 29 %, транспорта - 23 %, обрабатывающих производствах - 22 %.

Из общей суммы невыплаченной заработной платы на долги, образовавшиеся в 2014г.,приходится 457 млн. рублей (11,7 %), в 2013г. и ранее - 657 млн. рублей (16,8 %).

В целом наблюдая картину задолженности по заработной плате в динамике (http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image 5258.gif), можно сделать вывод что значительный спад придется на январь, февраль 2016 года.

Основной процент задолженности приходится на обрабатывающие производства - 37 %, 29 % - на строительство скорее всего это происходит в связи со снижением потребительского спроса на продукцию, соответственно уменьшается прибыль.

Выдвинем гипотезу. С января 2016 года процент задолженности будет сокращаться, в связи с распределением годового бюджета на будущий год с учетом частичного погашения задолженности по заработной плате, и составит 2700 млн. динамика преступность вариация медианное

Для проверки гипотезы (За основу берем данный таблицы http://www.gks.ru/bgd/free/B04_03/IssWWW.exe/Stg/d06/Image5258.gif).

Построим дискретный вариационный ряд. Для этого отсортируем ряд по возрастанию и подсчитаем количество повторения для каждого элемента ряда.

Вычислим среднюю:

Вычислим дисперсию. Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).

Используя односторонний критерий с б = 0,05, проверить эту гипотезу, если в выборке из n =24 месяца средний показатель оказался равным 2741,25, а дисперсия известна и равна у =193469,27

Решение . Среднеквадратическое отклонение:

Выдвигается нулевая гипотеза H 0 о том, что значение математического ожидания генеральной совокупности равно числу м 0: = 2700.

Альтернативная гипотеза:

H 1: м? 2700, критическая область - двусторонняя.

Для проверки нулевой гипотезы используется случайная величина:

где x - выборочное среднее; S - среднеквадратическое отклонение генеральной совокупности.

Если нулевая гипотеза верна, то случайная величина T имеет стандартное нормальное распределение. Критическое значение статистики T определяется исходя из вида альтернативной гипотезы:

P(|T|

Найдем экспериментальное значение статистики T:

Поскольку объем выборки достаточно большой (n>30), то вместо истинного значения среднеквадратического отклонения можно использовать его оценку S=439.851.

Ф(t кр)=(1-б)/2 = (1-0.05)/2 = 0.475.

По таблице функции Лапласа найдем, при каком t kp значение Ф(t kp) = 0.475.

Экспериментальное значение критерия T не попало в критическую область T ? t kp , поэтому нулевую гипотезу следует принять. Значение математического ожидания генеральной совокупности можно принять равным 2700

Список используемой литературы

1. Казанцев С.Я. Правовая статистика: Учебник / Под ред. С.Я. Казанцева, С.Я. Лебедева - М.: ЮНИТИ-ДАНА: Закон и право, 2009 г.

2. Курыс?в К.Н. Основы правовой статистики: учеб. пособие / К.Н. Курыс?в; ВЮИ ФСИН России. - Владимир, 2005. - 44 с.

3. Макарова Н.В. Статистика в Exсel: учеб. пособие / Н.В. Макарова, В.Я. Трофимец. - М.: Финансы и статистика.

4. Кондратюк Л.В., Овчинский В.С. Криминологическое измерение /под ред. К.К. Горяинова. - М.: Норма, 2008.

5. Яковлев В.Б. Статистика. Расчеты в Microsoft Excel: учеб. Пособие для вузов / В.Б. Яковлев. - М.: Колосc, 2005. - 352 c.

Размещено на Allbest.ru

...

Подобные документы

    Исследование преступности несовершеннолетних с позиций объекта криминологического исследования. Взаимосвязь подросткового алкоголизма, токсикомании, наркомании и преступности. Причины и условия и пути профилактики преступности несовершеннолетних.

    курсовая работа , добавлен 08.04.2011

    Методика конкретного криминологического исследования. Криминологическая характеристика насильственной преступности и ее предупреждение. Общественная опасность и тяжесть причиняемых последствий насильственных преступлений. Статистика преступности.

    контрольная работа , добавлен 15.01.2011

    Формула расчета коэффициента преступности. Расчет среднегодовой нагрузки на одного судью, среднего срока расследования уголовных дел, среднегодовых темпов роста преступности. Расчет показателей моды, медианы, вариации и среднеквадратического отклонения.

    контрольная работа , добавлен 20.04.2011

    Изучение основ корыстной преступности: понятие, элементы, объекты и субъективные стороны. Описание социального и специально-криминологического предупреждения преступности из корыстных побуждений. Разработка комплекса мер по предупреждению преступлений.

    дипломная работа , добавлен 09.11.2012

    Понятие и предмет криминологического прогнозирования. Установление возможных изменений в состоянии, уровне, структуре и динамике преступности в будущем. Оценка развития преступности в перспективе. Планирование борьбы с преступностью, ее предупреждение.

    курсовая работа , добавлен 29.05.2015

    Исследование видов криминологического прогнозирования и проектирования в сфере преступности. Особенности прогнозирования преступности несовершеннолетних в Республике Казахстан. Разработка программ борьбы с преступностью на общегосударственном уровне.

    дипломная работа , добавлен 25.10.2015

    Преступность несовершеннолетних как объект криминологического исследования. Основные, криминологические характеристики преступности несовершеннолетних. Состояние преступности. Особенности личностной характеристики несовершеннолетних.

    реферат , добавлен 01.04.2003

    Тенденции криминального поведения современных женщин: рост и устойчивый удельный вес тяжких и рецидивных преступлений, омоложение преступниц и увеличение количества женщин пожилого возраста среди осужденных. Общие меры предупреждения женской преступности.

    реферат , добавлен 01.03.2014

    Расчет относительных показателей структуры и координации категорий осужденных по степени тяжести совершенных преступлений. Коэффициенты преступности и судимости по федеральным округам и в целом по России. Расчет показателей динамики с помощью MS Excel.

    контрольная работа , добавлен 31.07.2011

    Понятие, виды, значения, детерминанты латентной преступности, причины ее возникновения, предупреждение и способы сокращения. Определение уровня и анализ структуры преступности. Системный подход в изучении латентной преступности как социального явления.