Среднее значение и вариация альтернативного признака. Виды дисперсий в совокупности, разделенной на части. Правило сложения дисперсий. Решение типовых задач

Соблюдение Вашей конфиденциальности важно для нас. По этой причине, мы разработали Политику Конфиденциальности, которая описывает, как мы используем и храним Вашу информацию. Пожалуйста, ознакомьтесь с нашими правилами соблюдения конфиденциальности и сообщите нам, если у вас возникнут какие-либо вопросы.

Сбор и использование персональной информации

Под персональной информацией понимаются данные, которые могут быть использованы для идентификации определенного лица либо связи с ним.

От вас может быть запрошено предоставление вашей персональной информации в любой момент, когда вы связываетесь с нами.

Ниже приведены некоторые примеры типов персональной информации, которую мы можем собирать, и как мы можем использовать такую информацию.

Какую персональную информацию мы собираем:

Как мы используем вашу персональную информацию:

  • Собираемая нами персональная информация позволяет нам связываться с вами и сообщать об уникальных предложениях, акциях и других мероприятиях и ближайших событиях.
  • Время от времени, мы можем использовать вашу персональную информацию для отправки важных уведомлений и сообщений.
  • Мы также можем использовать персональную информацию для внутренних целей, таких как проведения аудита, анализа данных и различных исследований в целях улучшения услуг предоставляемых нами и предоставления Вам рекомендаций относительно наших услуг.
  • Если вы принимаете участие в розыгрыше призов, конкурсе или сходном стимулирующем мероприятии, мы можем использовать предоставляемую вами информацию для управления такими программами.

Раскрытие информации третьим лицам

Мы не раскрываем полученную от Вас информацию третьим лицам.

Исключения:

  • В случае если необходимо - в соответствии с законом, судебным порядком, в судебном разбирательстве, и/или на основании публичных запросов или запросов от государственных органов на территории РФ - раскрыть вашу персональную информацию. Мы также можем раскрывать информацию о вас если мы определим, что такое раскрытие необходимо или уместно в целях безопасности, поддержания правопорядка, или иных общественно важных случаях.
  • В случае реорганизации, слияния или продажи мы можем передать собираемую нами персональную информацию соответствующему третьему лицу – правопреемнику.

Защита персональной информации

Мы предпринимаем меры предосторожности - включая административные, технические и физические - для защиты вашей персональной информации от утраты, кражи, и недобросовестного использования, а также от несанкционированного доступа, раскрытия, изменения и уничтожения.

Соблюдение вашей конфиденциальности на уровне компании

Для того чтобы убедиться, что ваша персональная информация находится в безопасности, мы доводим нормы соблюдения конфиденциальности и безопасности до наших сотрудников, и строго следим за исполнением мер соблюдения конфиденциальности.

Вариация альтернативного признака

Альтернативные признаки - два противоположных, взаимоисключающих друг друга качественных признака, которыми одни единицы совокупности обладают (значение варианта 1), а другие не обладают (значение варианта 0) (например, пол - мужской и женский, население - городское и сельское, продукция - годная и бракованная).

Частостью (p) является доля единиц, обладающих данным признаком, в общей численности совокупности и (q = 1 - p) - доля единиц, не обладающих данным признаком, в общей численности совокупности.

Средняя арифметическая альтернативного признака

Дисперсия альтернативного признака

т.е. дисперсия альтернативного признака равна произведению доли единиц, обладающих данным признаком, и доли единиц, не обладающих этим признаком.

Исходя из того, что p + q = 1:

дисперсия вариация модифицированный отклонение

Виды дисперсий в совокупности, разделенной на части. Правило сложения дисперсий

Если исходная совокупность является такой, что по значениям признака она делится на l групп, то общая дисперсия складывается из частных дисперсий. В таблице представлен анализ такой совокупности.

Определение исходной совокупности по группам

Значение признака х

Число единиц в j-й группе

Здесь j - номер группы ();

х i - i-е значение признака ();

f ij - частота i-го значения признака, число единиц в j-й группе;

m i - сумма частот i-го значения признака в каждой группе;

n j - сумма частот всех значений признака в j-й группе;

N - сумма частот всех значений признака во всех группах (объем совокупности).

Сначала вычисляем l частных средних (), т.е. среднее значение признака в каждой группе:

На основе частных средних определяем общую среднюю () по формулам

Общая дисперсия совокупности

Общая дисперсия отражает вариацию признака за счет всех факторов, действующих в данной совокупности.

Вариацию между группами за счет признака-фактора, положенного в основу группировки, отражает межгрупповая дисперсия , которая исчисляется как средний квадрат отклонений групповой средней от общей средней:

Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, т.е. вариацию между группами за счет признака-фактора, положенного в основу группировки.

Вариацию внутри каждой группы изучаемой совокупности отражает внутригрупповая дисперсия , которая исчисляется как средний квадрат отклонений значений признака х от частной средней:

Для всей совокупности внутригрупповую вариацию будет выражать средняя из внутригрупповых дисперсий , которая рассчитывается как средняя арифметическая из внутригрупповых дисперсий:

Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основу группировки.

Между представленными видами дисперсий существует определенное соотношение, которое известно как правило сложения дисперсий:

Таким образом, общая дисперсия складывается из двух слагаемых: первое - средняя из внутригрупповых дисперсий - измеряет вариацию внутри частей совокупности, второе - межгрупповая дисперсия - вариацию между средними этих частей.

Правило сложения дисперсий позволяет выявить зависимость результатов от определяющих факторов с помощью соотношения межгрупповой и общей дисперсий. Это соотношение называется эмпирическим коэффициентом детерминации (з 2) и показывает долю вариации результативного признака под влиянием факторного.

Эмпирическое корреляционное отношение (з) показывает тесноту связи между исследуемым явлением и группировочным признаком.

з 2 и з .

Если связь отсутствует, то = 0. В этом случае межгрупповая дисперсия равна нулю (д 2 =0), т.е. все групповые средние равны между собой и межгрупповой вариации нет. Это означает, что группировочный признак не влияет на вариацию исследуемого признака х.

Если связь функциональная, то = 1. В этом случае дисперсия групповых средних равна общей дисперсии (). Это означает, что группировочный признак полностью определяет характер изменения изучаемого признака.

Чем больше значение корреляционного отношения приближается к единице, тем полнее (сильнее) корреляционная связь между признаками.

Качественная оценка связи между признаками (шкала Чэддока)

18. Вариация альтернативного признака. Расчет дисперсии по

разным способам.
Среди множества варьирующих признаков , изучаемых ста­тистикой, существуют признаки, которыми обладают одни единицы совокупности и не обладают другие. Эти признаки называются альтернативными. Примером таких признаков яв­ляются: наличие бракованной продукции, ученая степень у пре­подавателя вуза, работа по полученной специальности и т. д. Вариация альтернативного признака количественно прояв­ляется в значении нуля у единиц, которые этим призна­ком не обладают, или единицы у тех, которые данный признак имеют.

Пусть р - доля единиц в совокупности, обладающих данным признаком (р = m/n); q - доля единиц, не обладающих данным признаком, причем р + q = 1. Альтернативный признак принима­ет всего два значения - 0 и 1 с весами соответственно q и р. Исчислим среднее значение альтернативного признака по фор­муле средней арифметической:

Дисперсия альтернативного признака определяется по формуле:

Таким образом , дисперсия альтернативного признака равна произведению доли на дополняющее эту долю до единицы чис­ло. Корень квадратный из этого показателя соответ­ствует среднему квадратическому отклонению альтернативного признака.

Показатели вариации альтернативных признаков широко ис­пользуются в статистике, в частности при проектировании выбо­рочного наблюдения, обработке данных социологических обсле­дований, статистическом контроле качества продукции, в ряде других случаев.
19. Правило сложения дисперсий. Дисперсионный факторный

анализ.

Бывает необходимо проследить количественные изменения признака по группам , на которые разделяется сово­купность, а также и между группами. Такое изучение вариации достигается посредством вычисления и анализа различных ви­дов дисперсии.

Выделяют дисперсию общую, межгрупповую и внутригрупповую. Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию:

Существует закон, связывающий три вида дисперсии. Общая дисперсия равна сумме средней из внутригрупповых и межгруп­повой дисперсий:

Данное соотношение называют правилом сложения диспер­сий. Согласно этому правилу, общая дисперсия, возникающая под действием всех факторов, равна сумме дисперсии, появляющей­ся под влиянием всех прочих факторов, и дисперсии, возникаю­щей за счет группировочного признака.

Зная любые два вида дисперсий, можно определить или про­верить правильность расчета третьего вида.
20. Динамический ряд, его элементы. Виды рядов динамики.

Правила построения динамических рядов
Ряд динамики (или динамический ряд) представляет собой ряд расположенных в хронологической последовательности чи­словых значений статистического показателя, характеризующих изменение общественных явлений во времени.

В каждом ряду динамики имеются два основных элемента: время t и конкретное значение показателя (уровень ряда) у.

Уровни ряда - это показатели, числовые значения которых составляют динамический ряд. Время - это моменты или перио­ды, к которым относятся уровни.

Построение и анализ рядов динамики позволяют выявить и измерить закономерности развития общественных явлений во времени. Эти закономерности не проявляются четко на каждом конкретном уровне, а лишь в тенденции , в достаточно дли­тельной динамике. На основную закономерность динамики на­кладываются другие, прежде всего случайные, иногда сезонные влияния. Выявление основной тенденции в изменении уров­ней, именуемой трендом, является одной из главных задач ана­лиза рядов динамики.

По времени, отраженному в динамических рядах, они разде­ляются на моментные и интервальные.

Моментным рядом динамики называется такой ряд, уровни которого характеризуют состояние явления на определенные да­ты (моменты времени).

Интервальным (периодическим) рядом динамики называется такой ряд, уровни которого характеризуют размер явления за конкретный период времени (год, квартал, месяц).

Уровни в динамическом ряду, могут быть представлены абсолютными, средними или относительными величинами.

По расстоянию между уровнями ряды динамики подразде­ляются на ряды с равностоящими и неравностоящими уровнями по времени

При построении динамических рядов необходимо соблюдать определенные правила: основным условием для получения пра­вильных выводов при анализе рядов динамики и прогнозирова­нии его уровней является сопоставимость уровней динамиче­ского ряда между собой.

Статистические данные должны быть сопоставимы по территории, кругу охватываемых объектов, единицам изме­рения, времени регистрации, ценам, методологии расчета и др.

Сопоставимость по территории предполагает одни и те же границы территории.

Сопоставимость по кругу охватываемых объектов означа­ет сравнение совокупностей с равным числом элементов.

При этом нужно иметь в виду, что сопоставляемые показате­ли динамического ряда должны быть однородны по экономиче­скому содержанию и границам объекта, который они характеризуют (однородность может быть обеспечена одинаковой полно­той охвата разных частей явления).

Сопоставимость по времени регистрации для интервальных рядов обеспечивается равенством периодов времени, за которые приводятся данные.

Сопоставимость по ценам. При проведении к сопостави­мому виду продукции , измеренной в стоимостных (ценностных) показателях, трудность заключается в том, что, во-первых, с те­чением времени происходит непрерывное изменение цен, а во-вторых, существует несколько видов цен.

Сопоставимость по методологии расчета. При определе­нии уровней динамического ряда необходимо использовать еди­ную методологию их расчета.
21. Показатели анализа ряда динамики. Средние показатели ряда

динамики.

средний темп роста , средний темп прироста.

отчетным, базисным.

Для расчета показателей анализа динамики на постоянной базе каждый уровень рада сравнивается с одним и тем же ба­зисным уровнем. В качестве базисного выбирается либо началь­ный уровень в раду динамики , либо уровень, с которого начи­нается какой-то новый этап развития явления. Исчисляемые при этом показатели называются базисными.

Для расчета показателей анализа динамики на переменной базе каждый последующий уровень рада сравнивается с преды­дущим. Вычисленные таким образом показатели анализа дина­мики называются цепными.

т.е. абсолютное изменение, скоростью роста.

средние уровни ряда и

Средний уровень ряда средней хро­нологической,

из абсолютных уровней средний уровень средней арифметической:



Обобщающий показатель скорости изменения уровней во времени - средний абсолютный прирост (убыль), представляющий собой обобщенную характеристику индивидуальных абсолютных приростов ряда динамики. По цепным данным об абсолютных приростах за ряд лет можно рассчитать средний абсолютный при­рост как среднюю арифметическую простую.

22. Показатели интенсивности изменения уровня ряда:

абсолютный прирост, темп роста, темп прироста, абсолютное

значение одного процента прироста. Цепной и базисный способ

расчета.
При изучении динамики общественных явлений возникает проблема описания интенсивности изменения и расчета средних показателей динамики.

Анализ интенсивности изменения во времени осуществляет­ся с помощью показателей, получаемых в результате сравнения уровней, к таким показателям относятся: абсолютный прирост, темп роста, темп прироста, абсолютное значение одного процен­та прироста.

Система средних показателей включает средний уровень ря­да, средний абсолютный прирост, средний темп роста , средний темп прироста.

Показатели анализа динамики могут вычисляться на посто­янной и переменных базах сравнения. При этом принято назы­вать сравниваемый уровень отчетным, а уровень, с которым производится сравнение, - базисным.

Важнейшим статистическим показателем анализа динамики яв­ляется абсолютный прирост (сокращение), т.е. абсолютное изменение, характеризующее увеличение или уменьшение уровня рада за оп­ределенный промежуток времени. Абсолютный прирост с пере­менной базой называют скоростью роста.

Цепные и базисные абсолютные приросты связаны между собой: сумма последовательных цепных абсолютных приростов равна базисному, т. е. общему приросту за весь промежуток времени.

Коэффициент роста (снижения) показывает, во сколько раз сравниваемый уровень больше уровня, с которым произ­водится сравнение (если этот коэффициент больше единицы) или какую часть уровня, с которым производится сравнение, составляет сравниваемый уровень (если он меньше единицы). Темп роста всегда представляет собой положительное число.

Темп прироста (сокращения) можно получить и из темпа роста, выраженного в процентах, если из него вычесть 100%. Коэффициент прироста получается вычитанием единицы из ко­эффициента роста.

При анализе динамики развития следует также знать, какие абсолютные значения скрываются за темпами роста и прироста. Сравнение абсолютного прироста и темпа прироста за одни и те же периоды времени показывает, что при снижении (замедле­нии) темпов прироста абсолютный прирост не всегда уменьша­ется, в отдельных случаях он может возрастать. Поэтому, чтобы правильно оценить значение полученного темпа прироста, его рассматривают в сопоставлении с показателем абсолютного прироста. Результат выражают показателем , который называют абсолютным значением (содержанием) одного процента прироста и рассчитывают как отношение абсолютного прироста к темпу прироста за тот же период времени, %:

23. Средние показатели ряда динамики: средний уровень ряда,

средний абсолютный прирост, средний темп роста и прироста. Их

расчет.
Для обобщающей характеристики динамики исследуемого явления определяют средние показатели: средние уровни ряда и средние показатели изменения уровней ряда.

Средний уровень ряда характеризует обобщённую вели­чину абсолютных уровней. Он рассчитывается по средней хронологической, т. е. по средней исчисленной из значений, изме­няющихся во времени.

Методы расчета среднего уровня интервального и моментного рядов динамики различны.

Для интервальных рядов динамики из абсолютных уровней средний уровень за период времени определяется по формуле средней арифметической:

При равных интервалах применяется средняя арифметиче­ская простая:

Средний уровень моментного ряда динамики с равностоящими уровнями определяется по формуле средней хронологической мо­ментного ряда:

Средний уровень моментных рядов с неравностоящими уровнями определяется по формуле средней хронологической взвешенной:

Средний абсолютный прирост определим через накопленный (базисный) абсолютный прирост . Для случая равных интервалов применим следующую формулу:

Где т - число уровней ряда динамики в изучаемом периоде, включая базисный.

Сводной обобщающей характеристикой интенсивности изменения уровней ряда динамики служит средний темп роста (снижения), показывающий, во сколько раз в среднем за едини­цу времени изменяется уровень ряда динамики.

Средний темп роста (снижения) - обобщенная характеристика индивидуальных темпов роста ряда динамики.

Средний темп роста представляет собой средний коэффициент роста, выраженный в процентах, то для равностоящих рядов динамики расчеты по средней геомет­рической сводятся к исчислению средних коэффициентов роста из цепных коэффициентов роста (по «цепному способу»):

Средние темпы прироста (сокращения) рассчитываются на основе средних темпов роста, вычитанием из последних 100 %. Соответственно при исчислении средних коэффициентов прирос­та из значений коэффициентов роста вычитается единица:

24. Методы сглаживания рядов динамики. Сущность метода

укрупнения интервалов и метода скользящей средней.

Аналитическое выравнивание ряда динамики.
Основной тенденцией развития (трендом) называется плавное и устойчивое изменение уровня явления во времени, свободное от случайных колебаний.

Задача состоит в том, чтобы выявить общую тенденцию в изменении уровней ряда , освобожденную от действия различ­ных случайных факторов. С этой целью ряды динамики подвергаются обработке методами укрупнения ин­тервалов, скользящей средней и аналитического выравнивания.

Одним из наиболее простых методов изучения основной тенденции в рядах динамики является укрупнение интервалов. Он основан на укрупнении периодов времени, к которым отно­сятся уровни ряда динамики (одновременно уменьшается коли­чество интервалов).

Выявление основной тенденции может осуществляться также методом скользящей (подвижной) средней. Сущность его заключается в том, что исчисляется средний уровень из опреде­ленного числа, обычно нечетного (3, 5, 7 и т.д.), первых по счету уровней ряда, затем - из такого же числа уровней, но начиная со второго по счету, далее - начиная с третьего и т.д. Таким образом , средняя как бы «скользит» по ряду динамики, передвигаясь на один срок.

Недостатком сглаживания ряда является «укорачивание» сглаженного ряда по сравнению с фактическим, а следователь­но, потеря информации.

Рассмотренные приемы сглаживания динамических рядов (укрупнение интервалов и метод скользящей средней) дают воз­можность определить лишь общую тенденцию развития явле­ния, более или менее освобожденную от случайных и волнооб­разных колебаний. Однако получить обобщенную статистиче­скую модель тренда посредством этих методов нельзя.

Для того чтобы дать количественную модель, выражающую основную тенденцию изменения уровней динамического ряда во вре­мени, используется аналитическое выравнивание ряда динамики.

где y t - уровни динамического ряда, вычисленные по соответст­вующему аналитическому уравнению на момент времени.

Определение теоретических (расчетных) уровней y t произ­водится на основе так называемой адекватной математической модели, которая наилучшим образом отображает (аппроксимиру­ет) основную тенденцию ряда динамики.

Выбор типа модели зависит от цели исследования и должен быть основан на теоретическом анализе, выявляющем характер развития явления , а также на графическом изображении ряда динамики (линейной диаграмме).

Например, простейшими моделями (формулами), выражаю­щими тенденцию развития, являются:

В тех случаях, когда требуется особо точное изучение тен­денции развития (например, модели тренда для прогнозирова­ния), при выборе вида адекватной функции можно использовать специальные критерии математической статистики.

Расчет параметров функции обычно производится методом наименьших, квадратов, в котором в качестве решения принима­ется точка минимума суммы квадратов отклонений между теоретическими и эмпиричесими уровнями:

Выравнивание по прямой используется, как правило, в тех случаях, когда абсолютные приросты практически посто­янны, т. е. когда уровни изменяются в арифметической профессии (или близко к ней).

Выравнивание по показательной функции используется в тех случаях, когда ряд отражает развитие в геометриче­ской профессии, т. е. когда цепные коэффициенты рос­та практически постоянны.
25. Статистическое изучение сезонных колебаний в ряде динамики;

индексы сезонности.

При сравнении квартальных и месячных данных многих социаль­но-экономических явлений часто обнаруживаются периодические ко­лебания, возникающие под влиянием смены времен года. Они явля­ются результатом влияния природно-климатических условий, общих экономических факторов, а также многочисленных и разнообразных факторов , которые часто являются регулируемыми.

В статистике периодические колебания, которые имеют опре­деленный и постоянный период, равный годовому промежутку, носят название «сезонные колебания» или «сезонные волны», а дина­мический ряд в этом случае называют сезонным рядом динамики.

Индексами сезонности являются процентные отношения факти­ческих (эмпирических) внутригрупповых уровней к теоретическим (расчетным) уровням, выступающим в качестве базы сравнения.

Для того чтобы выявить устойчивую сезонную волну, на ко­торой не отражались бы случайные условия одного года, индек­сы сезонности вычисляют по данным за несколько лет (не менее трех), распределенным по месяцам.

Если ряд динамики не содержит ярко выраженной тенден­ции в развитии, то индексы сезонности вычисляются непосред­ственно по эмпирическим данным без их предварительного вы­равнивания.

Для каждого месяца рассчитывается средняя величина уров­ня, например за три года, затем вычисляется среднемесяч­ный уровень для всего ряда у. После чего определяется показа­тель сезонной волны - индекс сезонности I s как процентное от­ношение средних для каждого месяца к общему среднемесячно­му уровню ряда, %:

Где у i - средний уровень для каждого месяца (минимум за три года); у - среднемесячный уровень для всего ряда.

Когда уровень проявляет тенденцию к росту или снижению, то отклонения от постоянного среднего уровня могут исказить сезонные колебания. В таких случаях фактические данные со­поставляются с выравненными, т. е. полученными аналитическим выравниванием.

Формулу для расчета индекса сезонности, %, в этом случае можно записать так.

В случае качественных альтернативных признаков, имеющих только два взаимоисключающих варианта значений (да и нет; качественные изделия и бракованные и т.д.), дисперсия рассчитывается по формуле

где p – удельный вес единиц, обладающих некоторым значением признака;

q – удельный вес единиц, не обладающих некоторым значением признака.

Очевидно, что р + q = 1.

Предельное значение вариации доли альтернативного признака равно 0,25 (р∙q = 0,5∙0,5 = 0,25).

Решение типовых задач

Пример 3.1. Цены на товар А в районах области составили:

Район Цена за ед., руб. Р Числен-ность населения в процентах к итогу f Расчётные графы
-14 4 900 0,98
1 120 -3 0,21
2 304 0,84
-10 1 100 0,70
4 732 1,82
1 156 6 936 2,38
-8 0,56
Итого 3 798 1 158 20 452

Дадим оценку колеблемости цен на данный товар в районах области.

Решение

Для оценки колеблемости цен в области на товар А рассчитаем (вспомогательные расчёты приведём в таблице):

1. Размах вариации цен

2. Среднюю цену товара

3. Среднее линейное отклонение

4. Среднее квадратическое отклонение

5. Коэффициент вариации

Так как V>33 %, то колеблемость цен на товар А в области следует признать весьма заметной, а совокупность районов по уровню цен неоднородной.

6. t – критерий

Так как для всех районов ti<3, то цены на товар А в каждом районе можно считать типичными.

Пример 3.2. Заработная плата 12 продавцов магазина характеризуется следующими данными:

Используя правило сложения дисперсий, оценим влияние стажа работы на различия в уровне заработной платы продавцов.

Решение

В этой задаче необходимо разложить общую вариацию заработной платы (общую дисперсию) на систематическую, связанную с профессией (межгрупповую дисперсию), и случайную, обусловленную всеми прочими факторами, кроме профессии (внутригрупповую дисперсию).

1. Средний уровень заработной платы в каждой группе и по магазину в целом:

2. Внутригрупповые и средняя из внутригрупповых дисперсий:

Средняя из внутригрупповых дисперсия характеризует вариацию заработной платы в результате действия случайных, неучтённых факторов.

3. Межгрупповая дисперсия:

Межгрупповая дисперсия характеризует систематическую вариацию заработной платы в результате действия признака-фактора, положенного в основание группировки – стажа работы

4. Общая дисперсия:

Общая дисперсия характеризует общую вариацию заработной платы, сложившуюся в результате действия как систематического фактора (стажа работы), так и всех прочих неучтённых факторов (образование, квалификация и т.д.).

5. Правило сложения дисперсий:

6. Среднее квадратическое отклонение:

Коэффициент вариации:

Совокупность продавцов достаточно однородна по уровню заработной платы, так как значение коэффициента вариации меньше 33%.

8. Эмпирический коэффициент детерминации:

, или 4,7%. Это означает, что только на 4,7% вариация заработной платы продавцов за сентябрь обусловлена различиями в их стаже работы и на 95,3% - влиянием прочих факторов.


^ 25. Основные способы формирования выборочной совокупности

При выборочном наблюдении, как правило, обследованию под­вергается сравнительно небольшая часть совокупности - 5-10%, реже 15-25% Качество результатов выборочного наблюдения зависит от того, насколько репрезентативна (т. е. представительна) выборка. Для обеспечения репрезентативности выборки необходимо соблюде­ние принципа случайности отбора единиц. Принцип случайности предполагает, что на включение объекта в выборку не может повлиять какой-либо иной фактор, кроме случая.

Существуют различные способы формирования выборочной совокупности. В практике выборочных наблюдений наибольшее рас­пространение получили собственно-случайная, механическая, типиче­ская, серийная, комбинированная выборки При этом основным видом является собственно-случайная выборка Все другие являются ее развитием или видоизменением.

Собственно-случайная выборка заключается в отборе единиц из генеральной совокупности наугад без каких-либо элементов сис­темности Отбор проводят методом жеребьевки или по таблицам случайных чисел. В первом случае всем элементам генеральной со­вокупности присваивается порядковый номер и для каждого элемента готовится жребий (пронумерованный шар или фишка). Жребии пере­мешиваются в специальном ящике, из которого затем отбираются наугад. Во втором случае производится выбор случайных чисел по специальным таблицам, которые и образуют порядковые номера для отбора В соответствии с объемом генеральной совокупности выбира­ется любой столбец или строка с числами необходимой значимости.

Собственно-случайный отбор может быть как повторным, так и бесповторным. Для проведения бесповторного отбора в процессе же-Ребьевки выпавшие жребии обратно в совокупность не возвращаются

и в дальнейшем отборе не участвуют. Если используются таблицы случайных чисел, то бесповторность отбора достигается пропуском чисел при их повторении в выбранном столбце или столбцах.

Механическая выборка применяется в случаях, когда гене­ральная совокупность каким-либо образом упорядочена, т. е. имеется определенная последовательность в расположении единиц (например, табельные номера работников, избирателей, телефонные номера респондентов, номера домов и квартир и т. п.). Для проведения ме­ханической выборки устанавливается пропорция отбора, которая оп­ределяется соотношением объемов выборочной и генеральной сово­купностей. За начало отсчета чаще всего принимают единицу, лежа­щую в середине первого интервала для исключения возможности воз­никновения систематической ошибки выборки. Шаг отсчета равен ширине интервала, на который разбивается совокупность. Механиче­ский отбор можно рассматривать как разновидность собственно-случайной бесповторной выборки.

Типическая выборка используется в тех случаях, когда все единицы генеральной совокупности можно разбить на несколько ти­пических групп (т. е. осуществить типологическую группировку). На­пример, при обследованиях населения такими группами могут быть районы, социальные, возрастные или образовательные группы; при обследовании предприятий - отрасли и подотрасли, формы собст­венности и т. п. Типический отбор предполагает выборку единиц из каждой типической группы собственно-случайным или механическим способом. При этом отбор единиц в типическую выборку может быть организован пропорционально объему типических групп либо про­порционально внутригрупповой вариации признака.

Серийный отбор удобен в тех случаях, когда единицы сово­купности объединены в группы или серии. В качестве таких серий могут рассматриваться упаковки с определенным количеством го-

мовой продукции, партии товара, студенческие группы, бригады и другие объединения. Сущность серийной выборки заключается в соб­ственно-случайном или механическом отборе серий, внутри каждой Я3 которых производится сплошное обследование единиц.

Комбинированный отбор представляет собой различные соче­тания уже рассмотренных видов выборки. Так, можно комбинировать типическую и серийную выборки, когда серии выбираются в установ­ленном порядке из нескольких типических групп. Возможно также комбинирование серийного и собственно-случайного отбора, при ко­тором отдельные единицы отбираются внутри серии в собственно-случайном порядке.