От чего зависит репрезентативность выборки. Как правильно рассчитать объем выборки? Выборочный метод в социологии

В формировании выборочной совокупности важную роль играет определение ее объема и обеспечение репрезентативности.

«Если тип выборки говорит о том, как попадают люди в выборочную совокупность, то объём выборки сообщает о том, какое их количество попало сюда». То есть объем выборки - это количество единиц попавших в выборочную совокупность. И очень важно, чтобы выборка была репрезентативной, то есть не искажала представлений о генеральной совокупности в целом. «Требования репрезентативности выборки означают, что по выделенным параметрам (критериям) состав обследуемых должен приближаться к соответствующим пропорциям в генеральной совокупности».

Одна из ключевых проблем, встающих, как правило, перед социологом, решающим: доверять полученным в ходе него данным или нет, это то, сколько же человек должно быть опрошено для того, чтобы получить действительно репрезентативную информацию. К сожалению, единой и четкой формулы, используя которую можно было бы рассчитать оптимальный объем выборочной совокупности, не существует в природе. И объясняется это весьма просто. Дело в том, что определение объема выборочной совокупности - это проблема не столько статистическая, сколько содержательная.

Иными словами, объем выборочной совокупности зависит от множества факторов, основные из них следующие:

  • 1. затраты на сбор информации, включая временные;
  • 2. стремление к определённой статистической достоверности результатов, которую надеется получить исследователь;
  • 3. ценность и новизна информации, получаемой в результате опроса.

Объем выборки обусловлен степенью однородности или неоднородности, генеральной совокупности, количеством характеризующих ее признаков. Однородной считается совокупность, в которой контролируемый признак, например уровень грамотности, распределён равномерно, то есть не образует пустот и сгущений, тогда опросив лишь несколько человек, можно сделать вывод о том, что большинство людей грамотны. Чем более однородна генеральная совокупность, тем меньше объем выборки. Например, «допустим, мы осуществляем отбор из генеральной совокупности в 2000 человек, контролируя состав выборочной совокупности по признаку «пол»»: 70% мужчин и 30% женщин. Согласно теории вероятности, можно предположить, что примерно среди каждых десяти отбираемых респондентов встретятся три женщины. Если мы хотим опросить по крайней мерее 90 женщин, то исходя из вышеупомянутого соотношения, нам необходимо отобрать не менее 300 человек. А теперь предположим, что в генеральной совокупности 90% мужчин и 10% женщин. В этом случае, чтобы в выборочную совокупность попало 90 женщин, необходимо отобрать уже не менее 900 человек». Из примера видно, что объем выборки зависит от разброса признака (дисперсии), и его нужно вычислять по признаку, дисперсия значений которого наибольшая.

«Степень однородности социального объекта зависит, в сущности, от того, насколько детально мы намерены его исследовать. Практически любой, самый «элементарный» объект оказывается чрезвычайно сложным. Лишь в анализе мы представляем его как относительно простой, выделяя те или иные его свойства. Чем более основательным и детальным будет анализ, чем больше свойств данного объекта мы намерены принять во внимание в их сочетании, а не изолированно, тем больше должен быть объем выборки».

В репрезентативной выборке все элементы генеральной совокупности представлены в той же пропорции. Но как бы тщательно не соблюдать этот принцип, случайные ошибки все же будут. Мы имеем возможность определять ошибку репрезентативности. Ошибкой репрезентативности, как правило, называют «расхождение между двумя совокупностями - генеральной, на которую направлен теоретический интерес социолога и представление о свойствах которой он хочет получить в конечном итоге, и выборочной, на которую направлен практический интерес социолога, которая выступает одновременно как объект обследования и средство получить информацию о генеральной совокупности». Важно учитывать, что при помощи выборочного метода никогда нельзя получить абсолютно точную оценку наблюдаемого признака, всегда существует вероятность ошибки, но, если вероятность ошибки мала, то она скорее всего не произойдет. В отечественной литературе наряду с термином «ошибка репрезентативности» встречается и другой - «ошибка выборки». Обычно они используются как синонимы, но понятие «ошибка выборки» количественно более точное, чем «ошибка репрезентативности». Ошибка выборки - это «отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности. На практике она определяется путём сравнения известных характеристик генеральной совокупности с выборочными средними».

Репрезентативность выборки определяется двумя компонентами: систематическими и случайными ошибками. Случайные ошибки связаны «со статистическими погрешностями (зависят от динамики исследуемых признаков) и непредвиденными нарушениями процедуры сбора информации (процедурные ошибки, допущенные при регистрации признаков)». Случайные ошибки уменьшаются с увеличением объема выборочной совокупности. Случайную ошибку можно измерить методами математической статистики, если при формировании выборочной совокупности соблюдался принцип случайности, обеспечивающийся строго определенными правилами, которые составляют метод формирования выборочной совокупности, и устранить.

На практике принцип случайности соблюсти очень сложно, а иногда просто невозможно, что приводит к появлению систематической ошибки, которые возникают «из-за неполной объективности выборки генеральной совокупности (недостаток информации о генеральной совокупности, отбор наиболее «удобных» для исследования элементов генеральной совокупности), а так же из-за несоответствия выборки целям и задачам исследования». Иногда такие ошибки называют ошибками смещения. Они возникают при различных телевизионных опросах, когда телеведущий предлагает телезрителям позвонить по определённым номерам телефонов, послать смс-сообщение и высказать своё мнение по какой-то проблеме. Естественно мы не можем утверждать что эти люди отражают мнение всего населения страны, и даже телеаудитории. Вероятнее всего в таких опросах участвуют более образованные и активные люди, чем вся генеральная совокупность, поэтому любой телевизионный опрос содержит в себе систематическое искажение и носит поверхностный характер.

Но систематические ошибки возникают и в ходе корректно организованного опроса. Например, на улице на вопросы интервьюера отвечают только те, кто никуда не спешит. Искажения можно избежать, если соблюдать принципы случайного отбора и опрашивать, к примеру, каждого десятого прохожего.

Причины возникновения систематических ошибок:

  • 1. «в ходе исследования была не правильно составлена основа выборки (использовались устаревшие, неполные данные либо отсутствовала статистика по некоторым важным для формирования выборки признакам),
  • 2. неудачно выбран способ отбора единиц наблюдения,
  • 3. часть респондентов по разным причинам «выпала» из опроса (отсутствовала, отказалась отвечать) и так далее».

При помощи математических средств такие ошибки устранить невозможно, поэтому необходимо осуществить логический анализ причин появления систематических ошибок и разработать меры, которые смогли бы их устранить. «Величину ошибок смещения определить при помощи математических формул практически не возможно, поэтому они автоматически переходят на результаты и выводы исследования. Ошибки смещения бывают обычно следствием:

  • - неверных исходных статистических данных о параметрах контрольных признаков генеральной совокупности;
  • - слишком малого (статистически не значимого) объёма выборочной совокупности;
  • - неверного применения способа отбора единиц анализа (например, отбор из неверно составленного списка, неудачный выбор места и времени проведения опроса)» .

Существуют определённые пределы ошибки выборки, которые зависят от цели исследования. В экономических и демографических прогнозах, например при переписи населения, требуется повышенная надёжность и точность. Для таких прогнозов существенные ошибки оборачиваются миллионными потерями материальных ресурсов и просчетами в прогнозах и планировании. Но чаще поводятся социологические исследования для уяснения общих тенденций, общей ориентировки в социальной сфере не требующие стопроцентной надёжности. Существует приблизительная оценка на надёжность результатов исследования: «повышенная надёжность допускает ошибку выборки до 3%. Обыкновенная - до 3-10%, приближенная - то 10 до 20%, ориентировочная - от 20 до 40%, а прикидочная - более 40%».

Таким образом, существует несколько способов, чтобы избежать ошибки:

  • § каждый элемент генеральной совокупности должен иметь одинаковую вероятность попасть в выборочную совокупность;
  • § генеральная совокупность должна быть желательно однородной;
  • § необходимо иметь сведения о структуре генеральной совокупности и её характерные черты;
  • § при составлении выборочной совокупности заранее учесть случайные и систематические ошибки.

Например, если опросив 380 человек в поселении, где общая численность платёжеспособного населения 10 тысяч человек, мы выявили что 36% опрошенных покупателей, предпочитают отечественную продукцию, то с 95-процентной степенью вероятности мы можем утверждать, что отечественную продукцию постоянно покупают 46±5% (то есть от 41 до 51%) жителей этого поселения.

Многие обстоятельства усложняют проблему расчёта выборки и нередко могут привести к тому, что формально-статистически репрезентативная выборка окажется качественно непредставительной».

Качество выборки оценивают по двум показателям: репрезентативность и надежность. О репрезентативности уже говорилось выше. А чтобы создать надежную выборку необходимо правильно построить ее основу. Для этого соблюдаются следующие требования:

  • 1. Полнота выборки, которая требует наличия всех элементов генеральной совокупности в основе выборки. Если в выборку не включены многие единицы наблюдения, тем более, несущие в себе существенные особенности и характеристики объекта, то результаты исследования будут неполными и однобокими.
  • 2. Отсутствие дублирования, которое подразумевает недопустимость повторного включения в выборку одной и той же единицы наблюдения (например, ученик перешел учиться в другую школу, его включили в новый список, не вычеркнув при этом из старого, таким образом, он дважды попал в выборку).
  • 3. Точность информации выборки, предполагающая исключение несуществующих единиц наблюдения из основы выборки. Например, в избирательных списках, которые готовятся для очередных выборов депутатов различного уровня, нередко остаются умершие люди или жильцы снесенных домов.
  • 4. Адекватность, которая означает, что основа составленной выборки должна соотноситься с решением поставленных в исследовании задач. Например, полный список всех учащихся школы -- хорошая основа для того, чтобы сформировать выборку при изучении проблемы общей успеваемости. Но если нас интересует отношение старшеклассников к основным учебным дисциплинам, то этот список может быть использован только для формирования новой основы выборки -- списка старшеклассников.
  • 5. Удобство работы с основой выборки, при котором необходимо четко пронумеровать все элементы, которые в нее входят, а составленные списки централизованно хранить.

«Существует два основных подхода к обоснованию репрезентативности выборки:

  • 1. При статистическом подходе репрезентативность обеспечивается специальными вероятностными методами извлечения выборки. Для обобщения результатов исследования на генеральную совокупность применяются строгие индуктивные процедуры статистического вывода, оценивается ошибка выборки с заданной вероятностью.
  • 2. Внестатистическое обоснование репрезентативности предполагает теоретическое доказательство того, что выборка достаточно хорошо представляет генеральную совокупность. При использовании этого подхода статистическое оценивание ошибок выборки не производится».

На первый взгляд, кажется, что обеспечить репрезентативность выборки на практике просто невозможно, но на самом деле всё зависит от программных целей и задач исследования.

Если мы проводим обследование большой общественной значимости, по завершению которого нужно будет сделать выводы обо всей генеральной совокупности, то необходимо чётко следовать всем требования репрезентативной выборочной процедуры, так как ошибки в таких исследованиях недопустимы.

Если перед нами стоят более скромные задачи и уровень надежности выводов можно смело понизить, то необходимо следовать всем требованиям по качественному представительству выборочной совокупности. Если мы решим подчёркивать статистическую надёжность данных, то введём в заблуждение тех людей, кто привык верить математическим расчётам. Нельзя забывать, что та информация, которую мы получаем путём опросов и других способов, лишь условно переводится в количественные показатели. И не редкость когда количественные показатели только приблизительно отражают существо социальных процессов. «Поэтому усилия, направленные на строгость статистического обоснования результатов, приобретают смысл только при условии серьёзного качественного анализа проблемы, содержательного её изучения».

Необходимо помнить, что социолог должен сосредотачивать своё внимание именно на существе социальных проблем, привлекать к работе других специалистов, практиков и теоретиков, внимательно изучать литературу в области экономики, психологии, социологии о предмете исследования. И для решения статистических задач, по поводу типа и объема выборки, он сначала должен чётко сформулировать конкретные вопросы, которые необходимо решить, а уже потом обращаться к соответствующим расчётам различных статистик.

Познакомимся с тремя понятиями, которые необходимо знать любому, кто так или иначе соприкасается с социологическими исследованиями: генеральная совокупность, выборочная совокупность (выборка), репрезентативность.

Генеральная совокупность – это все единицы определенного программой объекта исследования. Если мы говорим о всероссийском опросе общественного мнения, это будет все взрослое население России. Или все московские студенты, если мы возьмемся провести среди них опрос. Или все беспризорные дети Калуги, если мы собираемся предпринять социсследование на эту тему.

Выборочная совокупность (выборка) – это часть генеральной совокупности, которую мы будет непосредственно исследовать, то есть это те люди, к которым мы обратимся с вопросами интервью или с анкетами; те материалы, которые мы будет изучать методом контент-анализа и т. п.

Иногда выборка равна генеральной совокупности (например, в случае, когда мы опрашиваем всех студентов первого курса факультета журналистики МГУ). Но обычно она меньше, иногда в несколько десятков и сотен раз. При этом практика социологических исследований доказала, что в общенациональных исследованиях достаточно выбрать для опросов 1,5–2 тысячи человек. Если выборка хорошо, правильно, репрезентативно сформирована, то она может дать объективную информацию о мнении всех россиян.

Итак, главное – это правильно сформировать выборку. Объем выборки зависит от целей исследования, специфики и степени однородности объекта исследования, дробности групп, которые предстоит изучить, и планируемой степени ее репрезентативности. Что же означает это магическое и самое важное в эмпирической социологии понятие – «репрезентативность»?

Репрезентативность – это соответствие, адекватность выборочной совокупности (выборки) по основным характеристикам генеральной совокупности. Если в структуре населения 55 % женщин и 45 %; мужчин, то и в выборке должно быть такое же соотношение. То же самое можно сказать о возрасте, профессии, типе поселения и т. п. Короче, конфигурация выборки должна совпадать с конфигурацией генеральной совокупности. Это можно изобразить на таком рисунке (рис. 8).

Самое главное в социологическом исследовании – репрезентативность выборки, потому что именно с этим связана точность и объективность полученных результатов.

Выборка может формироваться разными путями. Но основных типов два репрезентативные и нерепрезентативные выборки.

Репрезентативные выборки

Вероятностная, или случайная, выборка строится на том, что любой из объектов генеральной совокупности имеет равную вероятность попасть в выборочную совокупность. Есть несколько подвидов вероятностной выборки.

1. Систематический отбор. Он весьма популярен и часто применяется в социсследованиях. Это значит, что в зависимости от величины выборки отбирается из генеральной совокупности каждый n -ый (6, 20, 45 и т. п.) объект. Например, мы опрашиваем взрослое население одного из избирательных участков. Берем избирательные списки. Предположим, в них будет 10 000 человек. А нам нужна выборка в 500 человек. Делим число 10 000 генеральной совокупности на число 500 выборки, получаем 20. Значит, из списков будем выбирать каждого двадцатого избирателя.

Предположим, что нам нужно опросить по телефону москвичей и выяснить у них, какую в данный момент они смотрят передачу по телевизору. Берем справочную телефонную книгу, считаем, сколько в ней номеров, делим это количество на то число, которое нам надо опросить, и получаем шаг, при котором мы будет вести систематический отбор номеров.

То же самое можно делать с домами на улицах, если мы будем опрашивать наших реципиентов дома. Например, на четной стороне улицы заходим в каждый пятый дом. И так далее.

2. Отбор по принципу лотереи или жребия . Этот способ вам хорошо знаком, когда вы бросаете в шапку, вазу, ящик, например, все улицы Москвы и выбираете 20, на которых будете проводить исследование. Так же могут быть выбраны регионы, населенные пункты, почтовые отделения и т. п.

3. Отбор методом случайных чисел . Для этого составляются специальные математические таблицы случайных чисел по количеству выборочной совокупности и выбирается объект, который промаркирован предварительно этой цифрой.

Квотная выборка формируется в соответствии с квотами (то есть объектами, имеющими определенный признак по полу, возрасту, месту жительства и т. п.), которые в процентном отношении соответствуют генеральной совокупности. Предположим, что мы исследуем население небольшого города и знаем, какое в нем процентное соотношение молодых, людей средних лет и пожилых, мужчин и женщин, работающих и пенсионеров. Мы должны отобрать для опроса людей с этими характеристиками в таком же процентном соотношении. Эта выборка по степени репрезентативности близка к вероятностной.

Стратифицированная выборка отличается от квотной тем, что искусственно, в связи с целями исследования, формируются слои, страты, которые подлежат изучению и, как правило, в количественном отношении они равны. Страты должны быть более однородными, чем вся совокупность. Например, мы изучаем читателей разных изданий: «АиФ», «Известий», «Труда», «Комсомольской правды», «МК» и формируем равные страты читателей разных изданий, предположим, по 200 человек.

Районированная выборка обычно используется при исследовании районов, часто с применением географической карты, схемы населенных пунктов и т. п., из которых выбираются определенные единицы для исследования. Например, выбираются области из разных географических зон России, или округа Москвы. Иногда применяется так называемая методика географического креста, когда выбираются точки на горизонтали и вертикали этого географического креста. Так формировалась выборка в исследованиях общественного мнения в 60-е годы в Институте общественного мнения при «Комсомольской правде».

Серийная, гнездовая, кластерная выборка работает не с единицами, а с гнездами, однородными группами (семья, производственная бригада, студенческая группа, болельщики футбольного матча, телезрители, которые смотрят ТВ в одной комнате, городские районы и т. п.). Обычно в таком случае проводится сплошной опрос.

Большинство социологических исследований носит не сплошной, а выборочный характер: по строгим правилам отбирается определенное количество людей, отражающих по социально-демографическим признакам структуру изучаемого объекта. Такое исследование называется выборочным.

При построении социологической выборки используется множество специальных терминов, в том числе два важнейших – генеральная ивыборочная совокупность .

Совокупность, из которой отбираются варианты для совместного изучения, называется генеральной, а отобранная из генеральной совокупности часть ее членов носит название выборки ,или выборочной совокупности . Объем генеральной совокупности обозначается символом N , а объем выборочной совокупности – n .

Генеральной совокупностью считают все население или ту его часть, которую социолог намерен изучить, совокупность людей, обладающих одним или несколькими свойствами, подлежащими изучению. Часто генеральная совокупность (еще называемая популяцией) настолько крупная, что опрос каждого представителя чрезвычайно обременителен и дорогостоящ. Это те, на кого направлен теоретический интерес социолога (в том смысле, что узнать о каждом представителе генеральной совокупности ученый может только косвенно – на основе информации о выборочной совокупности).

Выборкой называется совокупность элементов объекта социологического исследования, подлежащая непосредственному изучению. Понятие выборки в статистике и социологии рассматривается в двух значениях:

– выборка (как результат действия) – представительная часть генеральной совокупности, в которой закон распределения признака соответствует закону распределения этого признака в генеральной совокупности;

– выборка (как способ или процесс действия) – способ отбора объектов генеральной совокупности в выборочную.

Выборка должна наилучшим образом репрезентировать объект исследования (генеральную совокупность).

Выборочная совокупность – уменьшенная модель генеральной совокупности. Иначе говоря, это множество людей, которых социолог опрашивает. В выборку, или выборочную совокупность, входят только те, кого социолог намеревается непосредственно опросить. Представим, что предметом его исследования, т. е. темой, выступает экономическая активность пенсионеров. Все пенсионеры – пожилые люди в возрасте старше 55 (женщины) и 60 (мужчины) лет – будут составлять генеральную совокупность. По специальным формулам социолог рассчитал, что ему достаточно опросить 2,5 тысячи пенсионеров. Это и станет его выборочной совокупностью.

Основное правило ее составления гласит: каждый элемент генеральной совокупности должен иметь одинаковые шансы попасть в выборку .Но как этого добиться? Прежде всего, надо узнать как можно больше свойств, или параметров, генеральной совокупности, например, разброс в возрасте, доходах, национальности, местах проживания респондентов. Разброс в возрасте респондентов называется вариацией ,конкретные величины возраста – значениями , а совокупность всех значений образует переменную .

Таким образом, переменная «возраст» имеет значения от 0 до 70 (средняя продолжительность жизни) и более лет. Значения группируются в интервалы: 0–5, 6–10, 11–15 лет и т. д. Их можно группировать иначе, все зависит от задач исследования. Интервалы значений переменной «возраст» в случае с пенсионерами начинаются с 55 и 60 лет.

Все население, целая нация или очень большая социальная группа редко выступают генеральной совокупностью. В большинстве эмпирических исследований социолога интересует частная проблема, например, рост числа разводов среди молодых семей в крупных городах или интерес к инвестиционной деятельности среди представителей среднего класса столичного города. Разводы и инвестиционная деятельность – это те темы, которые интересуют конкретного исследователя в данный период времени. Соответственно все люди, втянутые в этот процесс или участвующие в данном событии, будут называться группой интереса .Их могут быть тысячи или десятки тысяч человек. Они составляют исходную популяцию, или генеральную совокупность, из которой социолог строит выборочную совокупность и опрашивает ее.

Сущность выборочного метода заключается в том, чтобы по свойствам части (выборки) судить о численных характеристиках целого (генеральной совокупности), по отдельным группам элементов – об их общей совокупности, которая иногда мыслится как совокупность неограниченно большого объема. Основу выборочного метода составляет та внутренняя связь, которая существует в популяциях между единичным и общим, частью и целым.

Репрезентативной выборкой в социологии считается такая выборочная совокупность, основные характеристики которой полностью совпадают (представлены в той же пропорции или с той же частотой) с такими же характеристиками генеральной совокупности. Только для этого типа выборки результаты обследования части единиц (объектов) можно распространять на всю генеральную совокупность. Необходимое условие для построения репрезентативной выборки – наличие информации о генеральной совокупности, т. е. либо полный список единиц (субъектов) генеральной совокупности, либо информация о структуре по характеристикам, существенно влияющим на отношение к предмету исследования.

Под репрезентативностью в социологии понимают такие свойства выборки, которые позволяют ей выступать на момент опроса моделью, представителем генеральной совокупности. Иными словами, репрезентативная выборка представляет собой точную модель генеральной совокупности, которую она должна отражать (по значимым для исследования параметрам). В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно применить ко всей совокупности.

Репрезентативным считается такое исследование, при котором отклонение в выборочной совокупности по контрольным признакам не превышает 5 %. При пилотажном опросе небольшой генеральной совокупности (например, в рамках факультета численностью до 100–250 человек) репрезентативным будет сплошное анкетирование. В масштабах вуза достаточно будет опросить 25 % от общего числа студентов.

Как только социолог определился с тем, кого он хочет опросить, он определил основу выборки .После чего решается вопрос о типе выборки.

Типами выборки называются основные разновидности статисти-ческой выборки: случайная (вероятностная) и неслучайная (невероятностная). Тип выборки говорит о том, как люди попадают в выборочную совокупность, объем выборки сообщает о том, какое их количество туда попало.

Перейдем к характеристике наиболее распространенных выборок.


Похожая информация.


Понятие репрезентативности в социологическом исследовании

Другими словами, репрезентативность – это качество выборки. Выборка может быть репрезентативной или нерепрезентативной. Если в социологическом исследовании применялась большая группа людей, то выборка будет репрезентативной.

Определение 2

Выборка – это отобранное определенное количество элементов генеральной совокупности. Репрезентативная выборка характерна тем, что все элементы генеральной совокупности представлены в той же пропорции.

Репрезентативность выборки социологического исследования определяется двумя случайными компонентами: ошибками, которые были допущены при регистрации и случайными ошибками.

Пример 1

Например: если объект социологического исследования сложный и имеет несколько элементов, то потребуется большее количество интервьюеров. Не всегда все интервьюеры имеют хорошую квалификацию, что может привести к ошибкам при регистрации. В отличие от этого, проведение выборочного исследования интервьюерами, которые более подготовлены и проинструктированы, ведёт к уменьшению количества ошибок, то есть к случайным ошибкам.

Построение выборки сводится к трём основным проблемам:

  • определить объем выборки (то есть построить определенную процедуру, для того чтобы выборка была репрезентативной);
  • определить объём выборки (количество, которое нужно опросить);
  • оценка качества выборки (анализ точности результатов).

Замечание 1

Важно помнить, что показатели выборки и генеральной совокупности не должны превышать 5%. Если такая пропорция нарушается, то выводы такого социологического исследования не будут соответствовать действительности.

Типы выборок

Выборки делятся на: случайные и целенаправленные.

Случайная выборка является наиболее точной и репрезентативной. Суть данной выборки в том, что благодаря случайному отбору, все единицы генеральной совокупности имеют одинаковые шансы попасть в выборочную совокупность. Такой вид выборки обычно используется перед выборами, референдумами и другими массовыми мероприятиями. Помимо того, что данная выборка даёт нам точность, она имеет сложности в применении. Для того, чтобы провести случайною выборку, социолог должен иметь список элементов генеральной совокупности, что не всегда даётся легко. Случайный отбор требует большого объема выборки для получения точных результатов.

Разновидностями случайной выборки бывают серийная, районированная, механическая и другие.

  • Серийная или гнездовая выборка имеет вид серий. Заключается в отборе отдельных элементов (семья, группа, школа, коллектив и т.д.), которые подвергаются сплошному исследованию.
  • Районированную выборку используют в тех случаях, когда весь массив данных нужно разбить на однородные части. Такими частями могут выступать районы города.
  • Принцип механической выборки заключается в том, что все элементы генеральной совокупности относят в один список и с него через равные интегралы отбирают необходимое количество респондентов. Механическая выборка имеет соотношение генеральной совокупности к выборочной. Например: Если генеральная совокупность 2000 человек, а выборочная 200, то это значит, что с общего списка отбирается каждый десятый.

Целенаправленная выборка – это вид выборки, где отбор осуществляется по критериям доступности, типичности, равенства и т.д. Целенаправленная выборка делится на стихийную, метод снежного кома и квотную.

  • Стихийная выборка – это выборка первого встречного. Минус данной выборки заключается в том, что невозможно заранее установить генеральную совокупность.
  • Метод снежного кома заключается в нарастании информации. Каждый опрашиваемый респондент даёт контакты коллег, друзей, знакомых, которые могут принять участие в исследование и т.д.
  • Квотная выборка. В данной выборке все данные являются квотой. При использовании квотной выборки респондентов подбирают целенаправленно, придерживаясь параметров квот. Характеристики, которые отбирают по квотам – это пол, образование, возраст, уровень квалификации или другие, которые определяются целями и заданиями самого социологического исследования.

Фактически мы начнем не с одного, а с трех вопросов: что такое выборка? когда она является репрезентативной? что она собой представляет?

Совокупность – это любая группа людей, организаций, интересующих нас событий, относительно которых мы хотим сделать выводы, а случай, или объект, – любой элемент такой совокупности 1 .Выборка – любая подгруппа совокупности случаев (объектов), выделенная для анализа. Если мы захотим изучить деятельность законодателей штата по принятию решений, мы могли бы исследовать такую деятельность в законодательных органах штатов Виргиния, Северная Каролина и Южная Каролина, а не во всех пятидесяти штатах и, исходя из этого, распространить полученные данные на генеральную совокупность, из которой были выбраны эти три штата. Если мы хотим исследовать систему предпочтений избирателей Пенсильвании, мы могли бы сделать это, опросив 50 рабочих компании “Ю. С. Стил” в Питсбурге, и распространить результаты опроса на всех избирателей штата. Аналогично, если мы хотим измерить умственные способности студентов колледжей, мы могли быпротестировать всех игроков защиты, зарегистрированных в штате Огайо в данном футбольном сезоне, и затем распространить полученные результаты на генеральную совокупность, частью которой они являются. В каждом примере мы действуем следующим образом: устанавливаем подгруппу внутри генеральной совокупности, довольно подробно изучаем эту подгруппу, или выборку, и распространяем наши результаты на всю совокупность. Это и есть основные этапы формирования выборки.

Однако представляется совершенно очевидным, что каждая из этих выборок имеет существенный недостаток. К примеру, хотя законодательные органы Виргинии, Северной Каролины и Южной Каролины и являются частью совокупности законодательных органов штатов, они в силу исторических, географических и политических причин, скорее всего, будут действовать очень схожим образом и совсем иначе, чем законодательные органы таких отличающихся от них штатов, как Нью-Йорк, Небраска и Аляска. Хотя пятьдесят рабочих-сталелитейщиков в Питсбурге действительно могут быть избирателями штата Пенсильвания, они в силу социально-экономического статуса, образования и жизненного опыта, вполне возможно, будут иметь взгляды, отличные от взглядов многих других людей, точно так же являющихся избирателями. И точно так же, хотя футболисты штата Огайо и являются студентами колледжей, они в силу самых разных причин вполне могут отличаться от других студентов. Иными словами, хотя каждая из этих подгрупп действительно является выборкой, члены каждой из них систематически отличаются от большинства остальных членов совокупности, из которой они выбраны. В качестве отдельной группы ни одна из них не является типичной с точки зрения распределения признаков мнений, мотивов поведения и характеристик в генеральной совокупности, с которой она ассоциируется. Соответственно, политологи сказали бы, что ни одна из этих выборок не является репрезентативной.

Репрезентативная выборка – это такая выборка, в которой все основные признаки генеральной совокупности, из которой извлечена данная выборка, представлены приблизительно в той же пропорции или с той же частотой, с которой данный признак выступает в этой генеральной совокупности. Таким образом, если 50% всех законодательных органов штатов собираются лишь раз в два года, приблизительно половина состава репрезентативной выборки законодательных органов штатов должна быть такого типа. Если 30% избирателей Пенсильвании принадлежат к “синим воротничкам”, около 30% репрезентативной выборки для этих избирателей (а не 100%, как в приведенном выше примере) должны быть из числа “синих воротничков”. И если 2% всех студентов колледжей являются спортсменами, приблизительно та же самая часть репрезентативной выборки студентов колледжей должна приходиться на спортсменов. Инымисловами, репрезентативная выборка представляет собой микрокосм, меньшую по размеру, но точную модель генеральной совокупности, которую она должна отражать. В той степени, в какой выборка является репрезентативной, выводы, основанные на изучении этой выборки, можно без всяких опасений считать применимыми к исходной совокупности. Это распространение результатов и есть то, что мы называем генерализуемостью.

Возможно, пояснить это поможет графическая иллюстрация. Предположим, мы хотим изучать модели членства в политических группах среди взрослого населения США. На рис.5.1 изображено три круга, разделенных на шесть равных секторов. Рис.5.1а представляет всю рассматриваемую совокупность. Члены совокупности расклассифицированы в соответствии с политическими группами (такими, как партии и группы интересов), к которым они относятся. В этом примере каждый взрослый принадлежит по меньшей мере к одной и не более чем к шести политическим группам; и эти шесть уровней членства в одинаковой степени распространены в совокупности (отсюда равные сектора). Предположим, мы хотим исследовать мотивы вступления людей в группу, выбор группы и модели участия, однако из-за ограниченности ресурсов мы в состоянии обследовать только одного из каждых шести членов совокупности. Кого же отобрать для анализа?

Рис. 5.1. Формирование выборки из генеральной совокупности

Одну из возможных выборок заданного объема иллюстрирует заштрихованная область на рис.5.1б, однако она явно не отражает структуру совокупности. Если бы мы делали обобщения на основе этой выборки, мы пришли бы к выводу: (1) что все взрослые американцы принадлежат к пяти политическим группам и (2) что все групповое поведение американцев совпадает с поведением тех, кто принадлежит именно к пяти группам. Однако мы знаем, что первый вывод не верен, и это может зародить в нас сомнение относительно валидности второго. Таким образом, выборка, изображенная на рис.5.1б, нерепрезентативна, поскольку она не отражает распределение данного свойства совокупности (часто называемогопараметром ) в соответствии с его реальным распространением. Про такую выборку говорят, что она смещена в направлении к членам пяти групп или смещена в направлении от всех остальных моделей членства в группах. Опираясь на такую смещенную выборку, мы обычно приходим к ошибочным выводам относительно генеральной совокупности.

Ярче всего это может быть продемонстрировано на примере катастрофы, постигшей в 30-е годы журнал “Литэрари дайджест”, который организовал опрос общественного мнения относительно результатов выборов. “Литэрари дайджест” представлял собой периодическое издание, в котором перепечатывались редакционные статьи из газет и другие материалы, отражавшие общественноемнение; этот журнал был очень популярен в начале века. Начиная с 1920 г. журнал проводил широкомасштабный общенациональный опрос, в ходе которого более чем миллиону человек по почте рассылались избирательные бюллетени с просьбой отметить, чья кандидатура на предстоящих президентских выборах для них предпочтительнее. В течение ряда лет результаты опроса, проводившиеся журналом, оказывались настолько точными, что опрос, проведенный в сентябре, казалось, делал ноябрьские выборы малосущественными. Да и как притакой большой выборке могла произойти ошибка? Однако в 1936 г. именно это и случилось: с большим перевесом голосов (60:40) победа была предсказана кандидату от республиканской партии Альфу Ландону. На выборах Ландон проиграл инвалиду – Франклину Д. Рузвельту – практически с тем же результатом, с которым должен был победить. Доверие к “Литэрари дайджест” было столь сильно подорвано, что вскоре после этого журнал перестал выходить. Что же произошло? Все очень просто: в голосовании, проведенном “Дайджест”, использовалась смещенная выборка. Почтовые открытки рассылались людям, чьи имена были извлечены из двух источников: телефонных справочников и списков регистрации автомобилей. И хотя прежде этот метод отбора не слишком отличался от других методов, совсем по-другому обстояло дело теперь, во время Великой депрессии 1936 г., когда менее состоятельные избиратели, наиболее вероятная опора Рузвельта, не могли позволить себе иметь телефон, не говоря уж об автомобиле. Таким образом, фактически выборка, использовавшаяся в опросе, организованном “Дайджест”, была смещена в сторону тех, кто, скорее всего, должен был выступать за республиканцев, и при этом еще удивительно, что у Рузвельта был такой хороший результат.

Как же решить эту проблему? Возвращаясь к нашему примеру, сравним выборку на рис.5.1б с выборкой на рис.5.1в. В последнем случае для анализа также отобрана шестая часть совокупности, однако каждый из основных типов совокупности представлен в выборке в той пропорции, в которой он представлен во всей совокупности. Такая выборка демонстрирует, что один из каждых шести взрослых американцев принадлежит к одной политической группе, один из шести – к двум и т.д. Такая выборка позволит также выявить другие различия между ее членами, которые могли бы соотноситься с участием в разном числе групп. Таким образом, выборка, представленная на рис.5.1в, является репрезентативной выборкой для рассматриваемой совокупности.

Конечно, данный пример является упрощенным по крайней мере с двух чрезвычайно важных точек зрения. Во-первых, большинство совокупностей, интересующих политологов, более разнообразно, чем та, что приведена в примере. Люди, документы, правительства, организации, решения и т.п. отличаются друг от друга не по одному, а по гораздо большему числу признаков. Таким образом, репрезентативная выборка должна быть такой, чтобы каждая из основных, отличная от других область была представлена пропорционально ее доле в совокупности. Во-вторых, ситуация, когда реальное распределение переменных, или признаков, которые мы хотим измерить, заранее неизвестно, встречается гораздо чаще, чем противоположная, – возможно, оно не измерялось в предшествующей переписи населения. Таким образом, репрезентативная выборка должна быть построена так, чтобы она могла точно отражать существующее распределение даже тогда, когда мы не в состоянии прямо оценить ее валидность. Процедура формирования выборки должна иметь внутреннюю логику, способную убедить нас, что, будь мы в состоянии сравнить выборку с переписью, она действительно оказалась бы репрезентативной.

Чтобы обеспечить возможность точного отражения сложной организации данной совокупности и определенную степень уверенности в том, что предлагаемые процедуры способны сделать это, исследователи обращаются к методам статистики. При этом они действуют по двум направлениям. Во-первых, используя определенные правила (внутреннюю логику), исследователи решают вопрос о том, какие именно конкретные объектыим изучать, что именно включать в конкретную выборку. Во-вторых, используя совсем другие правила, они решают, сколько объектов выбрать. Мы не будем подробно изучать эти многочисленные правила, рассмотрим лишь их роль в политологическом исследовании. Начнем рассмотрение со стратегий выбора объектов, образующих репрезентативную выборку.