Калькулятор генеральной совокупности. Интервальное оценивание генеральной доли. Описание работы калькулятора

  • БЛОК 2. СТАТИСТИКА ЗДОРОВЬЯ НАСЕЛЕНИЯ. МОДУЛЬ 2.1. МЕТОДИКА РАСЧЕТА И АНАЛИЗА МЕДИКО-ДЕМОГРАФИЧЕСКИХ ПОКАЗАТЕЛЕЙ
  • МОДУЛЬ 2.2. МЕТОДИКА РАСЧЕТА И АНАЛИЗА ПОКАЗАТЕЛЕЙ ЗАБОЛЕВАЕМОСТИ
  • МОДУЛЬ 2.3. МЕТОДИКА РАСЧЕТА И АНАЛИЗА ПОКАЗАТЕЛЕЙ ИНВАЛИДНОСТИ
  • МОДУЛЬ 2.4. МЕТОДИКА РАСЧЕТА И АНАЛИЗА ПОКАЗАТЕЛЕЙ ФИЗИЧЕСКОГО ЗДОРОВЬЯ НАСЕЛЕНИЯ
  • БЛОК 3. СТАТИСТИКА МЕДИЦИНСКОЙ И ЭКОНОМИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ УЧРЕЖДЕНИЙ ЗДРАВООХРАНЕНИЯ. МОДУЛЬ 3.1. МЕТОДИКА РАСЧЕТА И АНАЛИЗА СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ ДЕЯТЕЛЬНОСТИ АМБУЛАТОРНО-ПОЛИКЛИНИЧЕСКИХ УЧРЕЖДЕНИЙ
  • МОДУЛЬ 3.2. МЕТОДИКА РАСЧЕТА И АНАЛИЗА СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ ДЕЯТЕЛЬНОСТИ БОЛЬНИЧНЫХ УЧРЕЖДЕНИЙ
  • МОДУЛЬ 3.3. МЕТОДИКА РАСЧЕТА И АНАЛИЗА СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ ДЕЯТЕЛЬНОСТИ СТОМАТОЛОГИЧЕСКИХ ОРГАНИЗАЦИЙ
  • МОДУЛЬ 3.4. МЕТОДИКА РАСЧЕТА И АНАЛИЗА СТАТИСТИЧЕСКИХ ПОКАЗАТЕЛЕЙ ДЕЯТЕЛЬНОСТИ МЕДИЦИНСКИХ УЧРЕЖДЕНИЙ, ОКАЗЫВАЮЩИХ СПЕЦИАЛИЗИРОВАННУЮ ПОМОЩЬ
  • МОДУЛЬ 3.5. МЕТОДИКА РАСЧЕТА И АНАЛИЗА ПОКАЗАТЕЛЕЙ ДЕЯТЕЛЬНОСТИ СЛУЖБЫ СКОРОЙ МЕДИЦИНСКОЙ ПОМОЩИ
  • МОДУЛЬ 3.6. МЕТОДИКА РАСЧЕТА И АНАЛИЗА ПОКАЗАТЕЛЕЙ ДЕЯТЕЛЬНОСТИ БЮРО СУДЕБНО-МЕДИЦИНСКОЙ ЭКСПЕРТИЗЫ
  • МОДУЛЬ 3.7. МЕТОДИКА РАСЧЕТА И АНАЛИЗА ПОКАЗАТЕЛЕЙ ВЫПОЛНЕНИЯ ТЕРРИТОРИАЛЬНОЙ ПРОГРАММЫ ГОСУДАРСТВЕННЫХ ГАРАНТИЙ ОКАЗАНИЯ ГРАЖДАНАМ РОССИЙСКОЙ ФЕДЕРАЦИИ БЕСПЛАТНОЙ МЕДИЦИНСКОЙ ПОМОЩИ
  • МОДУЛЬ 3.9. МЕТОДИКА РАСЧЕТА И АНАЛИЗА ПОКАЗАТЕЛЕЙ ЭКОНОМИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ УЧРЕЖДЕНИЙ ЗДРАВООХРАНЕНИЯ
  • МОДУЛЬ 1.4. РАСЧЕТ ОПТИМАЛЬНОЙ ЧИСЛЕННОСТИ ВЫБОРКИ

    МОДУЛЬ 1.4. РАСЧЕТ ОПТИМАЛЬНОЙ ЧИСЛЕННОСТИ ВЫБОРКИ

    Цель изучения модуля: показать способы расчета оптимальной численности выборки при изучении общественного здоровья,

    деятельности системы (учреждений) здравоохранения и в клинической практике.

    После изучения темы студент должен знать:

    Преимущества использования выборочного метода;

    Способы формирования выборочной совокупности;

    Методы расчета оптимальной численности выборки. Студент должен уметь:

    Выбрать способ формирования выборочной совокупности в соответствии с задачами медико-социального исследования;

    1.4.1. Блок информации

    Статистическое наблюдение можно организовать как сплошное и несплошное. Сплошное наблюдение предусматривает обследование всех единиц изучаемой совокупности, несплошное - лишь ее часть. К несплошному наблюдению относится выборочное наблюдение. Цель выборочного наблюдения состоит в том, чтобы по характеристикам выборочной совокупности судить о характеристиках генеральной совокупности.

    При проведении медико-социальных исследований используют следующие способы формирования выборочной совокупности:

    Механический отбор;

    Типологический (стратифицированный) отбор;

    Серийный отбор;

    Многоступенчатый (скрининговый) отбор;

    Когортный метод;

    Метод отбора копи-пар.

    Формирование выборочной совокупности (выборки) позволяет получить такую совокупность единиц наблюдения, которая по интересующим исследователя признакам дает представление о генеральной совокупности. Для этого выборка должна быть репрезентативной (представительной).

    Репрезентативность выборки - соответствие характеристик, получаемых в результате выборочного наблюдения, аналогичным показателем генеральной совокупности.

    При проведении выборочного исследования нельзя получить абсолютно точные данные, как при сплошном наблюдении.

    Обусловлено это тем, что наблюдению подвергается не вся совокупность, а только ее часть. Поэтому при проведении выборочного исследования неизбежна некоторая погрешность (ошибки). Ошибки, свойственные выборочному исследованию, называются ошибками выборки.

    Ошибка выборки - расхождение между характеристиками выборочной и генеральной совокупностей. Как правило, она возникает в результате нарушения методологических принципов отбора единиц наблюдения при формировании выборочной совокупности и вызвана объективным различием целого (генеральной совокупности) и его части (выборки).

    Наибольшая из возможных ошибок выборки Δ называется предельной ошибкой выборки, которая рассчитывается по формуле:

    где S 2 - оценка дисперсии σ 2 , вычисляемая по выборке х 1 х 2 , х n .

    Средней ошибкой выборки (μ) называют различие между средними выборочной и генеральной совокупностями, которая по модулю не превышает σ.

    Тогда коэффициент доверия t характеризует ее кратность. В случае когда генеральная совокупность имеет конечный объем N, в среднюю ошибку выборки μ вводят поправочный коэффициент

    На формулах расчета предельной ошибки выборки основан способ определения численности выборки, обеспечивающей заданную точность оценки. Из формулы для предельной ошибки:

    следует:

    В случае генеральной совокупности конечного объема N аналогично можно найти:

    следовательно,

    Доверительный коэффициент t находится из таблицы квантилей нормального распределения при заданной надежности γ. При стандартных значениях надежности γ = 0,95 и γ = 0,99 соответствующие доверительные коэффициенты t равны t 0,95 = 1,96; t 0,99 = 2,58. Приведем еще два часто используемых значения: t 0,9544 = 2; t 0,9973 = 3. Если вместо σ в формуле фигурирует S, оказывается, что t зависит не только от γ, но и от n. В этом случае коэффициент t находят из таблицы квантилей распределения Стьюдента. При достаточно больших n следует, что S σ и соответствующие коэффициенты t при одинаковой надежности малоразличимы.

    При оценке вероятности р по относительной частоте ω из формулы:

    следует:

    Аналогично для генеральной совокупности конечного объема N получаем:

    следовательно,

    Таким образом, задав желаемую точность, т.е. указав предельную ошибку Δ, достаточный объем выборки n, обеспечивающий эту точность, можно найти по приведенным формулам. При n, больших найденного значения, точность увеличивается, поскольку предельная ошибка Δ уменьшается (см. формулы, связывающие n и Δ).

    1.4.2. Задания для самостоятельной работы

    1.Изучить материалы соответствующей главы учебника , модуля, рекомендуемой литературы.

    2.Ответить на контрольные вопросы.

    3.Разобрать задачу-эталон.

    4.Ответить на вопросы тестового задания модуля.

    5.Решить задачи.

    1.4.3. Контрольные вопросы

    1.В чем преимущество выборочного метода исследования?

    2.Дайте определение репрезентативности выборки.

    3.Дайте определение ошибки выборки.

    4.Назовите способы формирования выборочной совокупности.

    5.Дайте определение предельной ошибки выборки. Приведите формулы расчета.

    6.Дайте определение средней ошибки выборки. Приведите формулы расчета.

    1.4.4. Задача-эталон

    Исходные данные

    1. При изучении средней длительности пребывания больных в стационаре получены следующие данные: М = 20 дней, σ = 1,63 дня, μ = 0,16 дня.

    2. При изучении одногодичной летальности в онкологическом диспансере получен показатель 67,9%.

    Задание

    1)для получения достоверных результатов при изучении средней длительности пребывания больных в стационаре при заданном доверительном коэффициенте t Y = 3 (надежность γ = 0,9973) и предельной ошибке Δ = 0,5 дня;

    2)для получения достоверных результатов при изучении одногодичной летальности в онкологическом диспансере при заданном доверительном коэффициенте t Y = 2 (надежность γ = 0,9544) и предельной ошибке Δ = 0,05.

    Решение

    1. Расчет необходимого объема выборки для изучения средней длительности пребывания больных в стационаре:

    2. Расчет необходимого объема выборки для изучения одногодичной летальности в онкологическом диспансере:

    Вывод

    1.Для получения показателя средней длительности пребывания больных в стационаре с заданной точностью 0,5 дня необходимый объем выборки должен составить 96 больных.

    2.Для получения показателя одногодичной летальности с гарантированной точностью Δ = 0,05 необходимый объем выборки должен составить 352 больных.

    1.4.5. Тестовые задания

    Выберите только один правильный ответ. 1. Какая совокупность называется генеральной?

    1)достоверные данные, необходимые для исследования;

    2)отдельные единицы совокупности, отличающиеся друг от друга в силу различных случайных причин;

    3)неограниченное число единиц наблюдения;

    4)множество статистических элементов;

    5)множество качественно однородных единиц наблюдения, объединенных по одному или группе признаков.

    2. Часть единиц наблюдения генеральной совокупности, которая подвергается выборочному исследованию, называют:

    1)частичной совокупностью;

    2)случайной совокупностью;

    3)выборочной совокупностью;

    4)общей совокупностью;

    5)фрагментарной совокупностью.

    3. Назовите важнейшее условие объединения единиц наблюдения в выборочную совокупность:

    1)репрезентативность;

    2)однородность;

    3)разнообразие;

    4)конгруэнтность;

    5)случайность.

    4. Какие ошибки возникают вследствие того, что выборочная совокупность не воспроизводит в точности характеристики генеральной совокупности?

    1)ошибки выборки;

    2)ошибки регистрации;

    3)непреднамеренные ошибки;

    4)логические ошибки;

    5)систематические ошибки.

    5. Возможное расхождение характеристик выборочной и генеральной совокупностей измеряют:

    1)средним квадратическим отклонением;

    2)дисперсией;

    3)ошибкой выборки;

    4)корреляцией;

    5)ошибкой регистрации.

    6. Чем обеспечивается репрезентативность выборки?

    1)случайным отбором;

    2)ошибкой выборки;

    3)предельной ошибкой;

    4)средним квадратическим отклонением;

    5)случайной ошибкой.

    7. Что такое серийный отбор?

    1)отбор копи-пар единиц наблюдения;

    2)отбор единиц наблюдений с помощью генератора случайных чисел;

    3)отбор целых групп единиц наблюдения;

    4)многоступенчатый отбор единиц наблюдения;

    5)типологический отбор единиц наблюдения.

    8. Укажите формулу для вычисления предельной ошибки выборки:

    9. В каких случаях используется когортный метод?

    1)для изучения заболеваемости населения;

    2)анализа причинно-следственных связей заболеваемости и факторов риска;

    3)разработки целевых медико-социальных программ;

    4)изучения статистической совокупности относительно однородных групп лиц, объединенных наступлением определенного демографического события;

    5)анализа социальной эффективности деятельности системы здравоохранения.

    10. Необходимый объем выборки, обеспечивающий заданную точность, определяется по формуле:

    1.4.6. Задачи для самостоятельного решения

    Задача 1

    Исходные данные

    1.При предварительном изучении среднего роста школьников получены следующие данные: М = 132 см, σ = 3,18 см, μ = 0,13 см.

    2.При предварительном изучении заболеваемости городского населения получен показатель 980 0 / 00 .

    Задание

    Определить необходимый объем выборки:

    1)для получения достоверных результатов при изучении среднего роста школьников при коэффициенте доверия t = 3 и предельной ошибке Δ = 0,5 см;

    2)для получения достоверных результатов при углубленном изучении заболеваемости городского населения при коэффициенте доверия t

    Задача 2

    Исходные данные

    1.При предварительном изучении средней частоты сердечных сокращений (ЧСС) у подростков после физической нагрузки получены следующие данные: М=110в минуту, σ = 10,0 в минуту, μ = 4,0 в минуту.

    2.При изучении частоты встречаемости лиц, имеющих избыточную массу тела, получен показатель 528,4 0 / 00 .

    Задание

    Определить необходимый объем выборки:

    1)для получения достоверных результатов при изучении средней ЧСС у подростков после физической нагрузки при коэффициенте доверия t = 3 и предельной ошибке Δ = 0,5 в минуту;

    2)для получения достоверных результатов при изучении частоты встречаемости лиц, имеющих избыточную массу тела, при коэффициенте доверия t = 2 и предельной ошибке Δ = 2.

    Задача 3

    Исходные данные

    1. При предварительном изучении средней длительности временной нетрудоспособности больных, проходивших амбулаторное лечение по поводу болезней органов дыхания, были получены следующие данные: М = 12 дней, σ = 2,15 дня, μ = 0,2 дня.

    2. При предварительном изучении частота нарушения зрения лиц, длительно работающих за компьютером, отмечена значением

    257, 0 / 00 . Задание

    Определить необходимый объем выборки:

    1)для получения достоверных результатов при изучении средней длительности временной нетрудоспособности больных, проходивших амбулаторное лечение по поводу болезней органов дыхания, при коэффициенте доверия t = 3 и предельной ошибке Δ = 0,5 дня;

    Суммарная численность объектов наблюдения (люди, домохозяйства, предприятия, населенные пункты и т.д.), обладающих определенным набором признаков (пол, возраст, доход, численность, оборот и т.д.), ограниченная в пространстве и времени. Примеры генеральных совокупностей

    • Все жители Москвы (10,6 млн. человек по данным переписи 2002 года)
    • Мужчины-Москвичи (4,9 млн. человек по данным переписи 2002 года)
    • Юридические лица России (2,2 млн. на начало 2005 года)
    • Розничные торговые точки, осуществляющие продажу продуктов питания (20 тысяч на начало 2008 года) и т.д.

    Выборка (Выборочная совокупность)

    Часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение обо всей генеральной совокупности. Для того чтобы заключение, полученное путем изучения выборки, можно было распространить на всю генеральную совокупность, выборка должна обладать свойством репрезентативности.

    Репрезентативность выборки

    Свойство выборки корректно отражать генеральную совокупность. Одна и та же выборка может быть репрезентативной и нерепрезентативной для разных генеральных совокупностей.
    Пример:

    • Выборка, целиком состоящая из москвичей, владеющих автомобилем, не репрезентирует все население Москвы.
    • Выборка из российских предприятий численностью до 100 человек не репрезентирует все предприятия России.
    • Выборка из москвичей, совершающих покупки на рынке, не репрезентирует покупательское поведение всех москвичей.

    В то же время, указанные выборки (при соблюдении прочих условий) могут отлично репрезентировать москвичей-автовладельцев, небольшие и средние российские предприятия и покупателей, совершающих покупки на рынках соответственно.
    Важно понимать, что репрезентативность выборки и ошибка выборки – разные явления. Репрезентативность, в отличие от ошибки никак не зависит от размера выборки.
    Пример:
    Как бы мы не увеличивали количество опрошенных москвичей-автовладельцев, мы не сможем репрезентировать этой выборкой всех москвичей.

    Ошибка выборки (доверительный интервал)

    Отклонение результатов, полученных с помощью выборочного наблюдения от истинных данных генеральной совокупности.
    Ошибка выборки бывает двух видов – статистическая и систематическая. Статистическая ошибка зависит от размера выборки. Чем больше размер выборки, тем она ниже.
    Пример:
    Для простой случайной выборки размером 400 единиц максимальная статистическая ошибка (с 95% доверительной вероятностью) составляет 5%, для выборки в 600 единиц – 4%, для выборки в 1100 единиц – 3% Обычно, когда говорят об ошибке выборки, подразумевают именно статистическую ошибку.
    Систематическая ошибка зависит от различных факторов, оказывающих постоянное воздействие на исследование и смещающих результаты исследования в определенную сторону.
    Пример:

    • Использование любых вероятностных выборок занижает долю людей с высоким доходом, ведущих активный образ жизни. Происходит это в силу того, что таких людей гораздо сложней застать в каком-либо определенном месте (например, дома).
    • Проблема респондентов, отказывающихся отвечать на вопросы (доля «отказников» в Москве, для разных опросов, колеблется от 50% до 80%)

    В некоторых случаях, когда известны истинные распределения, систематическую ошибку можно нивелировать введением квот или перевзвешиванием данных, но в большинстве реальных исследований даже оценить ее бывает достаточно проблематично.

    Типы выборок

    Выборки делятся на два типа:

    • вероятностные
    • невероятностные

    1. Вероятностные выборки
    1.1 Случайная выборка (простой случайный отбор)
    Такая выборка предполагает однородность генеральной совокупности, одинаковую вероятность доступности всех элементов, наличие полного списка всех элементов. При отборе элементов, как правило, используется таблица случайных чисел.
    1.2 Механическая (систематическая) выборка
    Разновидность случайной выборки, упорядоченная по какому-либо признаку (алфавитный порядок, номер телефона, дата рождения и т.д.). Первый элемент отбирается случайно, затем, с шагом ‘n’ отбирается каждый ‘k’-ый элемент. Размер генеральной совокупности, при этом – N=n*k
    1.3 Стратифицированная (районированная)
    Применяется в случае неоднородности генеральной совокупности. Генеральная совокупность разбивается на группы (страты). В каждой страте отбор осуществляется случайным или механическим образом.
    1.4 Серийная (гнездовая или кластерная) выборка
    При серийной выборке единицами отбора выступают не сами объекты, а группы (кластеры или гнёзда). Группы отбираются случайным образом. Объекты внутри групп обследуются сплошняком.

    2.Невероятностные выборки
    Отбор в такой выборке осуществляется не по принципам случайности, а по субъективным критериям – доступности, типичности, равного представительства и т.д..
    2.1. Квотная выборка
    Изначально выделяется некоторое количество групп объектов (например, мужчины в возрасте 20-30 лет, 31-45 лет и 46-60 лет; лица с доходом до 30 тысяч рублей, с доходом от 30 до 60 тысяч рублей и с доходом свыше 60 тысяч рублей) Для каждой группы задается количество объектов, которые должны быть обследованы. Количество объектов, которые должны попасть в каждую из групп, задается, чаще всего, либо пропорционально заранее известной доле группы в генеральной совокупности, либо одинаковым для каждой группы. Внутри групп объекты отбираются произвольно. Квотные выборки используются в достаточно часто.
    2.2. Метод снежного кома
    Выборка строится следующим образом. У каждого респондента, начиная с первого, просятся контакты его друзей, коллег, знакомых, которые подходили бы под условия отбора и могли бы принять участие в исследовании. Таким образом, за исключением первого шага, выборка формируется с участием самих объектов исследования. Метод часто применяется, когда необходимо найти и опросить труднодоступные группы респондентов (например, респондентов, имеющих высокий доход, респондентов, принадлежащих к одной профессиональной группе, респондентов, имеющих какие-либо схожие хобби/увлечения и т.д.)
    2.3 Стихийная выборка
    Опрашиваются наиболее доступные респонденты. Типичные примеры стихийных выборок – в газетах/журналах, отданные респондентам на самозаполнение, большинство интернет-опросов. Размер и состав стихийных выборок заранее не известен, и определяется только одним параметром – активностью респондентов.
    2.4 Выборка типичных случаев
    Отбираются единицы генеральной совокупности, обладающие средним (типичным) значением признака. При этом возникает проблема выбора признака и определения его типичного значения.

    Курс лекций по теории статистики

    Более подробную информацию по выборочным наблюдениям можно получить просмотрев .

    Один из главных компонентов тщательно продуманного исследования – определение выборки и что такое репрезентативная выборка. Это как в примере с тортом. Ведь не обязательно съедать весь десерт, чтобы понять его вкус? Достаточно небольшой части.

    Так вот, торт – это генеральная совокупность (то есть все респонденты, которые подходят для опроса). Она может быть выражена территориально, например, лишь жители Московской области. Гендерно – только женщины. Или иметь ограничения по возрасту – россияне старше 65 лет.

    Высчитать генеральную совокупность сложно: нужно иметь данные переписи населения или предварительных оценочных опросов. Поэтому обычно генеральную совокупность «прикидывают», а из полученного числа высчитывают выборочную совокупность или выборку .

    Что такое репрезентативная выборка?

    Выборка – это чётко определенное количество респондентов. Её структура должна максимально совпадать со структурой генеральной совокупности по основным характеристикам отбора.

    Например, если потенциальные респонденты – всё население России, где 54% — это женщины, а 46% — мужчины, то выборка должна содержать точно такое же процентное соотношение. Если совпадение параметров происходит, то выборку можно назвать репрезентативной. Это значит, что неточности и ошибки в исследовании сводятся к минимуму.

    Объем выборки определяется с учётом требований точности и экономичности. Эти требования обратно пропорциональны друг другу: чем больше объем выборки, тем точнее результат. При этом чем выше точность, тем соответственно больше затрат необходимо на проведение исследования. И наоборот, чем меньше выборка, тем меньше на неё затрат, тем менее точно и более случайно воспроизводятся свойства генеральной совокупности.

    Поэтому для вычисления объема выбора социологами была изобретена формула и создан специальный калькулятор :

    Доверительная вероятность и доверительная погрешность

    Что означают термины «доверительная вероятность » и «доверительная погрешность »? Доверительная вероятность – это показатель точности измерений. А доверительная погрешность – это возможная ошибка результатов исследования. К примеру, при генеральной совокупности более 500 00 человек (допустим, проживающие в Новокузнецке) выборка будет равняться 384 человека при доверительной вероятности 95% и погрешности 5% ИЛИ (при доверительном интервале 95±5%).

    Что из этого следует? При проведении 100 исследований с такой выборкой (384 человека) в 95 процентов случаев получаемые ответы по законам статистики будут находиться в пределах ±5% от исходного. И мы получим репрезентативную выборку с минимальной вероятностью статистической ошибки.

    После того, как подсчет объема выборки выполнен, можно посмотреть есть ли достаточное число респондентов в демо-версии Панели Анкетолога . А как провести панельный опрос можно подробнее узнать .

    Когда Вы задаете вопрос «Сколько мне потребуется респондентов для опроса?», Вы на самом деле спрашиваете: «Насколько большой должна быть моя выборка, чтобы точно оценить мою совокупность?» Принимая во внимание сложность этих понятий, мы разбили процесс на 5 шагов, давая Вам возможность легко рассчитать идеальный объем выборки и обеспечить точность результатов опроса.

    5 шагов, с помощью которых Вы убедитесь, что Ваша выборка точно оценивает генеральную совокупность:

    Шаг 1

    Что представляет собой Ваша генеральная совокупность?

    Под термином «генеральная совокупность» мы понимаем целую группу людей, мнение которой Вы собираетесь выяснить (выборка будет состоять из членов этой совокупности, которые фактически примут участие в опросе).

    К примеру, если Вы хотите понять, как найти рынок сбыта для зубной пасты во Франции, Вашей совокупностью будут жители Франции. А если Вы пытаетесь определить, сколько дней отпуска предпочли бы иметь люди, работающие на компанию по производству зубной пасты, то Ваша генеральная совокупность - сотрудники этой компании.

    Независимо от того, страна это или компания, установление генеральной совокупности - это важный первый шаг. После того как Вы определились с генеральной совокупностью, установите (приблизительно) ее численность. Например, во Франции живут около 65 миллионов человек, а в компании-производителе зубной пасты работает, скорее всего, гораздо меньше сотрудников.

    Получили нужную цифру? Хорошо, тогда идем дальше…

    Шаг 2

    Какова требуемая точность?

    Этот шаг является своего рода оценкой того, на какой риск Вы готовы пойти в отношении возможной неточности ответов на опрос в связи тем фактом, что Вы не опрашиваете всю генеральную совокупность. Поэтому Вам следует ответить на два вопроса:

    1. Насколько уверенными Вы должны быть в том, что полученные ответы отображают мнения генеральной совокупности?
      Это Ваш предел погрешности. Итак, допустим, 90% членов выборки любят жевательную резинку со вкусом винограда. Предел погрешности в 5% добавляет по 5% с каждой стороны этого числа, что означает, что фактически 85-95% участников выборки любят жевательную резинку со вкусом винограда. 5% - наиболее часто используемый предел погрешности, но Вы можете устанавливать его значение от 1% до 10% в зависимости от опроса. Не рекомендуется поднимать этот показатель выше 10%.
    2. Насколько уверенными Вы должны быть в том, что выборка в точности представляет генеральную совокупность?

      Это Ваш уровень доверия. Уровень доверия - это вероятность того, что выборка является значимой для полученных результатов. Расчет, как правило, производится следующим образом. Если бы Вы в случайном порядке определили еще 30 выборок из данной совокупности, то как часто полученный Вами результат для одной выборки существенно отличался бы от результатов для других 30 выборок? Уровень доверия в 95% означает, что в 95% случаев результаты совпадали бы. 95% - наиболее часто используемое значение, но Вы можете установить его на уровне 90% или 99% в зависимости от опроса. Опускать значение уровня доверия ниже 90% не рекомендуется.

    Шаг 3

    Какого размера выборка мне нужна?

    В таблице, размещенной ниже, выберите приблизительный размер целевой совокупности и предел погрешности для определения количества требуемых завершенных опросов.

    Теперь, когда у Вас есть значения шага 1 и шага 2, по удобной таблице ниже определите размер требуемой выборки…

    Генеральная совокупность Предел погрешности Уровень доверия
    10% 5% 1% 90% 95% 99%
    100 50 80 99 74 80 88
    500 81 218 476 176 218 286
    1000 88 278 906 215 278 400
    10 000 96 370 4900 264 370 623
    100 000 96 383 8763 270 383 660
    1 000 000+ 97 384 9513 271 384 664

    Примечание . Данные приведены только в качестве ориентировочных инструкций. Кроме того, для генеральной совокупности свыше 1 млн. цифры можно округлять до сотен.

    Шаг 4

    Насколько отзывчивыми окажутся люди?

    К сожалению, не все, кому Вы отправите опрос, дадут на него ответ.

    Процент людей, заполнивших бланк полученного опроса, называют «процентной долей ответивших». Определение процентной доли ответивших на Ваш опрос поможет установить общее число экземпляров опроса, которое необходимо разослать для получения требуемого числа ответов.

    Процентная доля ответивших прямым образом зависит от ряда факторов, таких как отношения с целевой аудиторией, продолжительность и сложность опроса, предлагаемые поощрения и тема опроса. Для онлайн-опросов, в которых с получателями предварительно не были установлены отношения, процентная доля ответивших в 20-30% считается очень высокой. Более консервативным и вероятным является значение 10-14%, если Вы до этого не проводили опрос в данной совокупности.

    Шаг 5

    Так скольким же людям отсылать опрос?

    Это легкий этап!

    Просто разделите число, полученное на шаге 3, на число, полученное на шаге 4. Это и есть Ваше волшебное число.

    К примеру, если Вам нужно, чтобы опрос заполнили 100 женщин, пользующихся шампунем, и Вы считаете, что 10% женщин, которым Вы отправили опрос, его заполнят, требуется отослать опрос 1000 женщин (100/10%)!

    Приведенная ниже формула для расчета объема выборки используется в тех случаях, когда опрашиваемым (респондентам) задается только один вопрос, на который существует только два варианта ответа. Например, «Да» и «Нет»; «Пользуюсь» и «Не пользуюсь». Конечно, данную формулу можно применять только при проведении простейших исследований. Если Вам нужно определить объем выборки при проведении более масштабных исследований, например анкетирования, то следует использовать другие формулы.

    Простая формула для расчета объема выборки

    где: n – объем выборки;

    z – нормированное отклонение, определяемое исходя из выбранного уровня доверительности. Этот показатель характеризует возможность, вероятность попадания ответов в специальный - доверительный интервал. На практике уровень доверительности часто принимают за 95% или 99%. Тогда значения z будут соответственно 1,96 и 2,58;

    p – вариация для выборки, в долях. По сути, p - это вероятность того, что респонденты выберут той или иной вариант ответа. Допустим, если мы считаем, что четверть опрашиваемых выберут ответ «Да», то p будет равно 25%, то есть p = 0,25;

    q = (1 – p);

    e – допустимая ошибка, в долях.

    Пример расчета объема выборки

    Компания планирует провести социологическое исследование с целью выявить долю курящих лиц в населении города. Для этого сотрудники компании будут задавать прохожим один вопрос: «Вы курите?». Возможных вариантов ответа, таким образом, только два: «Да» и «Нет».

    Объем выборки в этом случае рассчитывается следующим образом. Уровень доверительности принимается за 95%, тогда нормированное отклонение z = 1,96 . Вариацию принимаем за 50%, то есть условно считаем, что половина респондентов может ответить на вопрос о том, курят ли они - «Да». Тогда p = 0,5 . Отсюда находим q = 1 – p = 1 – 0,5 = 0,5 . Допустимую ошибку выборки принимаем за 10%, то есть e = 0,1 .

    Подставляем эти данные в формулу и считаем:

    Получаем объем выборки n = 96 человек .

    Область применения данной формулы

    При проведении простых исследований, когда нужно получить ответ всего на один простой вопрос. При этом шкала ответов, как правило, дихотомического характера. То есть предлагаются (или подразумеваются) варианты ответов по типу «Да» - «Нет», «Черное» - «Белое», и т.д.

    Особенности данной формулы расчета объема выборки

    Галяутдинов Р.Р.


    © Копирование материала допустимо только при указании прямой гиперссылки на