Работаем по РФ и СНГ


Выборка исследования

Разговор о выборочной совокупности следует начать с понятия «генеральная совокупность». Планируя проведение исследования (особенно количественного), социолог неминуемо сталкивается с вопросом: «кого мы будем опрашивать?» Иначе говоря, необходимо понимание того, кто является носителем социального признака, требующего изучения, т.е. кого в себя включает генеральная совокупность.

Генеральная совокупность – это объединение реально существующих социальных объектов (индивидов, групп, домохозяйств и т.п.), которые представляют особый интерес для исследователя в рамках изучаемой проблемы. Казалось бы, зная, кто является носителем изучаемого признака, можно быстро и просто организовать и провести необходимый исследовательские действия. Однако, возникает следующий вопрос: какое количество социальных объектов обследовать? Зачастую генеральные совокупности имеют очень большой объем, например:

  • Население России – 147 млн. человек;
  • Граждане, пользующиеся городским транспортом – от нескольких тыс. до нескольких миллионов чел. (в зависимости от масштаба исследования);
  • Граждане пользующиеся услугами ЖКХ;
  • Посетители магазинов крупной торговой сети или пользователи определенного сервиса;
  • Юридические лица, пользующиеся услугами определенной организации.

В социологическом исследовании крайне редко опрашивается вся генеральная совокупность. Это, как правило, недостижимо, т.к. генеральная совокупность может составлять тысячи или даже миллионы и десятки миллионов человек. Опрашивать такое количество респондентов нереально, поскольку стоимость крайне высока, огромны сроки и человеческие затраты (исключение составляет, пожалуй, перепись населения, но это и не совсем социология). Для этого и прибегают к моделированию генеральной совокупности (выборки) в меньших масштабах, т.е. к построению выборочных совокупностей.



Выборочная совокупность (выборка) – часть представителей, которая изучается непосредственно в процессе исследовательского проекта, и от которой получают необходимую информацию.

Выборка должная быть репрезентативной, т.е. соответствовать ген. совокупности по основным признакам её объектов. Репрезентативность – это свойство выборки точно отображать (репрезентировать) генеральную совокупность по требуемым признакам. Признаки объектов выборки могут быть абсолютно разными, и в зависимости от типа выборок, они могут касаться возраста, пола, уровня доходов, территориального положения, образования и пр. Например: если соотношение мужчин к женщинам в регионе составляет 45/55%, то в выборке необходимо соблюсти аналогичные пропорции (при условии, что это соответствует задачам). Для разных генеральных совокупностей одна выборка может быть и репрезентативной, и нет, например:

  • Пользователи, недавно подключившиеся к услугам интернет провайдера, не могут репрезентировать мнения всех пользователей о качестве предоставляемых услуг данного поставщика (допустим, тех, кто пользуется услугами уже давно). Но в то же время они являются репрезентативной выборкой при изучении причин, почему новые пользователи предпочли выбрать данного провайдера;
  • Работники только одного предприятия не репрезентируют все предприятия отрасли. В то же время они являются репрезентативной выборкой для исследования проблем данного предприятия.

Существует достаточное количество формул расчета выборки, и в зависимости от того какая именно выборка требуется для исследований, выбирается формула. Более того, существует большое число онлайн калькуляторов расчета выборки или, наоборот, ошибок. Пример наиболее часто встречающейся формулы расчета для случайно бесповторной выборки:



N – известное количество единиц в генеральной совокупности;
p – существующая для единиц с исследуемым признаком (q = 1 - p);
t – коэффициент соответствия доверительной вероятности Р;
∆p – допустимая ошибка выборочной совокупности.

Погрешность

Ошибка выборки (погрешность) — это разность средних характеристик выборки и генеральной совокупности, которая встречается в статистическом или систематическом виде. Статистическая ошибка находится в зависимости от размеров выборки – чем больше объем выборки, тем сильнее вероятность, что в данную выборку попадут более разнообразные респонденты, что потенциально снижает ошибку выборки. К примеру, в случае выборки в 800 чел. при доверительной вероятности 95% ошибка составит 4%.

Доверительная вероятность равная 95% в опросе будут означать, что случайно отобранный ответ в 95% случаев попадет в доверительный интервал. Доверительный интервал — это предельные значения, в рамках которых с установленной доверительной вероятностью попадет статистическая величина. В нашем случае интервал составит ±4%, т.е. распределение 95% ответов будет лежать в пределах ±4% от нормали.

Систематическая ошибка – является следствием действий самого специалиста по исследованиям, принявшего неверные решения, то есть бывает вызвана различными перекосами в распределении выборки, смещениями внутри. Возникновение систематических ошибок происходит в следующих случаях:

  1. Выборка не в полной мере отражает цели исследования (исследователь решил изучить мнения жителей региона, а к анкетированию привлек только жителей регионального центра);
  2. Отсутствие понимания характеристик генеральной совокупности для выборки (например, пропорций респондентов по полу и возрасту);
  3. Отбор преимущественно «удобных» для исследователя респондентов для выборки (например, респонденты, которые находятся «под рукой»);
  4. Иные факторы (честность ответов респондентов, расхождение в смыслах терминов и т.п.).

Систематическая ошибка обладает вероятностью появления при стат. наблюдениях. В качестве примера такой ошибки можно привести данные о Всесоюзной переписи, полученные в 1970 г. В результате переписи соотношение состоящих в браке мужчин и женщин оказалось 53 млн. к 54 млн. соответственно. Систематическая ошибка выборки сформировалась из-за интересных погрешностей среди выборок по полам: только что подавшие заявление в ЗАГС женщины уже считали, что находятся в браке, в то время как мужчины все ещё нет.

Типы выборок

Выборки для проведения количественных исследований можно разделить на две основные категории:

  • Случайные (вероятностные);
  • Неслучайные (невероятностные).
Случайные выборки
  1. Случайная — такая выборка, при которой единицы исследования отбираются, например, с помощью случайной генерации;
  2. Стратификационная – выборка, при которой исследователь, в соответствии с задачами проекта, определяет страты, которые подлежат изучению. Страты должны быть более однородными, чем вся генеральная совокупность (читатели того или иного издания, сторонники той или иной партии и т.п.), затем из этих групп отбираются единицы обследования;
  3. Кластерная (гнездовая) — вид выборок, когда за единицу исследования рассматривается группа (семья, бригада), в которой затем опрашиваются все участники данной выборки;
  4. Систематическая - схожий со случайным типом выборок, но этом виде отбора имеет место шаг отбора, т.е. установленный интервал, через который отбираются опрашиваемые. К примеру, опрашивается каждый третий избиратель, выходящий из избирательного участка (шаг=3).
Неслучайные выборки
  1. Квотные выборки – микромодель ген. совокупности, когда известно статистическое распределение контрольных признаков элементов такой совокупности (пол, возраст, место жительства, уровень достатка и т.п.). Отличительной особенностью такой выборки является естественное формирование страт;
  2. Целевые выборки — такой вид отбора респондентов, когда в выборку попадают представители только целевой группы;
  3. Метод «снежного кома» - такой пример выборок, при которых каждого респондента, принявшего участие в исследовании, просят порекомендовать кого-либо среди его знакомых, кто подходит по признакам под параметры исследования.

Если подвести итоги, то корректно выбранная и рассчитанная выборка, а также верное определение объекта, предмета и задач является залогом успешно проведенного исследовательского проекта и получения релевантных данных.