© Г.В. Антонов, 2005

ОСОБЕННОСТИ ПРИМЕНЕНИЯ ВЫБОРОЧНОГО МЕТОДА В ПРИКЛАДНОЙ СОЦИОЛОГИИ

Г.В. Антонов

Практически в любых социологических исследованиях непосредственному изучению может быть подвергнута далеко не вся совокупность, условно составляющая объект исследования (так называемая генеральная совокупность), а лишь некоторая ее часть (то есть выборочная совокупность или выборка). Проблема в таком случае состоит в обеспечении репрезентативности изучаемой выборочной совокупности, то есть возможности переноса полученных на основе ее изучения результатов на всю интересующую исследователя генеральную совокупность. При этом в качестве подлежащих переносу на генеральную совокупность суждений о выборке обычно выступают утверждения о численном значении каких-либо параметров (например, утверждение о среднем арифметическом значении некоторого признака). Подобный перенос осуществляется с помощью методов математической статистики, позволяющих указать точность получаемых выводов, которая обычно выражается посредством доверительных интервалов. Доверительный интервал представляет собой диапазон значений вокруг оценки какого-либо параметра по выборочной совокупности, в котором с заданным уровнем доверия находится реальное значение этого параметра по генеральной совокупности. Уровень доверия — это оценочный показатель достоверности результата, полученного по выборочной совокупности, в сравнении его с аналогичным результатом, который мог бы быть получен при непосредственном изучении всей генеральной совокупности.

Допустим, объектом исследования является население крупного города в трудоспособном возрасте. Если все население города составляет 1 млн человек, то его трудоспособная часть — примерно 600 тыс. человек, что легко может быть установлено при помощи данных статистики. Эти 600 тыс. человек и составляют объект иссле-

дования, или идеальную генеральную совокупность. Однако реальная генеральная совокупность бывает, как правило, несколько меньше идеальной, поскольку некоторые представители последней не могут выступать в качестве респондентов в силу их труднодоступности. Такими труднодоступными элементами идеальной генеральной совокупности обычно выступают временно отсутствующие, тяжело больные, заключенные, военнослужащие, просто не склонные к общению люди и т. д. Все оставшиеся элементы идеальной генеральной совокупности, которые доступны, образуют реальную генеральную совокупность, и уже из нее осуществляется отбор респондентов в выборку. Именно поэтому не вполне правомерно полностью отождествлять объект исследования и генеральную совокупность, хотя иногда эти понятия могут совпадать.

В рассматриваемом нами случае реальная генеральная совокупность будет составлять не более 500 тыс. человек. Выборочная же совокупность даже в очень крупных исследованиях редко превышает 2,5 тыс. человек, а в большинстве случаев бывает гораздо меньше. Но даже 2,5 тыс. человек составляют всего 0,5 % от рассматриваемой в данном примере генеральной совокупности. Закономерно возникает вопрос: на основании чего осуществляется перенос результатов с выборки, составляющей в лучшем случае половину процента генеральной совокупности, на всю генеральную совокупность? Таким основанием зачатую как раз и выступает доверительный интервал с заданным уровнем доверия. Например, среднее арифметическое значение возраста респондентов в выборке составляет 40 лет, при этом нижняя и верхняя границы доверительного интервала с уровнем доверия 0,95 (р = 0,95) составляют соответственно 38 и 42 года. Это значит, что среднее арифметическое значение возраста по генеральной совокупности

с вероятностью 95 % будет находиться в диапазоне 38—42 года (то есть в пределах ±2 года, или ±5 % от значения данного параметра по выборке).

Вероятность 95 % при доверительном интервале ±5 % означает, что если из рассматриваемой генеральной совокупности случайным образом сформировать 100 одинаковых по объему выборок, то в 95 из них результат не будет отличаться от гипотетического результата по генеральной совокупности более чем на 5 %. Соответственно, оставшиеся 5 выборок из 100 будут давать результат, выходящий за границы установленного в данном случае доверительного интервала, следовательно ошибочный. Приемлемый это уровень точности или нет, решает исследователь в зависимости от поставленных им цели и задач, а также сроков проведения исследования, финансовых возможностей и т. д. В любом случае ему остается только надеяться, что сформированная им выборка окажется из числа тех 95, которые дают правильный результат. Обычно уровень доверия 0,95 считается достаточной степенью достоверности результата. Если установить больший уровень доверия, то доверительный интервал станет шире, поскольку чем выше степень неопределенности утверждения (доверительный интервал), тем больше вероятность того, что оно — истинно (уровень доверия). Ясно, что доверительный интервал 38—42 года — это суждение гораздо более определенное, чем, скажем, интервал 35—45 лет (или ±12,5 % от среднего по рассматриваемой в приведенном примере выборке). Поэтому вероятность истинности (уровень доверия) последнего по отношению к генеральной совокупности будет заметно выше и составит уже, например, 99 % (р = 0,99).

Ширина доверительного интервала при заданном уровне доверия зависит, во-пер-вых, от объема выборочной совокупности, а во-вторых, от разброса или «кучности» данных. Увеличение объема выборочной совокупности повышает точность оценки, тогда как увеличение разброса непосредственно наблюдаемых значений (или, что то же самое, уменьшение «кучности» данных) снижает ее. Если применительно к приведенному выше примеру при прочих равных условиях объем выборочной совокупности будет составлять не 2,5 тыс. человек, а 1,5 или 1 тыс., то придется либо снижать уровень доверия, либо делать шире доверитель-

ный интервал. Следует отметить, что объем выборки даже в 1 тыс. человек считается достаточно большим и в большинстве случаев обеспечивает высокую надежность получаемых выводов. При уменьшении объема выборочной совокупности до 100 единиц и ниже метод доверительных интервалов может не работать, а полученные по выборочной совокупности выводы могут совершенно не соответствовать выводам, которые могли бы быть получены при непосредственном обследовании всей генеральной совокупности. Здесь возникает следующий вопрос: каким должен быть оптимальный объем выборки для того, чтобы, с одной стороны, выводы были достаточно точны, а с другой — проведение исследования было экономически целесообразно и не слишком растянуто во времени?

На этот вопрос существует вполне четкий ответ. Если принять в качестве приемлемых уровень доверия 0,95, а доверительный интервал ±5 %, то при численности генеральной совокупности (т) 500 человек размер выборки (я) должен составлять 222 человека, а также:

т, чел. и, чел.

1 000 ...................... 286

2 000 ...................... 333

3 000 ...................... 350

4 000 ...................... 360

5 000 ...................... 370

10 000...................... 385

100 000 ...................... 398

более 100 000 .......................... 400

Иначе говоря, даже если объем генеральной совокупности возрастает до бесконечности, при данном уровне доверия и доверительном интервале размер выборки может не превышать 400 человек. При этом хотя ширина доверительного интервала ±5 % при уровне доверия 0,95 обычно считается приемлемой, иногда все же такая степень достоверности результата может показаться исследователю недостаточной или, напротив, избыточной. В этом случае ширину доверительного интервала можно изменить, изменив объем выборки. Например, если при объеме генеральной совокупности (т) более 100 тыс. человек и уровне доверия (р) 0,95 в качестве приемлемого принимается доверительный интервал (А) ±20 %, то размер выборки (п) должен составлять всего 25 человек. Если при тех же условиях (/77 и р) требуется Д = 15 %, то размер выборки должен быть 45 человек, а также (при тех же тир):

А, % и, чел.

10......................... 100

9......................123

8 156

7.........................204

6.........................286

5.........................400

4.........................625

3...................... 1 111

2...................... 2 500

1......................10 000

Приведенные или несколько меньшие размеры выборочной совокупности (за исключением двух последних значений) можно, в принципе, использовать и в тех случаях, когда размер генеральной совокупности значительно меньше, чем 100 тыс. человек, а составляет, например, 10 тыс. или даже 5 тыс. человек.

Вместе с тем все сказанное относительно объемов выборки справедливо только при условии, что все элементы генеральной совокупности (например, люди или семьи) одинаково доступны, имеют равные шансы попасть выборку, а их отбор производится строго случайным образом. Несмотря на кажущуюся простоту этого условия, оно может быть реализовано далеко не всегда, и следовательно, далеко не всегда при неограниченно большой генеральной совокупности можно обойтись выборочной совокупностью в 400 человек. Выборка, сформированная в полном соответствии с указанным условием, называется случайной, или вероятностной. Существует несколько разновидностей случайной выборки, но все они имеют один общий недостаток: сама возможность их использования напрямую зависит от объема генеральной совокупности. Дело в том, что если генеральная совокупность большая (десятки, сотни тысяч или даже миллионы человек), то, как уже говорилось, крайне редко все образующие ее единицы бывают одинаково доступными. Главный вопрос в этом случае заключается в том, насколько значительными будут различия между идеальной генеральной совокупностью (планируемым объектом исследования) и реальной, то есть совокупностью, из которой на самом деле будет осуществляться отбор респондентов в выборку. Если эти различия окажутся существенными, то они приведут к серьезным искажениям результатов исследования.

Подобные ошибки, когда реальная генеральная совокупность «уходит» далеко в

сторону от планируемого объекта исследования, называются систематическими ошибками выборки, или ошибками смещения. Выборка в таком случае формируется на основании совсем не той генеральной совокупности, о которой в действительности надеется получить информацию исследователь. Систематические ошибки выборки практически не поддаются непосредственному контролю, в отличие от ошибок случайных, которые как раз и выражаются с помощью доверительных интервалов. Если случайные ошибки быстро уменьшаются при возрастании объема выборочной совокупности, то систематические от него не зависят, поскольку уже изначально отбор респондентов в выборку производится из искаженной (смещенной) генеральной совокупности.

Если генеральная совокупность небольшая, допустим 2 тыс. человек (это могут быть все работники какого-либо предприятия, все учащиеся одной школы или вуза и т. д.), то практически все ее элементы одинаково доступны, а проблема обеспечения равенства шансов их попадания в выборку и случайности отбора решается относительно просто. Для этого, например, достаточно занести на карточки всех представителей генеральной совокупности (пофамильно, с помощью номеров или иным способом), после чего наугад извлечь необходимое количество карточек (в данном случае 333, поскольку объем генеральной совокупности — 2 тыс. человек). Лица, соответствующие фамилиям или номерам на карточках, и есть искомая выборочная совокупность. Если кто-то из числа попавших в выборку временно отсутствует (например, болен или в командировке), можно подождать их возвращения либо опять же наугад вытащить еще несколько карточек. Это не изменит результатов исследования сколько-нибудь заметно, если только отсутствующих не слишком много, что в рамках одной организации происходит, как правило, не часто. И даже если отсутствующих много, об этом должно быть хорошо известно организаторам исследования, поэтому ОНИ ВССГДЯ В СОСТОЯНИИ ПСШИТЬ, сто-ит ли вообще проводить его. Подобная процедура называется простой случайной или собственно случайной выборкой. Ясно, что она может быть реализована только для небольших генеральных совокупностей (до 2 тыс. человек), поскольку изготовить, надписать и равномерно перемешать 100 тыс. или 1 млн карточек — задача, в приемлемые сроки явно не выполнимая. Кроме того, единого списка

жителей крупного населенного пункта или региона просто не существует.

Поэтому, если объем генеральной совокупности возрастает (но еще не превышает, скажем, 10 тыс. человек), используют метод механической выборки, хотя и ее реализация также обязательно подразумевает наличие либо возможность составления общего нумерованного списка всех представителей генеральной совокупности. Суть данной процедуры состоит в том, что из такого списка через равные интервалы отбирается необходимое число респондентов. Например, если объем генеральной совокупности составляет

10 тыс. человек, то размер выборки должен быть 385 человек, а шаг отбора, соответственно: 10000 / 385 » 26. Это означает, что из единого списка генеральной совокупности каждый 26-й ее представитель попадает в выборку. Отбор может начинаться с начала списка (1-й, 27-й, 53-й и т. д.), с конца (10 000-й,

9 974-й, 9 948-й и т. д.), с середины в обе стороны — это не важно. Важно другое: не допустить систематических ошибок, то есть составить верный список представителей генеральной совокупности. Если таковыми являются, к примеру, все сотрудники некоторой крупной организации, то надо не забыть внести в данный список работников филиалов этой организации (возможно, также совместителей) и при этом не вписать в него лиц, недавно уволившихся, длительно отсутствующих и т. д.

Иногда имеется возможность разбить генеральную совокупность на относительно однородные части или серии. В качестве таких серий могут выступать структурные подразделения организации (отделы, управления, филиалы, а если речь идет о вузе — то факультеты), совокупности работников одинакового профиля (в рамках одной организации) и т. д. Из каждой серии отбор респондентов производится отдельно методом простой случайной либо механической выборки. При этом важно, чтобы количество респондентов, отобранных из каждой серии, было пропорционально общему числу элементов своей серии. Общая формула расчета числа респондентов, подлежащих отбору из каждой серии, выглядит так:

п = (т.х п)/ т,

где I — номер серии, выделенной в генеральной совокупности,

т; — число единиц в данной серии, п — объем выборки,

т — численность генеральной совокупности.

Например, исследователя интересует мнение работников организации, общая численность которой — 10 тыс. человек, следовательно, объем выборки должен быть 385 человек. Допустим, данная организация состоит из трех отделений: А, Б и В. Численность отделения А составляет 5 тыс. человек, отделения Б — 3 тыс., отделения В — 2 тыс. Тогда из отделения А в выборку должны попасть: (5 000 х 385) /10 000 « 192 человека, из отделения Б — (3 000 х 385) / 10 000 « 116, из отделения В — (2 000 х 385) /10 000 = 77 человек, итого: 192+ 116 +77 = 385 человек. Данная процедура называется серийной выборкой.

Наконец, еще одна разновидность случайной выборки — гнездовая. Процедура гнездовой выборки представляет собой отбор не отдельных респондентов, а групп, численность которых не превышает 40 человек (оптимально — 15—25 человек), с последующим сплошным опросом в выбранных группах. Отбор групп происходит по принципу формирования простой случайной или механической выборки. Пример такой группы — школьный класс или студенческая группа. Скажем, в вузе обучается 10 тыс. студентов, а значит, требуемый объем выборки — 385 человек. Если численность одной группы составляет в среднем приблизительно 25 человек, то всего в данном учебном заведении должно быть: 10 000 / 25 = 400 групп. Количество групп, которое необходимо отобрать, определяется так: 385 / 25 » 15. Но 15 групп по 25 человек — это только 375 человек, тогда как необходимо 385. Поэтому в данном случае целесообразно отобрать не 15, а 16 групп, поскольку если выборка оказывается немного больше расчетной, это — совершенно нормально. Таким образом, из 400 групп предстоит отобрать 16, и если воспользоваться для этого методом механической выборки, то шаг отбора будет составлять: 400 / 16 = 25, иначе говоря, из перечня групп будет отобрана каждая 25-я. Процедура гнездовой выборки может быть реализована только при условии, что все группы максимально сходны между собой по основным социально-демографическим параметрам

Перечисленные процедуры формирования выборки потому и называются случайными, или вероятностными, что отбор респондентов в них производится строго случайным образом, единицы генеральной совокупное! и имеют равную вероятность попасть в

выборку, а получаемые при этом значения распределяются строго в соответствии с законами теории вероятностей. Одним из таких законов является закон нормального распределения, суть которого состоит в том, что при достаточно большом числе единиц анализа (и >100) и абсолютно случайном их отборе 68,27 % значений интересующего исследователя признака расположены в пределах ± 1 стандартное отклонение от среднего ариф-метического значения данного признака,

95.45 % значений расположено в пределах ±2 стандартных отклонения, 99,73 % — в пределах ±3 стандартных отклонения, 99,99 % — в пределах ±4 стандартных отклонения и т. д. Стандартное (среднеквадратическое) отклонение, как известно, представляет собой корень квадратный из дисперсии (центрального момента распределения второго порядка), то есть величины, характеризующей степень разброса значений рассматриваемого признака.

Пример из практики. Имеется репрезентативная выборочная совокупность (то есть сформированная с соблюдением обозначенного ранее условия) объемом 900 человек, где среднее арифметическое значение возраста респондентов составляет 18,39 года, дисперсия — 1,91, стандартное отклонение — 1,38 года, а доверительный интервал — ±0,49 % (или ±0,09 года) при уровне доверия 95,45 %. Это значит, что 68,27 % значений (614 человек) признака «возраст» по данной выборке попадают в интервал ± 1,38 года от среднего арифметического (то есть от 17,01 до 19,76 года),

95.45 % значений (859 человек) — в интервал ±2,76 года (от 15,62 до 21,14 года), 99,73 % (898 человек) — в интервал ±4,14 года (от 14,25 до 22,53 года). Высокая это «кучность» значений или нет — сказать трудно, если не знать цель и задачи исследования, в рамках которого данная выборка была реализована. Одно можно сказать точно: среднее арифметическое — это очень информативный показатель, дающий весьма определенное представление о структуре изучаемой совокупности, если одновременно с ним указывается величина дисперсии или стандартного отклонения.

Доверительный же интервал ±0,49 % (±0,09 года) при уровне доверия 95,45 % означает, что среднее арифметическое возраста по генеральной совокупности (генеральное среднее) с вероятностью 95,45 % окажется в интервале ±0,09 года (то есть от 18,30 до 18,48 года) от среднего арифметического этого же признака по выборке (выборочное среднее). Иначе говоря, если бы из приведенной

в примере генеральной совокупности случайным образом было сформировано 1000 выборок объемом по 900 человек, то 954 или 955 из них дали бы выборочное среднее по возрасту, не отличающееся от генерального среднего более чем на 0,49 % (на 0,09 года). Оставшиеся 45 или 46 выборок из 1000 дали бы результат, выходящий за границы установленного в данном случае доверительного интервала, то есть ошибочный. Уровень доверия 95,45 % (р = 0,9545) — это не что иное, как процент значений, попадающих в интервал ±2 стандартных отклонения. Если рассчитать выборочные средние по всем возможным одинаковым по объему выборкам, какие только могут быть сформированы из одной и той же генеральной совокупности, а затем рассчитать среднее арифметическое всех выборочных средних, то полученное значение будет в точности соответствовать генеральной средней. Соответственно, выборочное среднее по одной случайно сформированной выборке будет с определенной вероятностью находиться в определенном интервале вокруг генеральной средней. Сам этот интервал и есть величина случайной ошибки выборки. Поскольку данная величина ошибки является предельно (то есть максимально) допустимой, она называется предельной ошибкой выборки.

Количество численных значений одного стандартного отклонения в статистике обозначается буквой г. Тогда:

г уровень доверия, %

1........................68,27

2........................95,45

3........................99,73

4........................99,99

Средняя величина случайной ошибки выборки, то есть среднее арифметическое всех отклонений выборочного среднего от генерального среднего, зависит только от двух параметров: разброса значений признака по генеральной совокупности и объема выборки. Если выборка абсолютно случайна, а ее объем достаточно большой (см. приводимое ранее соотношение объемов генеральной и выборочной совокупностей), то разброс значений какого-либо признака по генеральной совокупности должен соответствовать разбросу значений этого признака по выборке. Поэтому средняя величина случайной ошибки выборки определяется по формуле: ц = а /"'/я,'

где а — стандартное отклонение; п — объем выборки.

Предельная же ошибка выборки непосредственно зависит от приемлемого для исследователя уровня точности (/) и определяется по формуле Д = ц х а. Если заранее имеются сведения об однородности генеральной совокупности и возможен хотя бы приблизительный расчет дисперсии или стандартного отклонения, то можно до начала исследования оценить величину предельной ошибки. Еще раз повторяем, что это справедливо только при условии реализации процедуры случайной выборки.

Сведения о распределении значений основных признаков генеральной совокупности (пол, возраст, национальность, религиозная принадлежность, уровень образования и т.д.) в зависимости от того, что из себя эта совокупность представляет (коллектив организации, регион, страна в целом), имеются в отделах (управлениях) кадров, ведомственных архивах, учреждениях государственной статистики, документах ранее проводивших исследований по сходной тематике и т. д. Все эти данные в общем-то доступны, но нужно помнить, что они не всегда точны, и, следовательно, есть риск появления систематических ошибок, которые крайне трудно отследить на каком бы то ни было этапе исследования. Поэтому очень важно до начала исследования получить как можно больше информации о структуре генеральной совокупности, причем желательно из нескольких источников. Если признаков генеральной совокупности, по которым возможна оценка дисперсии или стандартного отклонения, несколько, то в качестве основы для расчета предельной ошибки выборки используют признак, разброс значений которого наибольший. То же самое делают и при расчете предельной ошибки на основании данных, полученных по выборочной совокупности.

Формула ц = а / V п используется, только если а (стандартное отклонение) рассчитано для признака, значения которого получены по интервальной шкале (или шкале более высокого уровня). Чтобы повысить точность расчета средней ошибки выборки (и, соответственно, предельной ошибки — Д), можно использовать формулу:

ц = V((ст2/«) х (1 _л//и)),

где т — объем генеральной совокупности.

Из формул А=/Х|ц,иц = а/^л можно получить формулу объема выборки:

п = (/ X ст)2/ Д2,

где г — достаточный, по мнению исследователя, уровень доверия,

А — приемлемая, по его же мнению, величина доверительного интервала или предельной ошибки, а — стандартное отклонение значений признака генеральной совокупности, по которому производится расчет объема выборки.

Следует отметить, что величина Д измеряется обычно в процентах, но в формулу подставляются не его процентные значения, а абсолютное значение (например, при заданном доверительном интервале ±5 % в формулу подставляют значение 0,05). Ясно, что если нет вообще никакой информации о структуре генеральной совокупности, то применение каких бы то ни было формул для расчета объема выборки становится невозможным. В этом случае следует воспользоваться приводимыми выше соотношениями объемов генеральной и выборочной совокупностей.

Иногда при строго случайном отборе и обычных параметрах точности объем выборки может значительно превышать 400 человек и составлять, например, 1 тыс. или даже 2 тыс. человек. Это делается для того, чтобы при заданном уровне доверия оценить различия внутри выборочной совокупности между группами, выделяемыми по значимым для исследователя критериям. Дело в том, что численность таких групп должна быть достаточной, чтобы различия можно было считать значимыми, то есть неслучайными. Например, если принять в качестве приемлемого уровень доверия 0,95 (то есть г» 2), то при численности сравниваемых групп (пт) в 50 человек значимыми можно считать различия между ними (Дг), если они составляют не менее 20 %. Ясно, что различие по признаку «возраст» между группами указанной численности статистически не значимо, если средние арифметические зна-

чения возраста в этих группах составляют, скажем, 31 и 32 года. Такое различие составляет немногим более 3 %, и его с полной уверенностью можно считать случайным. При увеличении численности сравниваемых групп значимыми можно считать меньшие различия между ними. Если численность сравниваемых групп составляет 100 человек, то при том же уровне доверия (р = 0,95)

значимыми можно считать различия в 14 %. Далее:

п, чел. А %

Г7 г,

150......................11,5

200......................10,0

300 ...................... 8,0

500 ...................... 6,3

1000.........................4,5

5 000 ...................... 2,0

Если численность сравниваемых групп разная, то в качестве значимых принимают различия, которые значимы для группы, численность которой наименьшая. Иначе говоря, даже если сравнивать две подвыборки, численность одной из которых 50 человек, а другой — 5 тыс. человек, то значимыми все равно должны считаться различия не менее 20 %.

Кроме рассмотренных выше случайных выборок, существуют еще так называемые целенаправленные, по отношению к которым неприменимы положения теории вероятностей. Процедуру целенаправленной выборки используют только, если нет возможности реализовать модель случайной выборки. Как и случайная выборка, целенаправленная тоже имеет несколько разновидностей, и все они имеют один серьезный недостаток — нереп-резентативность. Иначе говоря, полученные по такой выборочной совокупности результаты обычно можно распространять только на саму эту совокупность. Наиболее часто и вьтраженно этот недостаток проявляется при использовании такой разновидности целенаправленной выборки, как стихийная. Данная процедура предполагает опрос лиц, которые наиболее доступны для исследователя. Единственным критерием отбора респондентов служит их видимая принадлежность к реальной или гипотетической генеральной совокупности. Например, исследователь может опрашивать всех склонных к общению прохожих на улице, возраст которых визуально находится в пределах 20—40 лет. Или — редакция газеты может провести опрос среди своих читателей, опубликовав анкету на страницах самой газеты. Естественно, анкеты в редакцию пришлют лишь немногие читатели, однако если тираж газеты большой, то даже 1 % или 0,1 % подписчиков, приславших свои анкеты, — это очень много. Проце-

дура стихийной выборки практически исключает какую бы то ни было оценку репрезентативности, при этом известно, что вероятность возникновения систематических ошибок здесь очень велика.

Из всех целенаправленных выборочных процедур наиболее предпочтительной является квотная выборка. Данную процедуру используют, когда объем генеральной совокупности велик и при этом имеется достаточно информации о ее основных параметрах. Подобной генеральной совокупностью может быть все население большого города или региона, а ее параметрами в таком случае — соотношения населения по полу, возрасту, национальности, уровню образования и т. д. Все эти и многие другие данные содержатся в различного рода статистических сборниках. Например, если известно, что соотношение в генеральной совокупности по полу составляет 51 % женщин и 49 % мужчин, то и в выборке их соотношение должно быть точно таким же. Аналогичным образом обеспечивают соответствие и других параметров выборки соответствующим параметрам генеральной совокупности. Используя квотную выборку, исследователь делает достаточно обоснованное предположение о том, что если выборочная совокупность по основным (контрольным) признакам соответствует генеральной, то она будет соответствовать ей и по всем остальным признакам. Обычно так и происходит, поскольку пол, возраст, национальность, уровень образования, место жительства и другие признаки, часто выступающие в качестве контрольных, в значительной степени определяют ценностные ориентации, образцы и стереотипы мышления и поведения индивида. Однако бывают все же случаи, когда последние определяются совсем другими признаками, нежели принятыми исследователем в качестве контрольных, что приводит к потере репрезентативности. Поэтому, если есть возможность, всегда следует использовать процедуру случайной выборки2.

ПРИМЕЧАНИЯ

1 Основы прикладной социологии: Учебник для вузов / Под ред. Ф.Э. Шереги и М.К. Горшкова. М.: Интерпракс, 1996. С. 33—35.

2 Там же. С. 35—36.