factors of discrimination of women in employment sphere. The dynamics of integration and effective functioning in the labor market is traced.

Key words: career, discrimination, employment, gender, inequality, labor-market, obstacle, qualification, training.

Получено 20.03.2010 г.

УДК 316:303.722.4:303.723

А.А. Алексеёнок, канд. социол. наук, доц., 89192676939, alexaconst@rambler.ru (Россия, Орел, ОРАГС)

ПОИСК ВЗАИМОЗАВИСИМОСТЕЙ И КЛАССИФИКАЦИЯ ОБЪЕКТОВ ЭМПИРИЧЕСКОГО СОЦИОЛОГИЧЕСКОГО ИССЛЕДОВАНИЯ

Нашли отражения материалы, посвященные аналитической обработке эмпирического социологического исследования методами корреляционного и кластерного анализа на примере социальной адаптации вынужденных мигрантов.

Ключевые слова: социологическое исследование, эмпирическая база,

кластерный анализ, корреляционный анализ, вынужденные мигранты, социальная адаптация

Любые методы обработки данных так или иначе используются для структурирования и анализа существующей информации. Методов для анализа эмпирической социологической информации много, однако в данной статье нам хотелось бы остановиться на тех, которые эффективно применяют для обработки полученной эмпирической информации с большим количеством разнородных параметров.

Например, для анализа состояния процесса социальной адаптации вынужденных мигрантов и его оптимизации мы сегментировали мигрантов на группы по определенным параметрам: пол, возраст, образование и т.д. Для этого существует набор математических методов, позволяющих установить закономерности и упорядочить эмпирическую информацию.

Для анализа могут быть использованы данные четырех типов [2]: численные данные (численность иммигрантов); интервальные данные (доля вынужденных мигрантов среди общего числа иммигрантов; %); ранговые данные (социальная привлекательность Орловской области для вынужденных мигрантов); номинальные данные (профессия вынужденного мигранта: учитель, военный, строитель, инженер). Все данные, которые подходят под один из этих типов, могут быть проанализированы с помощью формальных методов.

Для того чтобы работали большинство методов, желательно иметь более 50 опрошенных респондентов (малая выборка) [3].

Этого количества респондентов обычно достаточно для получения

информации, что в данной выборке наблюдается статистический эффект. Однако для разделения на группы необходимо иметь уже гораздо большее число респондентов - примерно 50, умноженное на число групп.

Так, для получения репрезентативной информации при выделении 3-х групп вынужденных мигрантов необходимо иметь более 150 респондентов. Бесспорно, что чем больше численность опрошенных респондентов, тем достоверней полученная информация, но оптимальное число репондентов расчитывается по формуле, где ошибка выборки не превышает 3 %.

Для определения степени влияния и взаимовлияния исследуемых переменных используют метод корреляционного анализа.

Корреляционный анализ - метод социологического исследования позволяющий выделить зависимость между числовыми случайными величинами, не имеющими строгого функционального характера. Как правило, применяется в том случае, когда, по кр айней мере, одна из величин зависит не только от другой, но и от ряда случайных факторов.

При исследовании связей между признаками используют корреляционные таблицы. С их помощью можно охарактеризовать и тесноту связи, описываемую коэффициентами корреляции, и форму ее, описываемую уравнениями регрессии. В случае прямолинейной связи используется парный коэффициент корреляции в случае криволинейной -корреляционное отношение. Математической мерой корреляции двух случайных величин служит коэффициент корреляции.

Корреляционный анализ заключается в изучении коэффициентов корреляции между переменными, с целью получения информацию об одной переменной с помощью другой для установления между ними статистических взаимосвязей или взаимозависимостей. Тем не менее, корреляция отражает лишь линейную зависимость величин, но не отражает их функциональной взаимосвязи.

Применение в социологических исследованиях корреляционного анализа рассмотрим на примере анализа результатов панельного исследования процесса социальной адаптации вынужденных мигрантов проводимого в 2003, 2005, 2007г.г.

Корреляционный анализ эмпирической базы (табл. 1) показал, что степень адаптации вынужденных мигрантов наиболее тесно связана с категорией семьи по уровню материального обеспечения до переезда, с оценкой своих перспектив, с эмоциональным отношением к решению проблем адаптации и с планами на жительство.

Таблица 1

Результаты корреляционного анализа степени социальной адаптации

Индикатор Коэффициент корреляции (по Спирману) Значимость обратной гипотезы (двухстор онняя)

1 2 3

уровень образования -0,126* 0,011

уровень материальной обеспеченности 0,300* 0,023

оценка жизненных перспектив 0,289* 0,031

оценка перспектив адаптации 0,480** 0,000

устойчивость решения остаться на новом месте жительства 0,515** 0,000

Примечание: * корреляция значима на уровне 0,05 ** корреляция значима на уровне 0,01

Как видно из табл. 1, в процессе корреляционного анализа по степени адаптации вынужденных мигрантов выявлены следующие статистически значимые зависимости:

- обнаружена прямо пропорциональная зависимость между степенью адаптации и материальной обеспеченностью семьи до переезда: чем выше был материальный достаток семьи до миграции, тем выше степень адаптации на новом месте после миграции - однако эта зависимость слабая;

- обнаружена прямо пропорциональная зависимость между степенью адаптации и оценкой собственных перспектив: чем выше мигрант оценивает свои перспективы, тем более полно он адаптируется на новом месте - эта зависимость также слабая;

- обнаружена прямо пропорциональная зависимость между степенью адаптации и взглядом на решение проблем адаптации на новом месте: чем более оптимистичен взгляд на решение проблем адаптации, тем более успешен процесс адаптации - зависимость средней силы;

- обнаружена прямо пропорциональная зависимость между степенью адаптации и планами на жительство: чем более успешна адаптация, тем более твердо решение остаться на выбранном месте - зависимость выше среднего уровня.

По результатам корреляционного анализа степени адаптации вынужденных мигрантов можно сделать следующий вывод. Наиболее успешно адаптируются вынужденные мигранты с достаточно высоким материаль-

ным достатком до переезда, установкой на достижение жизненного успеха, смотрящих на решение проблем адаптации с надеждой и оптимизмом, что приводит к твердому решению остаться на выбранном месте. При этом степень адаптации практически не зависит от типа населенного пункта прежнего проживания, времени проживания на новом месте, возраста и уровня образования.

Корреляционный анализ эмпирической базы (табл. 1) показал, что степень адаптации вынужденных мигрантов наиболее тесно связана с категорией семьи по уровню материального обеспечения до переезда, с оценкой своих перспектив, с эмоциональным отношением к решению проблем адаптации и с планами на жительство.

Одним из методов, который раскрывает дифференцирующий потенциал эмпирической социологической базы, является кластерный анализ.

Термин кластерный анализ (впервые ввел Р. Трион в 1939 г. [4]) в действительности включает в себя набор различных алгоритмов классификации.

Общий вопрос, задаваемый исследователями во многих областях, состоит в том, как разбить данные на группы с близкими значениями параметров. Ответ на него дает класатерный анализ, с помощью которого заданная выборка разбивается на отдельные сегменты- кластеры. Каждый кластер должен состоять из схожих объектов. Объекты же разных кластеров должны существенно отличаться.

Кластерный анализ можно определить как многомерную статистическую процедуру, выполняющую сбор данных, содержащих информацию о выборке объектов, и упорядочивающую объекты в относительно однородные группы - кластеры. Таким образом, кластер представляет собой группу элементов, со сходными свойствами, параметрами, характеристиками, схожими объектами в выборке.

С помощью кластерного анализа можно решить следующие задачи:

- разработка типологии и классификации объектов выборочной совокупности;

- исследование концептуальных схем группировки объектов;

- выработка рабочих гипотез на основе анализа эмпирической информации;

- проверка, действительно ли кластеры, выделенные тем или иным способом, присутствуют в эмпирическом материале.

Применение кластерного анализа предполагает следующие взаимосвязанные этапы:

- отбор выборочной совокупности для кластеризации;

- определение ряда переменных, по которым будут определяться объекты в выборке;

- выявление значений степени сходства между объектами выборки;

- создание групп сходных объектов;

- проверка достоверности результатов процедуры кластеризации.

Данные для кластерного анализа должны соответствовать ряду

требований:

- показатели на должны кор рлир оавь между собо й то есть переменные должны быть независимы друг от друга при методе к-средних и двушаговом методе (при иерархическом методе это правило соблюдать не обязательно);

- распределение данных должно быть максимально близким к нормальному;

- показатели должны быть устойчивыми, то есть не подвергаться воздействию случайных факторов;

- выборочная совокупность должна быть однородна.

Рассмотрим применение кластерного метода на примере анализа

результатов панельного исследования процесса социальной адаптации вынужденных мигрантов проводимого в 2003, 2005, 2007г.г.

Классификация респондентов позволяет выявить группы вынужденных иммигрантов с различной степенью социальной адаптации.

В качестве метода классификации мы применили иерархический кластерный анализ (метод Уорда, квадрат евклидова расстояния). В кластерный анализ включены следующие переменные: длительность проживания на новом месте, степень адаптации, оценка перспектив адаптации и возраст.

В результате кластерного анализа образованы 3 кластера, половозрастная характеристика которых представлена в табл. 2.

Таблица 2

Половозрастная характеристика кластеров

Возраст, лет Пол Кластер Всего

1 2 3

1 2 3 4 5 6 7

16-25 мужской численность, чел. 0 0 36 36

доля в кластере, % 0,0 0,0 27,3 8,6

женский численность, чел. 0 0 61 61

доля в кластере, % 0,0 0,0 46,2 14,6

всего численность, чел. 0 0 97 97

доля в кластере, % 0,0 0,0 73,5 23,2

1 2 3 4 5 6 7

26-30 Мужской численность, чел. 7 0 7 14

доля в кластере, % 4,5 0,0 5,3 3,3

женский численность, чел. 6 0 21 27

доля в кластере, % 3,8 0,0 15,9 6,4

всего численность, чел. 13 0 28 41

доля в кластере, % 8,3 0,0 21,2 9,8

31-40 мужской численность, чел. 17 0 3 20

доля в кластере, % 10,8 0,0 2,3 4,8

женский численность, чел. 27 18 1 46

доля в кластере, % 17,2 13,8 0,8 11,0

всего численность, чел. 44 18 4 66

доля в кластере, % 28,0 13,8 3,0 15,8

41-50 мужской численность, чел. 25 18 1 44

доля в кластере, % 15,9 13,8 0,8 10,5

женский численность, чел. 19 36 2 57

доля в кластере, % 12,1 27,7 1,5 13,6

всего численность, чел. 44 54 3 101

доля в кластере, % 28,0 41,5 2,3 24,1

51-55 мужской численность, чел. 13 0 0 13

доля в кластере, % 8,3 0,0 0,0 3,1

женский численность, чел. 26 9 0 35

доля в кластере, % 16,6 6,9 0,0 8,4

всего численность, чел. 39 9 0 48

доля в кластере, % 24,8 6,9 0,0 11,5

Старше 55 мужской численность, чел. 6 22 0 28

доля в кластере, % 3,8 16,9 0,0 6,7

женский численность, чел. 11 27 0 38

доля в кластере, % 7,0 20,8 0,0 9,1

всего численность, чел. 17 49 0 66

доля в кластере, % 10,8 37,7 0,0 15,8

всего мужской численность, чел. 68 40 47 155

доля в кластере, % 43,3 30,8 35,6 37,0

женский численность, чел. 89 90 85 264

доля в кластере, % 56,7 69,2 64,4 63,0

всего численность, чел. 157 130 132 419

доля в кластере, % 100,0 100,0 100,0 100,0

среднее значение возраста, лет 41-50 51-55 16-30 31-50

Как видно из табл. 2 наиболее молодым кластером является № 3, в который включены все респонденты в возрасте 16-25 лет, большинство в

возрасте 26-30 лет и ни одного из вынужденных иммигрантов предпенсионного и пенсионного возраста. Большинство пожилых респондентов выделено в кластер № 2.

Несмотря на достаточно высокую степень адаптации респондентов на новом месте, выявлены существенные различия между кластерами в самооценке адаптированности (рис. 1).

Степень

адаптации

■-100,0

1 - полная адаптация

2 - не полная адаптация

3 - частичная адаптация

4 - незначительная адаптация

5 - полная дезадаптация

Рис. 1 Степень адаптации вынужденных иммигрантов, выделенных в различные кластеры.

Как видно из рис. 1, в наибольшей степени адаптировались к новым условиям респонденты кластера № 2. Доля респондентов, считающих полную адаптацию к новым условиям почти невозможной, в два раза больше в третьем кластере, чем в первом. Респонденты кластера № 2 также с большим оптимизмом смотрят на перспективы полной адаптации, чем вынужденные иммигранты, отнесенные к двум другим кластерам (рис. 2).

Оценка перспектив адаптации

1 - с надеждой и оптимизмом 4 - с тревогой и неуверенностью

2 - спокойно 5 - со страхом и отчаянием

3 - без особых надежд и иллюзий

Рис. 2. Перспектива адаптации вынужденных иммигрантов, выделенных в различные кластеры

Как видно из рис. 2, никто из респондентов не смотрит на перспективу адаптации со страхом и отчаянием, что свидетельствует о социальной привлекательности Орловской области для всех вынужденных мигрантов независимо от адаптационных возможностей.

Почти каждый седьмой респондент третьего кластера смотрит на решение проблем адаптации на новом месте с надеждой и оптимизмом. Респонденты первого кластера более спокойно и взвешенно относятся к возможной в будущем полной социальной адаптации.

Таким образом, кластерный анализ выявил 3 группы вынужденных мигрантов, различающихся по социально-демографическим

характеристикам и степени социальной адаптации:

1 кластер - консерваторы. Вынужденные мигранты среднего и предпенсионного возраста с относительно большой долей мужчин, со средним и высшим профессиональным образованием, оценивающие степень адаптации на среднем уровне; средняя продолжительность проживания на новом месте - несколько дольше 2 лет.

2 кластер - активисты. Вынужденные мигранты среднего и пенсионного возраста с наибольшей долей женщин, с высшим профессиональным образованием и ученой степенью, оценивающие

процесс социальной адаптации почти завершенным, оптимистично оценивающие решение проблем адаптации; относительно долго проживают в Орловской области - свыше 5 лет.

3 кластер - максималисты. Вынужденные мигранты молодого поколения с преимущественно полным общим и высшим профессиональным образованием, оценивающие степень адаптации на среднем уровне, но перспективы адаптации - на уровне выше среднего; проживают на новом месте свыше 3 лет [1].

Задачи восстановления зависимостей активно изучаются уже более 200 лет, с момента разработки К. Гауссом в 1794 г. метода наименьших квадратов. В современных социологических исследованиях с этого времени было разработано огромное количество методов и инструментов анализа данных. В данной работе мы описали методы, которые наиболее широко используются в процессе обработки и анализа эмпирической социологической информации.

Список литературы

1. Алексеёнок А. А. Социальная адаптация вынужденных мигрантов в условиях трансформаций современного российского общества. -Орел: Издательство ОРАГС, 2009. 184 с.

2. Сухорослов О. В. Обучение современным технологиям обработки больших массивов данных на кластерных системах. М. 2009. 345 с.

3. Шляпентох В. Э. Проблемы качества социологической информации: достоверность, репрезентативность, прогностический потенциал. М.: ЦСП, 2006. 560 с.

4. Tryon R. C. Cluster Analysis. NY.: McGraw-Hill, 1939.

A. A. Alekseenok.

Searching for interdependences and object categorization in empirical sociological

research.

In the article have found reflections material devoted to analytical processing of the empirical sociological research by methods of correlation and cluster analysis based on social adaptation compelled migrants research.

Key words: sociological research, empirical based, correlation analysis, cluster analysis, social adaptation, compelled migrants.

Получено 02.04.2010.