2.6 Обработка и объединение данных На рисунке 2-1 представлена общая схема модели управления данными, использованная для исследований GATS в Российской Федерации. Инструкторы полевых исследований ежедневно объединяли все данные, полученные в ходе опросов, используя SD-карты, специально разработанные в соответствии с протоколами о защите данных для сбора данных в рамках полевых исследований GATS. Каждый инструктор передавал данные на портативный компьютер и направлял объединенные файлы уровня инструктора (данные, собранные пятью интервьюерами за день) в центральный офис по защищенным каналам связи. ИТ-специалисты ежедневно объединяли данные, полученные от всех инструкторов, и при возникновении проблем отправляли отчеты на места. ИТ-специалисты при поддержке Центра контроля заболеваний, ВОЗ и RTI соединяли и объединяли все файлы в один файл SDF. С помощью модуля объединения в GSS и SPSS версии 17 объединенные данные преобразовывались в формат необработанных данных, позволяющий произвести их анализ. Данные в этом формате могут быть использованы в любом программном обеспечении для статистической работы, предназначенном для дальнейшего анализа и создания отчетов.
Рисунок 2-1: Схема управления данными – GATS в Российской Федерации, 2009 год.
2.7 Статистический анализ Полный анализ данных опроса был выполнен с целью получения оценки численности и состава населения и 95 % их доверительных интервалов (ассиметричные доверительные интервалы). Шкалы значимости были разработаны для каждого респондента в соответствии со стандартными процедурами, разработанными в Руководстве по разработке стандартов GATS (GATS Sample Design)1 и Руководстве по созданию шкал значимости GATS (Sample Weights GATS)21. Более подробную информацию о разработке шкал значимости можно найти в Приложении A. Окончательные стандарты значимости использовались во всех анализах с целью оценки численности и состава населения и их доверительных интервалов. Все расчеты значимости производились с помощью системы SAS 9.2 и все расчеты оценок и их доверительных интервалов производились с помощью модуля сложной выборки SPSS 17.
3. Характеристика общих и частных данных
В данном разделе представлена характеристика области выборки и населения. Оценка численности населения проведена на основе обновленных данных о населении Российской Федерации с использованием текущих статистических данных Росстата по состоянию на 1 января 2009 года. Таким образом, учтены все структурные и административные изменения, которые имели место после Всероссийской переписи населения 2002 года.
3.1 Зона выборки Таблица 3.1 содержит неклассифицированное количество и процентное соотношение опрошенных для GATS Российской Федерации семей и отдельных лиц. Из 12000 семей, выбранных для исследования, в опросе приняли участие 11518 (96,0 %) семей и 11406 (99,0 %) отдельных лиц. Общая доля принявших участие – 97,7 %, этот показатель немного выше в сельской местности (98,6 %), чем в городах (96,9 %).
В опросе приняли участие 98,6 % семей. Число опрошенных в городской и сельской местности приблизительно одинаково (98,0 % и 99,4 % соответственно). Однако в 2% семей не оказалось подходящих респондентов, пропорции по данному показателю между городами и сельской местностью практически одинаковы. Небольшое количество респондентов (0,7 %) отказались от интервью, а 0,6 % оказались безработными.
В 11518 из 12000 отобранных семей обнаружены лица, подходящие для индивидуального интервью. Количество подходящих лиц среди городского населения (95,2 %) незначительно меньше, чем сельского (96,9 %). Доля опрошенных в индивидуальном порядке лиц составила 99,1 %, среди которых 98,2 % проживают в городах и 99,2 % – в сельской местности. Общее число респондентов, не имевших право участвовать в опросе, составило 244 человека, почти 2,0 % от всей выборки. Соотношение числа лиц, не соответствующих требованиям опроса в городской и сельской местности определено как 2,3 % к 1,6 %. Основными причинами отсутствия результатов индивидуального опроса являлись отказы (0,5 %), неполные интервью (0,5 %) и другие причины, включая невозможность найти человека (0,2 %). Процент отказа в городах (0,7 %) превысил данный показатель в сельской местности (0,3 %), несмотря на повторные визиты. Соотношение количества опрошенных среди мужчин и женщин примерно одинаково (99,0 % мужчин и 99,1 % женщин; это соотношение не отображено в таблице).
Таблица 3.1: Количество и процентное соотношение опрошенных семей и отдельных лиц, соотношение ответов респондентов на основе места жительства (невзвешенные данные) – GATS Российской Федерации, 2009 год.
| Проживание
|
| Всего
| Город
| Сельская местность
|
| Количество
| Процентное соотношение
| Количество
| Процентное соотношение
|
| Количество
| Процентное соотношение
| Отобранные семейные единицы
| Проведен (HC)
| 6,055
| 95.2
| 5,463
| 96.9
|
| 11,518
| 96.0
| Проведен - подходящих лиц нет (HCNE)
| 146
| 2.3
| 93
| 1.6
|
| 239
| 2.0
| Не проведен (HINC)
| 9
| 0.1
| 2
| 0.0
|
| 11
| 0.1
| Нет респондента (HNS)
| 6
| 0.1
| 2
| 0.0
|
| 8
| 0.1
| Отказ (HR)
| 63
| 1.0
| 20
| 0.4
|
| 83
| 0.7
| Безработные (HUO)
| 29
| 0.5
| 47
| 0.8
|
| 76
| 0.6
| Указанный адрес нежилой (HAND)
| 1
| 0.0
| 3
| 0.1
|
| 4
| 0.0
| Другое1 (HO)
| 51
| 0.8
| 10
| 0.2
|
| 61
| 0.5
| Всего отобрано семей
| 6,360
| 100.0
| 5,640
| 100.0
|
| 12,000
| 100.0
| Доля опрошенных семей (HRR) (%)2
| 98.0%
| 99.4%
|
| 98.6%
|
| Отобранные лица
| Проведен (PC)
| 5,989
| 98.9
| 5,417
| 99.2
|
| 11,406
| 99.0
| Не проведен (PINC)
| 9
| 0.1
| 12
| 0.2
|
| 21
| 0.2
| Не соответствует (PNE)
| 1
| 0.0
| 4
| 0.1
|
| 5
| 0.0
| Отказ (PR)
| 40
| 0.7
| 17
| 0.3
|
| 57
| 0.5
| Недееспособен (PI)
| 7
| 0.1
| 2
| 0.0
|
| 9
| 0.1
| Другое1 (PO)
| 9
| 0.1
| 11
| 0.2
|
| 20
| 0.2
| Всего отобрано лиц
| 6,055
| 100.0
| 5,463
| 100.0
|
| 11,518
| 100.0
| Доля опрошенных лиц (PRR) (%)3
| 98.9%
| 99.2%
|
| 99.1%
| Общий процент опрошенных (TRR) (%)4
| 96.9%
| 98.6%
|
| 97.7%
| 1 Другое подразумевает отсутствие респондентов или прочие результаты. 2 Расчет доли опрошенных семей: (HC + HCNE) *100
HC + HCNE + HINC + HNS + HR + HO 3 Расчет доли опрошенных семей: PC *100
PC + PINC + PR + PI + PO 4 Расчет доли опрошенных лиц: (HRR x PRR) / 100
| Примечания.
- Незавершенное интервью (т.е. реестр не был заполнен до конца) не засчитывается в GATS. Таким образом, данные случаи не заносятся в реестр доли опрошенных семей.
- Завершенное персональное интервью [PC] включает в себя респондентов, ответивших, по меньшей мере, на вопрос E1 и указавших удовлетворительные ответы на вопросы B1/B2/B3. Интервью, не отвечающие данным критериям, приравниваются в GATS к незавершенным (PINC). Таким образом, данные случаи не заносятся в реестр доли опрошенных лиц.
| |