Министерство образования российской федерации
Вид материала | Документы |
2.11.Расчет выборки Бесповторная случайная |
- Государственная программа Российской Федерации «Доступная среда» на 2011 2015 годы, 1560.95kb.
- Российской Федерации Министерство образования и науки Российской Федерации Государственный, 343.55kb.
- Российской Федерации Министерство общего и профессионального образования Российской, 41.11kb.
- Министерство образования Российской Федерации утверждаю: Заместитель Министра образования, 588.7kb.
- Министерство образования Российской Федерации утверждаю: Заместитель Министра образования, 500.97kb.
- Министерство образования российской федерации утверждаю Заместитель Министра образования, 685.06kb.
- Министерство образования российской федерации утверждаю заместитель Министра образования, 798.02kb.
- Министерство образования российской федерации утверждаю Заместитель Министра образования, 748.49kb.
- Министерство образования российской федерации утверждаю Заместитель Министра образования, 1248.34kb.
- Министерство образования российской федерации утверждаю заместитель Министра образования, 1081.02kb.
2.11.Расчет выборки
Количество членов выборочной совокупности, или иначе говоря, объем выборки можно определить по следующей формуле:
,
где n - объем выборки;
х - средняя квадратическая ошибка;
t - отношение “максимальной” ошибки к средней квадратической ошибке, устанавливаемой в зависимости от требуемой степени достоверности и в предположении, что действительная ошибка не превзойдет максимальную;
m(доп.) - допустимая ошибка выборки (выражается в процентах).
Средняя квадратическая ошибка вычисляется по формуле
,
где - средняя арифметическая признака в изучаемой совокупности;
n - число обследованных лиц;
- знак суммирования.
Показатель m(доп.) выражается в процентах; он может принимать значения 1, 2, 3, 4 и 5%. Больше 5% допускать ошибку нежелательно.
Значение t зависит от вероятности того, что действительная ошибка не превышает допустимую. Так, при вероятности P = 0,997 t=3. При вероятности P = 0,994 t=2.
Если ошибка не должна превышать 2%, то объем выборки
Необходимое количество наблюдений (объем выборки) изменяется обратно пропорционально квадрату допустимой ошибки, прямо пропорционально дисперсии признака и надежности заключения выражаемого t.
Приведенная формула применима собственно к случайной повторной выборке. Для бесповторной выборки формулы будут иными. Кроме того, эта формула применяется в том случае, если мы раньше изучали этот признак и нам известны его средняя арифметическая и средняя квадратическая ошибка .
Если же эти данные неизвестны, т.е. мы впервые принимаемся за изучение признака, то можно воспользоваться формулой для определения его доли:
;
где n - объем выборки;
p и q - вероятности появления признака в выборке;
- средняя квадратическая ошибка для альтернативных признаков.
В том случае, если неизвестны p и q, берут их наибольшее значение: p=0,5 и q=0,5. Тогда pq=0,25. Этим обеспечивается большая надежность результатов. Приведенные формулы применимы для однородных выборок. Они даны лишь в качестве примеров. Существуют и другие методы расчета выборки, хотя математический аппарат достаточно однороден во всех случаях.
Другая задача - как отобрать людей для обследования?
В практике социологических исследований обычно используются следующие типы выборок.
Случайная выборка заключается в том, что каждый член генеральной совокупности имеет шанс попасть в выборку.
Техника отбора бывает повторной и бесповторной. В урну закладываются номера членов генеральной совокупности, из них выбирается столько номеров, сколько составляют выборку. Номера идентифицированы с фамилиями людей.
Бесповторная случайная выборка заключается в том, что номер в урну не возвращается. Если номера возвращают в урну (если повторно попадает тот же номер его снова возвращают), выборка называется повторной случайной выборкой.
Другой метод отбора - систематический. Он заключается в том, что исследователь берет алфавитный список, например, список избирателей, определяет шаг и затем отбирает фамилии тех лиц, которые будут обследованы. Например, из списка, насчитывающего 3000 фамилий, нам надо отобрать 300 человек, т.е. шаг равен 10. Берем в списке 5-ю фамилию, затем 15-ю, 25-ю и так до конца. В итоге мы отберем 300 человек для обследования.
Типическая (стратифицированная, районированная) выборка позволяет увеличить репрезентативность и точность исследования. Она заключается в том, что, например, предприятия распределяются по некоторым типам. Можно выделить крупные, средние и мелкие предприятия и случайно выбирать единицы из этих трех генеральных совокупностей.
Серийная (гнездовая) выборка заключается в следующем. Случайным образом отбираем, например, учебные группы в вузе, а в группе опрашиваем каждого. Обычно исследователи используют серийную, гнездовую выборку в том случае, когда проводят опросы рабочих по месту их работы.
Схема 1.2.9.
Выборка
Случайная, стратифицированная, серийная выборки относятся к выборкам, построенным на принципе случайного отбора. Тем самым каждому члену выборочной совокупности обеспечивается определенный (а иногда и равный) шанс быть отобранным, что необходимо для оценки выборочных ошибок.
На иной основе базируется отбор по квотам. Так, после того как принято решение относительно распределения выборки (например, сколько должно быть мужчин и женщин в каждой возрастной группе и в каждом социальном слое) и интервьюеру дано задание опросить запланированное число единиц в квоте, фактический выбор единиц, включаемых в выборку, падает на интервьюеров. Поэтому выборка в пределах квот не является случайной. Квоты же определяются на основе стратификации. Например, сначала выделяются типы по полу, возрасту, социальному положению, а затем идет отбор по квотам.
В случае территориальных выборок применяется также интервальный отбор. Так, город можно разделить на типы районов (страты) или на участки, из которых извлекается случайная выборка. Затем по определенному интервалу отбираются улицы и дома. Например, каждая 2-я улица и каждый 20-й дом на улице. Это случайный своеобразный отбор. В качестве основы выборки вместо списков используются карты районов, участков города. Интервальный отбор можно рассматривать и как разновидность серийного, ибо дома, например, можно рассматривать как серии.
Обычно в практике социологических исследований приходится формировать многоступенчатый отбор. При этом изучаемый материал состоит из некоторого числа единиц отбора первой ступени, каждая из которых в свою очередь состоит из единиц второй ступени и т.д.
В социологических обследованиях также встречается многофазный отбор. Он сводится к тому, что одни данные собираются на основании изучения всех единиц выборки, другие - только некоторых из них. Последние составляют подвыборку из единиц первоначальной выборки.
Часто в социологии применяется монографическое обследование как разновидность несплошного наблюдения. Оно сводится к детальному изучению либо одной, отдельно взятой единицы (деревня, город, завод, колхоз и др.), либо части объекта.
При формировании выборочных совокупностей следует добиваться полноты, точности, адекватности, удобства, репрезентативности.
Схема 1.2.10.
Способы формирования обследуемой совокупности и виды выборок
Способы формирования совокупности | Методы вероятностного отбора | Не строго случайные методы | |
Сплошное исследование – требует полного охвата объекта, всех его элементов без исключения; | простая случайная - строится с помощью таблиц случайных чисел | Многоступенчатая - случайная в несколько ступеней; на каждой меняется единица отбора | целенаправленная - выбираются типичные элементы по установленным критериям |
Исследование основного массива - изучается большая часть объекта или его важнейшие элементы | систематический отбор - производится через интервал в перечне объектов | Комбинированный - на каждой ступени меняются единица и техника отбора | квотный - строится как модель, воспроизводящая структуру генеральной совокупности в виде квот распределения признаков изучаемых объектов |
Монографическое исследование - изучается типичная для всего объекта часть по ряду критериев | серийная выборка - единицами случайного отбора являются определенные гнезда, группы (семьи, коллективы, жилые кварталы, предприятия) | многофазовая - производится подвыбока меньшего объема без изменения единицы отбора | стихийная - выборка “на первого встречного”, критерии не определены |
Выборочный метод - строится по заданным правилам | стратифицированная выборка - случайная, с любой техникой, процедуре отбора предшествует выделение в генеральной совокупности однородных групп (страт) | | |
Схема 1.2.11.
Краткая характеристика основных схем отбора
| Достоинства | Недостатки |
Простые | | |
простой случайный отбор | В качестве предварительной информации о генеральной совокупности достаточно перечня или описи ее элементов | Необходим перечень всех элементов генеральной совокупности; возможна только при однородных объектах |
систематическая выборка | Позволяет при небольшом объеме охватить генеральные совокупности | Подвержена смещению в случае совпадения интервала отбора с не выявленной периодичностью распределения признака в генеральной совокупности |
гнездовая (серийная) | Проще определить перечень гнезд, чем единиц отбора | Занижается дисперсия изучаемого признака из-за определенного сходства единиц в гнездах |
Сложные | | |
многоступенчатая | Возможность выборки в генеральной совокупности со сложной, неоднородной структурой. У каждой ступени своя основа выборки | Повышается вероятность ошибок в процедурах; больший вес приобретают случайные ошибки |
комбинированная | Чередование способов отбора ведет к искусственному “перемешиванию признаков” | |
стратифицированная | Повышает адекватность выборки задачам исследования. Возрастает ее точность за счет совпадения дисперсии генеральной и вторичной совокупностей | Неудачное подразделение на страты смещает выборку |
квотная | Уменьшаются затраты; доступна и удобна в построении | Невозможно точно измерить смещения ввиду неслучайного характера отбора |
Схема 1.2.12.
Виды ошибок в выборочном исследовании
Виды ошибок | Причины появления | Способы влияния и устранения |
Случайные | | |
статистические отклонения характеристик выборочного распределения от генерального | Различие совокупностей в условиях неоднородности элементов приводит к расхождению распределений | Измерение статистической ошибки; учет ее значений в оценке репрезентативности |
неконтролируемые отклонения от планируемых процедур | Замена неполноценными единицами анализа из-за недостаточной квалификации исполнителей | Систематический контроль за ходом полевых наблюдений и качеством информации |
| Неполный охват информации в единицах анализа | Сравнение реальной выборки с разработанным планом; ее “ремонт” дополнительным сбором информации или уменьшением модели |
Систематические | | |
случайного характера из-за неадекватного воспроизведения генерального распределения | Завышение или занижение характеристик генеральной совокупности; неадекватность выборки задачам исследования | Повышение качества работ подготовительного этапа |
| Незнание распределений в генеральной совокупности, их искажают процедуры отбора | Экспертиза, пилотаж методики, инструментария |
| Отбор более удобных, “выигрышных” элементов генеральной совокупности | Включение элементов случайного отбора |