Методы отбора проб

Оцени статью

Когда вы проводите исследование группы людей, редко возможно собрать данные о каждом человеке в этой группе. Вместо этого вы выбираете образец. Выборка – это группа лиц, которые фактически будут участвовать в исследовании.

Чтобы сделать правильные выводы из ваших результатов, вы должны тщательно решить, как вы будете выбирать выборку, репрезентативную для группы в целом. Существует два типа методов выборки:

  • Вероятностная выборка предполагает случайный отбор, что позволяет делать убедительные статистические выводы о всей группе.
  • Невероятностная выборка предполагает неслучайный отбор на основе удобства или других критериев, что позволяет легко собирать данные.

Вы должны четко объяснить, как вы выбрали образец, в методологическом разделе вашей статьи или диссертации.

Популяция против выборки

Во-первых, вам нужно понять разницу между популяцией и выборкой и определить целевую популяцию вашего исследования.

  • Популяция  это вся группа, о которой вы хотите сделать выводы.
  • Выборка — это определенная группа лиц, от которых вы будете собирать данные.

Популяция можно определить по географическому положению, возрасту, доходу и многим другим характеристикам.

Он может быть очень широким или довольно узким: может быть, вы хотите сделать выводы обо всем взрослом населении вашей страны; возможно, ваше исследование сосредоточено на клиентах определенной компании, пациентах с определенным заболеванием или учащихся одной школы.

Важно тщательно определить целевую аудиторию в соответствии с целью и практичностью вашего проекта.

Если население очень большое, демографически смешанное и географически рассредоточенное, может быть трудно получить доступ к репрезентативной выборке.

Рамка выборки

Основа выборки – это фактический список лиц, из которых будет составлена ​​выборка. В идеале он должен включать все целевое население.

Пример: Вы проводите исследование условий труда в компании X. Ваш персонал — все 1000 сотрудников компании. Ваша основа выборки — это база данных отдела кадров компании, в которой перечислены имена и контактные данные каждого сотрудника.

Размер образца

Количество лиц, которых следует включить в выборку, зависит от различных факторов, в том числе от размера и изменчивости населения, а также от дизайна вашего исследования. Существуют различные калькуляторы размера выборки и формулы в зависимости от того, чего вы хотите достичь с помощью статистического анализа.

Методы вероятностной выборки

Вероятностная выборка означает, что каждый член совокупности имеет шанс быть выбранным. Он в основном используется в количественных исследованиях. Если вы хотите получить результаты, репрезентативные для всего населения, методы вероятностной выборки являются наиболее правильным выбором.

Существует четыре основных типа вероятностной выборки.

1. Простая случайная выборка

В простой случайной выборке каждый член совокупности имеет равные шансы быть отобранным. Ваша основа выборки должна включать все население.

Для проведения этого типа выборки вы можете использовать такие инструменты, как генераторы случайных чисел или другие методы, полностью основанные на случайности.

Пример: простая случайная выборка. Вы хотите выбрать простую случайную выборку из 100 сотрудников компании X. Вы назначаете номер каждому сотруднику в базе данных компании от 1 до 1000 и используете генератор случайных чисел, чтобы выбрать 100 номеров.

2. Систематическая выборка

Систематическая выборка похожа на простую случайную выборку, но обычно ее немного легче проводить. Каждому члену населения присваивается номер, но вместо того, чтобы генерировать случайным образом числа, люди выбираются через равные промежутки времени.

Пример: систематическая выборка. Все сотрудники компании перечислены в алфавитном порядке. Из первых 10 номеров вы случайным образом выбираете начальную точку: номер 6. Начиная с номера 6, выбирается каждый 10-й человек в списке (6, 16, 26, 36 и т. д.), и вы получаете выборку из 100 человек.

Если вы используете этот метод, важно убедиться, что в списке нет скрытого шаблона, который может исказить выборку. Например, если база данных HR группирует сотрудников по командам, а члены команды перечислены в порядке старшинства, существует риск того, что ваш интервал может пропустить людей с младшими ролями, что приведет к смещению выборки в сторону старших сотрудников.

3. Стратифицированная выборка

Стратифицированная выборка включает в себя разделение совокупности на подгруппы, которые могут существенно различаться. Это позволяет сделать более точные выводы, убедившись, что каждая подгруппа правильно представлена ​​в выборке.

Чтобы использовать этот метод выборки, вы делите население на подгруппы (называемые слоями) на основе соответствующих характеристик (например, пол, возрастной диапазон, уровень дохода, должность).

Основываясь на общих пропорциях населения, вы рассчитываете, сколько людей должно быть выбрано из каждой подгруппы. Затем вы используете случайную или систематическую выборку, чтобы выбрать образец из каждой подгруппы.

Пример: стратифицированная выборка. В компании работает 800 женщин и 200 мужчин. Вы хотите, чтобы выборка отражала гендерный баланс компании, поэтому вы разделяете население на две страты в зависимости от пола. Затем вы используете случайную выборку для каждой группы, выбирая 80 женщин и 20 мужчин, что дает вам репрезентативную выборку из 100 человек.

4. Кластерная выборка

Кластерная выборка также предполагает разделение совокупности на подгруппы, но каждая подгруппа должна иметь сходные характеристики со всей выборкой. Вместо выборки отдельных лиц из каждой подгруппы вы случайным образом выбираете целые подгруппы.

Если это практически возможно, вы можете включить каждого человека из каждого отобранного кластера. Если кластеры сами по себе большие, вы также можете выбрать людей из каждого кластера, используя один из описанных выше методов. Это называется многоступенчатой ​​выборкой.

Этот метод хорош для работы с большими и рассредоточенными совокупностями, но риск ошибки в выборке выше, поскольку между кластерами могут быть существенные различия. Трудно гарантировать, что выбранные кластеры действительно репрезентативны для всего населения.

Пример: кластерная выборка. У компании есть офисы в 10 городах по всей стране (во всех примерно одинаковое количество сотрудников на одинаковых должностях). У вас нет возможности посетить каждый офис для сбора данных, поэтому вы используете случайную выборку для выбора 3 офисов — это ваши кластеры.

×