- Шаги к выборке по квотам
- Шаг 1
- Шаг 2
- Шаг 3
- Шаг 4
- Шаг 5
- Практический кейс
- Квота на страту
- Применимость, преимущества и недостатки
- преимущество
- Недостатки
- Пример простого приложения
- Определение квоты по возрасту
- Определение квот по возрасту и полу
- Применение опросов и изучение результатов
- Разница со стратифицированной случайной выборкой
- Предлагаемое упражнение
- Ссылки
Выборки квоты не является - вероятностным способом взять данные из выборки толщ распределения квот. Квоты должны быть пропорциональны доле, которую представляет этот слой по отношению к общей численности населения, а сумма квот должна быть равна размеру выборки.
Исследователь - это тот, кто решает, какие группы или слои будут, например, он может разделить популяцию на мужчин и женщин. Другой пример страт - это возрастные диапазоны, например от 18 до 25, от 26 до 40 и от 40 лет, которые могут быть обозначены следующим образом: молодой, старый и старый.
Рисунок 1. Квоты выборки сегментированы в соответствии с различиями в общей численности населения. Источник: Pixabay.
Очень удобно заранее знать, какой процент от общей численности населения представляет каждый слой. Затем выбирается статистически значимый размер выборки, и пропорциональные квоты назначаются процентной доле каждой страты по отношению к общей генеральной совокупности. Сумма квот на страту должна быть равна общему размеру выборки.
Наконец, берутся данные о квотах, назначенных для каждой страты, выбирая первые элементы, которые завершают квоту.
Именно из-за этого неслучайного способа выбора элементов этот метод выборки считается не вероятностным.
Шаги к выборке по квотам
Шаг 1
Сегментируйте все население на слои или группы с некоторыми общими характеристиками. Эта характеристика будет предварительно определена исследователем-статистиком, проводящим исследование.
Шаг 2
Определите, какой процент от общей численности населения представляет каждую из слоев или групп, выбранных на предыдущем этапе.
Шаг 3
Оцените статистически значимый размер выборки в соответствии с критериями и методологиями статистической науки.
Шаг 4
Рассчитайте количество элементов или квот для каждой страты, чтобы они были пропорциональны проценту, который каждый представляет по отношению к общей генеральной совокупности и общему размеру выборки.
Шаг 5
Возьмите данные элементов в каждой страте, пока не заполните квоту, соответствующую каждой страте.
Практический кейс
Предположим, вы хотите узнать уровень удовлетворенности услугами метро в городе. Предыдущие исследования с участием 2000 человек показали, что 50% пользователей - молодые люди от 16 до 21 года, 40% - взрослые от 21 до 55 лет и только 10% пользователей старше 55 лет.
Воспользовавшись результатами этого исследования, оно сегментировано или стратифицировано в зависимости от возраста пользователей:
-Молодежь: 50%
-Взрослые: 40%
-Пожилые: 10%
Поскольку бюджет ограничен, исследование должно быть применено к небольшой, но статистически значимой выборке. Выбран размер выборки 200, то есть опрос уровня удовлетворенности будет применен к 200 людям.
Теперь остается определить квоту или количество обследований для каждого сегмента или страты, которые должны быть пропорциональны размеру выборки и проценту на страту.
Квота на страту
Квота на количество опросов на страту следующая:
Молодежь: 200 * 50% = 200 * (50/100) = 100 опросов
Взрослые: 200 * 40% = 200 * (40/100) = 80 опросов
Пожилые люди: 200 * 10% = 200 * (10/100) = 20 опросов
Рисунок 2. Квоты в выборке из 200 человек по возрастному слою. Источник: Ф. Сапата.
Обратите внимание, что сумма сборов должна быть равна размеру выборки, то есть равна общему количеству опросов, которые будут применяться. Затем опросы проходят до тех пор, пока не будут выполнены квоты для каждой страты.
Важно отметить, что этот метод намного лучше, чем проведение всех опросов и передача их первым 200 появившимся людям, потому что, согласно предыдущим данным, весьма вероятно, что слой меньшинства будет исключен из исследования.
Применимость, преимущества и недостатки
Для применимости метода требуется критерий формирования пласта, который зависит от цели исследования.
Квотная выборка подходит, когда вы хотите узнать предпочтения, различия или характеристики по секторам, чтобы направлять определенные кампании в соответствии с стратой или сегментом.
Его использование также полезно, когда по какой-либо причине интересно узнать характеристики или интересы меньшинств или когда они не хотят исключать их из исследования.
Для применимости вес или значимость каждой страты должен быть известен по отношению к общей численности населения. Очень важно, чтобы эти знания были достоверными, иначе будут получены ошибочные результаты.
преимущество
-Сокращение времени обучения, поскольку плата за прослойку обычно невелика
-Упрощает анализ данных.
-Минимизирует затраты, потому что исследование применяется к небольшим, но хорошо репрезентативным выборкам всего населения.
Недостатки
-Поскольку страты определены априори, вполне возможно, что определенные слои населения не будут включены в исследование.
-При установлении ограниченного количества слоев возможно, что детали будут потеряны в исследовании.
-Путем исключения или включения одного слоя в состав другого в исследовании могут быть сделаны неправильные выводы.
-Это делает невозможным оценку максимальной ошибки выборки.
Пример простого приложения
Мы хотим провести статистическое исследование уровня тревожности среди 2000 человек.
Исследователь, руководящий исследованием, интуитивно понимает, что различия в результатах должны обнаруживаться в зависимости от возраста и пола. По этой причине он решает сформировать три возрастных слоя, обозначенных следующим образом: Первый возраст, Второй возраст и Третий возраст. Что касается полового сегмента, то выделяются два обычных типа: мужской и женский.
First_Age определяется как возраст от 18 до 25 лет, Second_Age - от 26 до 50 лет и, наконец, Third_Age - от 50 до 80 лет.
Анализируя данные по генеральной совокупности, необходимо:
45% населения относятся к первому возрасту.
40% относятся к Second_Age.
Наконец, только 15% исследуемого населения принадлежит к третьей эпохе.
Используя соответствующую методологию, которая здесь не подробно описана, выборка из 300 человек определена как статистически значимая.
Определение квоты по возрасту
Следующим шагом будет поиск соответствующих квот для возрастного сегмента, что выполняется следующим образом:
Первый_ возраст: 300 * 45% = 300 * 45/100 = 135
Second_Age: 300 * 40% = 300 * 40/100 = 120
Третий возраст: 300 * 15% = 300 * 15/100 = 45
Проверено, что сумма квот дает общий размер выборки.
Определение квот по возрасту и полу
Половой сегмент населения пока не учитывается, для этого сегмента уже определены два слоя: женский и мужской. Мы снова должны проанализировать данные по населению, которые дают следующую информацию:
-60% от общей численности населения составляют женщины.
- Между тем 40% изучаемого населения принадлежит к мужскому полу.
Важно отметить, что предыдущие данные о распределении населения по полу не учитывают возраст.
Учитывая, что больше информации нет, будет сделано предположение, что эти пропорции полов равномерно распределены в трех возрастных слоях, которые были определены для этого исследования. Учитывая эти соображения, мы приступаем к установлению квот по возрасту и полу, что означает, что теперь будет 6 подуровней:
S1 = Первый возраст и женщина: 135 * 60% = 135 * 60/100 = 81
S2 = Первый_Возраст и Мужчина: 135 * 40% = 135 * 40/100 = 54
S3 = Второй возраст и женщина: 120 * 60% = 120 * 60/100 = 72
S4 = Second_Age и мужской: 120 * 40% = 120 * 40/100 = 48
S5 = третий_ возраст и женщина: 45 * 60% = 45 * 60/100 = 27
S6 = третий_ возраст и мужчина: 45 * 40% = 45 * 40/100 = 18
Применение опросов и изучение результатов
После того, как шесть (6) сегментов и соответствующие им квоты будут установлены, будет подготовлено 300 опросов, которые будут применяться в соответствии с уже рассчитанными квотами.
Опросы будут применяться следующим образом: будет проведен 81 опрос и опрошен первый 81 человек, входящий в сегмент S1. Затем так же проделываем с оставшимися пятью отрезками.
Последовательность обучения следующая:
-Анализируйте результаты опроса, которые затем обсуждаются, анализируя результаты по сегментам.
-Сравните результаты по сегментам.
-Наконец разработайте гипотезы, объясняющие причины этих результатов.
Разница со стратифицированной случайной выборкой
В нашем примере, в котором мы применяем выборку по квотам, первое, что нужно сделать, это установить квоты, а затем провести исследование. Конечно, эти квоты совсем не прихотливы, потому что они основаны на предыдущей статистической информации об общей численности населения.
Если у вас нет предварительной информации об изучаемой совокупности, предпочтительнее изменить процедуру в обратном порядке, то есть сначала определить размер выборки, а после того, как размер выборки будет установлен, приступить к применению обследования в случайно.
Один из способов гарантировать случайность - это использовать генератор случайных чисел и опросить сотрудников, номер которых совпадает с номером случайного генератора.
Как только данные доступны и цель исследования - увидеть уровни тревожности в зависимости от возраста и пола, данные разделяются по шести категориям, которые мы определили ранее. Но без установления предварительной платы.
По этой причине метод стратифицированной случайной выборки считается вероятностным методом. Пока выборки по ранее установленным квотам нет.
Однако, если квоты устанавливаются на основе информации, основанной на статистике населения, то метод выборки квот можно назвать приблизительно вероятностным.
Предлагаемое упражнение
Предлагается следующее упражнение:
В средней школе вы хотите провести опрос о предпочтении между изучением естественных и гуманитарных наук.
Предположим, в школе 1000 учеников, сгруппированных по пяти уровням в зависимости от года обучения. Известно, что на первом курсе обучается 350 студентов, на втором - 300, на третьем - 200, на четвертом - 100 и, наконец, на пятом - 50. Также известно, что 55% учеников школы - мальчики и 45% - девочки.
Определите страты и квоты по стратам, чтобы узнать количество обследований, которые будут применяться в зависимости от года обучения и сегментов пола. Предположим далее, что выборка будет составлять 10% от общего числа студентов.
Ссылки
- Беренсон, м. 1985. Статистика для управления и экономики, концепции и приложения. От редакции Interamericana.
- Статистика. Выборка квот. Получено с: encyclopediaeconomica.com.
- Статистика. Отбор проб. Получено с: Estadistica.mat.uson.mx.
- Explorable. Выборка квот. Получено с: explorable.com.
- Мур, Д. 2005. Прикладная базовая статистика. Второй. Издание.
- Netquest. Вероятностная выборка: стратифицированная выборка. Получено с: netquest.com.
- Wikipedia. Статистическая выборка. Получено с: en.wikipedia.org