- Размер выборки
- Случай 1: численность населения неизвестна
- Уровни достоверности и соответствующие им значения Z
- Случай 2: известна численность населения
- Примеры
- Опросы и анкеты
- контроль качества
- преимущество
- Недостатки
- Упражнение решено
- Решение
- Ссылки
Случайная выборка в том , как выбрать статистически репрезентативную выборку из данной популяции. Часть принципа, согласно которому каждый элемент в выборке должен иметь одинаковую вероятность быть выбранным.
Жеребьевка - это пример случайной выборки, в которой каждому члену популяции участников присваивается номер. Для выбора чисел, соответствующих розыгрышу призов (образец), используется случайный прием, например, извлечение из почтового ящика чисел, записанных на одинаковых карточках.
Рисунок 1. При случайной выборке выборка отбирается из совокупности случайным образом с использованием некоторой техники, которая гарантирует, что все элементы имеют одинаковую вероятность быть выбранными. Источник: netquest.com.
При случайной выборке важно правильно выбрать размер выборки, поскольку нерепрезентативная выборка генеральной совокупности может привести к ошибочным выводам из-за статистических колебаний.
Размер выборки
Есть формулы для определения правильного размера выборки. Самый важный фактор, который следует учитывать, - известна ли численность популяции. Давайте посмотрим на формулы для определения размера выборки:
Случай 1: численность населения неизвестна
Когда размер популяции N неизвестен, можно выбрать выборку адекватного размера n, чтобы определить, верна ли определенная гипотеза.
Для этого используется следующая формула:
Куда:
-p - вероятность того, что гипотеза верна.
-q - вероятность того, что это не так, поэтому q = 1 - p.
-E - относительная погрешность, например, погрешность в 5% имеет погрешность E = 0,05.
-Z имеет отношение к уровню уверенности, требуемому исследованием.
В стандартизованном (или нормализованном) нормальном распределении уровень достоверности 90% имеет Z = 1,645, потому что вероятность того, что результат находится между -1,645σ и + 1,645σ, составляет 90%, где σ - стандартное отклонение. ,
Уровни достоверности и соответствующие им значения Z
1.- уровень достоверности 50% соответствует Z = 0,675.
2.- 68,3% доверительный интервал соответствует Z = 1.
3.- Уровень достоверности 90% эквивалентен Z = 1,645.
4.- 95% доверительный интервал соответствует Z = 1.96
5.- 95,5% доверительный интервал соответствует Z = 2.
6.- Уровень достоверности 99,7% эквивалентен Z = 3.
Примером, где можно применить эту формулу, может быть исследование по определению среднего веса гальки на пляже.
Понятно, что изучить и взвесить всю гальку на пляже невозможно, поэтому рекомендуется извлекать выборку как можно более случайным образом и с соответствующим количеством элементов.
Рис. 2. Чтобы изучить характеристики гальки на пляже, необходимо выбрать случайную выборку с репрезентативным их количеством. (Источник: pixabay)
Случай 2: известна численность населения
Когда количество N элементов, составляющих определенную совокупность (или вселенную), известно, если мы хотим выбрать с помощью простой случайной выборки статистически значимую выборку размера n, это формула:
Куда:
-Z - коэффициент, связанный с уровнем достоверности.
-p - вероятность успеха гипотезы.
-q - вероятность неудачи в гипотезе, p + q = 1.
-N - размер всего населения.
-E - относительная ошибка результата исследования.
Примеры
Методология извлечения образцов во многом зависит от типа исследования, которое необходимо провести. Таким образом, случайная выборка имеет бесконечное множество применений:
Опросы и анкеты
Например, при телефонных опросах люди, с которыми следует проконсультироваться, выбираются с помощью генератора случайных чисел, применимого к изучаемому региону.
Если вы хотите применить анкету к сотрудникам крупной компании, то вы можете прибегнуть к отбору респондентов по их номеру сотрудника или номеру удостоверения личности.
Указанное число также необходимо выбирать случайным образом, например, с использованием генератора случайных чисел.
Рисунок 3. Анкета может быть применена путем случайного выбора участников. Источник: Pixabay.
контроль качества
В том случае, если исследование проводится на деталях, изготовленных на станке, детали должны выбираться случайным образом, но из партий, изготовленных в разное время дня или в разные дни или недели.
преимущество
Простая случайная выборка:
- Это позволяет снизить затраты на статистическое исследование, так как нет необходимости изучать всю совокупность для получения статистически надежных результатов с желаемыми уровнями достоверности и уровнем ошибки, требуемым в исследовании.
- Избегайте предвзятости: поскольку выбор изучаемых элементов является полностью случайным, исследование достоверно отражает характеристики популяции, хотя изучалась только ее часть.
Недостатки
- Метод не подходит в тех случаях, когда вы хотите узнать предпочтения разных групп или слоев населения.
В этом случае предпочтительно заранее определить группы или сегменты, на которых будет проводиться исследование. После определения страты или группы, если для каждой из них удобно, применить случайную выборку.
- Очень маловероятно, что будет получена информация по меньшинствам, характеристики которых иногда необходимо знать.
Например, если речь идет о кампании, посвященной дорогому продукту, необходимо знать предпочтения самых богатых меньшинств.
Упражнение решено
Мы хотим изучить предпочтение населением определенного напитка из колы, но ранее не проводилось исследований в этой популяции, размер которых неизвестен.
С другой стороны, выборка должна быть репрезентативной с минимальным уровнем достоверности 90%, а выводы должны иметь процентную ошибку 2%.
-Как определить размер n образца?
-Каков был бы размер выборки, если бы предел погрешности сделать более гибким до 5%?
Решение
Поскольку размер генеральной совокупности неизвестен, для определения размера выборки используется приведенная выше формула:
п = (Z 2 p q) / (E 2 )
Мы предполагаем, что вероятность предпочтения (p) нашей марки безалкогольного напитка равна вероятности отказа (q), поэтому p = q = 0,5.
С другой стороны, поскольку результат исследования должен иметь процентную ошибку менее 2%, тогда относительная ошибка E будет 0,02.
Наконец, значение Z = 1,645 дает уровень достоверности 90%.
Подводя итог, имеем следующие значения:
Z = 1,645
р = 0,5
q = 0,5
E = 0,02
На основании этих данных рассчитывается минимальный размер выборки:
n = (1,645 2 0,5 0,5) / (0,02 2 ) = 1691,3
Это означает, что в исследовании с требуемой погрешностью и выбранным уровнем достоверности должна быть выборка респондентов из не менее 1692 человек, выбранных путем простой случайной выборки.
Если вы перейдете с погрешности от 2% до 5%, то новый размер выборки будет:
n = (1,645 2 0,5 0,5) / (0,05 2 ) = 271
А это значительно меньшее количество людей. В заключение следует отметить, что размер выборки очень чувствителен к желаемой погрешности исследования.
Ссылки
- Беренсон, м. 1985. Статистика для управления и экономики, концепции и приложения. От редакции Interamericana.
- Статистика. Случайная выборка. Взято с сайта encyclopediaeconomica.com.
- Статистика. Отбор проб. Получено с: Estadistica.mat.uson.mx.
- Explorable. Случайная выборка. Получено с: explorable.com.
- Мур, Д. 2005. Прикладная базовая статистика. Второй. Издание.
- Netquest. Случайная выборка. Получено с: netquest.com.
- Wikipedia. Статистическая выборка. Получено с: en.wikipedia.org