- Формулы и уравнения
- Как рассчитать ошибку выборки
- Для уровня уверенности
- Примеры
- - Пример 1
- Решение
- - Пример 2
- Решение
- - Пример 3
- Решение
- - Пример 4
- Решение
- - Упражнение 5.
- Решение
- Ссылки
Выборки ошибка или выборка ошибка в статистике представляет собой разность между средним значением образца и среднего значением общей численности населения. Чтобы проиллюстрировать эту идею, давайте представим, что общая численность населения города составляет один миллион человек, из которых вам нужен средний размер обуви, для которого взята случайная выборка из тысячи человек.
Средний размер выборки не обязательно будет совпадать с размером всей совокупности, хотя, если выборка не является смещенной, значение должно быть близким. Эта разница между средним значением выборки и средним значением генеральной совокупности является ошибкой выборки.

Рисунок 1. Так как выборка является подмножеством общей совокупности, среднее значение выборки имеет предел ошибки. Источник: Ф. Сапата.
В общем, среднее значение для генеральной совокупности неизвестно, но есть методы, позволяющие уменьшить эту ошибку, и формулы для оценки предела погрешности выборки, которые будут обсуждаться в этой статье.
Формулы и уравнения
Допустим, мы хотим знать среднее значение некоторой измеримой характеристики x в популяции размером N, но поскольку N является большим числом, невозможно провести исследование для всей совокупности, тогда мы приступаем к случайной выборке размер n <
Среднее значение выборки обозначено как
Предположим, что из общей совокупности N взяты m выборок, все одинакового размера n со средними значениями
Эти средние значения не будут идентичны друг другу и все будут примерно равны среднему значению генеральной совокупности μ. Предел погрешности выборки E указывает на ожидаемое разделение средних значений.
Предел стандартной ошибки ε для выборки размера n составляет:
ε = σ / √n
где σ - стандартное отклонение (квадратный корень из дисперсии), которое рассчитывается по следующей формуле:
σ = √
Значение запаса стандартной погрешности ε следующее:
Среднее значение
Как рассчитать ошибку выборки
В предыдущем разделе была дана формула для определения предела стандартной ошибки для выборки размера n, где слово "стандарт" указывает, что это предел ошибки с достоверностью 68%.
Это означает, что если было взято много образцов одинакового размера n, 68% из них дадут средние значения.
Существует простое правило, называемое правилом 68-95-99.7, которое позволяет нам легко найти предел погрешности выборки E для уровней достоверности 68%, 95% и 99,7%, поскольку этот запас составляет 1⋅ ε, 2 ⋅ ε и 3⋅ ε соответственно.
Для уровня уверенности
Если уровень достоверности γ не соответствует одному из вышеперечисленных, то ошибка выборки - это стандартное отклонение σ, умноженное на коэффициент Zγ, которое получается с помощью следующей процедуры:
1.- Сначала определяется уровень значимости α, который рассчитывается на основе уровня достоверности γ по следующей зависимости: α = 1 - γ
2.- Затем мы должны вычислить значение 1 - α / 2 = (1 + γ) / 2, которое соответствует накопленной нормальной частоте между -∞ и Zγ, в нормальном или гауссовском распределении, типичном F (z), определение которого можно увидеть на рисунке 2.
3.- Уравнение F (Zγ) = 1 - α / 2 решается с помощью таблиц нормального (кумулятивного) распределения F или с помощью компьютерного приложения, которое имеет обратную стандартизованную функцию Гаусса F -1 .
В последнем случае имеем:
Zγ = G -1 (1 - α / 2).
4.- Наконец, эта формула применяется для ошибки выборки с уровнем надежности γ:
E = Zγ ⋅ (σ / √n)

Рисунок 2. Таблица нормального распределения. Источник: Wikimedia Commons.
Примеры
- Пример 1
Вычислите стандартную погрешность среднего веса выборки из 100 новорожденных. Расчет среднего веса был
Решение
Стандартная погрешность: ε = σ / √n = (1500 кг) / √100 = 0,15 кг. Это означает, что с этими данными можно сделать вывод, что вес 68% новорожденных составляет от 2950 кг до 3,25 кг.
- Пример 2
Определите предел ошибки выборки E и диапазон веса 100 новорожденных с уровнем достоверности 95%, если средний вес составляет 3100 кг со стандартным отклонением σ = 1500 кг.
Решение
Если применяется правило 68; 95; 99,7 → 1⋅ ε; 2⋅ ε; 3⋅ ε имеем:
E = 2⋅ε = 2⋅0,15 кг = 0,30 кг
Другими словами, 95% новорожденных будут иметь вес от 2800 кг до 3400 кг.
- Пример 3
Определите диапазон веса новорожденных в примере 1 с доверительной вероятностью 99,7%.
Решение
Ошибка выборки с достоверностью 99,7% составляет 3 σ / √n, что для нашего примера составляет E = 3 * 0,15 кг = 0,45 кг. Отсюда следует, что 99,7% новорожденных будут иметь вес от 2650 кг до 3550 кг.
- Пример 4
Определите коэффициент Zγ для уровня достоверности 75%. Определите предел ошибки выборки с этим уровнем надежности для случая в Примере 1.
Решение
Уровень достоверности γ = 75% = 0,75, который связан с уровнем значимости α соотношением γ = (1 - α), так что уровень значимости α = 1 - 0,75 = 0. , 25.
Это означает, что кумулятивная нормальная вероятность между -∞ и Zγ равна:
P (Z ≤ Zγ) = 1 - 0,125 = 0,875
Что соответствует значению Zγ 1,1503, как показано на рисунке 3.

Рисунок 3. Определение фактора Zγ, соответствующего уровню достоверности 75%. Источник: Ф. Сапата через Geogebra.
Другими словами, ошибка выборки E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
При применении к данным из примера 1 это дает ошибку:
E = 1,15 * 0,15 кг = 0,17 кг
С уровнем достоверности 75%.
- Упражнение 5.
Каков уровень достоверности, если Z α / 2 = 2,4?
Решение
P (Z ≤ Z α / 2 ) = 1 - α / 2
P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164
Уровень значимости:
α = 0,0164 = 1,64%
И наконец, уровень уверенности остается:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Ссылки
- Канавос, Г. 1988. Вероятность и статистика: приложения и методы. Макгроу Хилл.
- Деворе, Дж. 2012. Вероятность и статистика для техники и науки. Восьмой. Издание. Cengage.
- Левин, Р. 1988. Статистика для администраторов. Второй. Издание. Прентис Холл.
- Судман, С. 1982. Задавая вопросы: Практическое руководство по разработке анкеты. Сан-Франциско. Джосси Басс.
- Уолпол, Р. 2007. Вероятность и статистика для инженерии и науки. Пирсон.
- Воннакотт, Т.Х. и Р.Дж. Воннакотт. 1990. Вводная статистика. 5-е изд. Wiley
- Wikipedia. Ошибка выборки. Получено с: en.wikipedia.com
- Wikipedia. Допустимая погрешность. Получено с: en.wikipedia.com
