- формула
- Характеристики нормального распределения
- Доверительные интервалы
- Приложения нормального распределения
- пример
- Упражнение решено
- Ссылки
Нормальное распределение или распределение гауссово является распределение вероятностей в непрерывной переменной, в которой функция плотности вероятности описывается экспоненциальной функцией квадратичной и отрицательного аргумента, что приводит к форме колокола.
Название «нормальное распределение» происходит от того факта, что это распределение применяется к наибольшему количеству ситуаций, когда некоторая непрерывная случайная величина участвует в данной группе или популяции.

Рис. 1. Нормальное распределение N (x; μ, σ) и его плотность вероятности f (s; μ, σ). (Собственная разработка)
Примеры, в которых применяется нормальное распределение: рост мужчин или женщин, вариации некоторых физических величин или измеримых психологических или социологических характеристик, таких как интеллектуальный коэффициент или привычки потребления определенного продукта.
С другой стороны, это называется распределением Гаусса или колоколом Гаусса, потому что именно этому немецкому математическому гению приписывают его открытие за то, что он использовал его для описания статистической ошибки астрономических измерений еще в 1800 году.
Однако утверждается, что это статистическое распределение ранее было опубликовано другим великим математиком французского происхождения, таким как Абрахам де Муавр, еще в 1733 году.
формула
Функция нормального распределения непрерывной переменной x с параметрами μ и σ обозначается как:
N (х; μ, σ)
и это явно написано так:
N (x; μ, σ) = ∫ -∞ x f (s; μ, σ) ds
где f (u; μ, σ) - функция плотности вероятности:
f (s; μ, σ) = (1 / (σ√ (2π)) Exp (- s 2 / (2σ 2 ))
Константа, которая умножает экспоненту в функции плотности вероятности, называется нормировочной постоянной, и она была выбрана таким образом, чтобы:
N (+ ∞, μ, σ) = 1
Предыдущее выражение гарантирует, что вероятность того, что случайная величина x находится между -∞ и + ∞, равна 1, то есть 100% вероятность.
Параметр μ - это среднее арифметическое непрерывной случайной величины x, а σ - стандартное отклонение или квадратный корень из дисперсии той же переменной. В случае, когда μ = 0 и σ = 1, мы имеем стандартное нормальное распределение или типичное нормальное распределение:
N (х; μ = 0, σ = 1)
Характеристики нормального распределения
1- Если случайная статистическая величина следует нормальному распределению плотности вероятности f (s; μ, σ), большинство данных сгруппированы вокруг среднего значения μ и разбросаны вокруг него таким образом, что немногим более ⅔ данных находится между μ - σ и μ + σ.
2- Стандартное отклонение σ всегда положительно.
3- Форма функции плотности f похожа на форму колокола, поэтому эту функцию часто называют гауссовским звонком или функцией Гаусса.
4- В гауссовом распределении среднее значение, медиана и мода совпадают.
5- Точки перегиба функции плотности вероятности находятся точно в точках μ - σ и μ + σ.
6. Функция f симметрична относительно оси, проходящей через ее среднее значение μ, и имеет асимптотический нуль для x ⟶ + ∞ и x ⟶ -∞.
7- Чем выше значение σ, тем больше разброс, шум или расстояние данных вокруг среднего значения. Другими словами, чем выше σ, форма колокола более открытая. С другой стороны, маленький σ указывает на то, что игральные кости близки к среднему, а форма колокольчика более замкнутая или заостренная.
8- Функция распределения N (x; μ, σ) указывает вероятность того, что случайная величина меньше или равна x. Например, на рисунке 1 (выше) вероятность P того, что переменная x меньше или равна 1,5, составляет 84% и соответствует площади под функцией плотности вероятности f (x; μ, σ) из -∞ к x.
Доверительные интервалы
9- Если данные соответствуют нормальному распределению, то 68,26% из них находятся между μ - σ и μ + σ.
10-95,44% данных, которые следуют нормальному распределению, находятся между μ - 2σ и μ + 2σ.
11-99,74% данных, которые следуют нормальному распределению, находятся между μ - 3σ и μ + 3σ.
12- Если случайная величина x следует распределению N (x; μ, σ), то переменная
z = (x - μ) / σ следует стандартному нормальному распределению N (z; 0,1).
Переход от переменной x к z называется стандартизацией или типизацией и очень полезен при применении таблиц стандартного распределения к данным, которые следуют нестандартному нормальному распределению.
Приложения нормального распределения
Чтобы применить нормальное распределение, необходимо выполнить вычисление интеграла плотности вероятности, что с аналитической точки зрения непросто, и не всегда существует компьютерная программа, позволяющая его численный расчет. Для этого используются таблицы нормированных или стандартизованных значений, что является не чем иным, как нормальным распределением в случае μ = 0 и σ = 1.

Стандартизированная таблица нормального распределения (часть 1/2)

Стандартизированная таблица нормального распределения (часть 2/2)
Следует отметить, что эти таблицы не содержат отрицательных значений. Однако, используя свойства симметрии гауссовой функции плотности вероятности, можно получить соответствующие значения. Решенное упражнение, показанное ниже, указывает на использование таблицы в этих случаях.
пример
Предположим, у вас есть набор случайных данных x, которые подчиняются нормальному распределению среднего 10 и стандартного отклонения 2. Вас просят найти вероятность того, что:
а) Случайная величина x меньше или равна 8.
б) меньше или равно 10.
c) что переменная x меньше 12.
г) Вероятность того, что значение x находится в диапазоне от 8 до 12.
Решение:
а) Чтобы ответить на первый вопрос, вам просто нужно вычислить:
N (х; μ, σ)
При x = 8, μ = 10 и σ = 2. Мы понимаем, что это интеграл, который не имеет аналитического решения в элементарных функциях, но решение выражается как функция функции ошибок erf (x).
С другой стороны, существует возможность решения интеграла в числовой форме, что и делают многие калькуляторы, электронные таблицы и компьютерные программы, такие как GeoGebra. На следующем рисунке показано численное решение, соответствующее первому случаю:

Рис. 2. Плотность вероятности f (x; μ, σ). Заштрихованная область представляет P (x ≤ 8). (Собственная разработка)
и ответ таков: вероятность того, что x меньше 8:
P (x ≤ 8) = N (x = 8; μ = 10, σ = 2) = 0,1587
б) В этом случае мы пытаемся найти вероятность того, что случайная величина x ниже среднего, которое в данном случае равно 10. Ответ не требует никаких вычислений, поскольку мы знаем, что половина данных находится ниже среднего. средний, а другая половина выше среднего. Следовательно, ответ таков:
P (x ≤ 10) = N (x = 10; μ = 10, σ = 2) = 0,5
c) Чтобы ответить на этот вопрос, мы должны вычислить N (x = 12; μ = 10, σ = 2), что можно сделать с помощью калькулятора со статистическими функциями или с помощью программного обеспечения, такого как GeoGebra:

Рис. 3. Плотность вероятности f (x; μ, σ). Заштрихованная область представляет P (x ≤ 12). (Собственная разработка)
Ответ на часть c можно увидеть на рисунке 3:
P (x ≤ 12) = N (x = 12; μ = 10, σ = 2) = 0,8413.
г) Чтобы найти вероятность того, что случайная величина x находится между 8 и 12, мы можем использовать результаты частей a и c следующим образом:
P (8 ≤ x ≤ 12) = P (x ≤ 12) - P (x ≤ 8) = 0,8413 - 0,1587 = 0,6826 = 68,26%.
Упражнение решено
Средняя цена акций компании составляет 25 долларов со стандартным отклонением 4 доллара. Определите вероятность того, что:
а) Стоимость акции меньше 20 долларов.
б) Это стоит более 30 долларов.
в) Цена от 20 до 30 долларов.
Используйте стандартные таблицы нормального распределения, чтобы найти ответы.
Решение:
Чтобы использовать таблицы, необходимо перейти к нормализованной или типизированной переменной z:
20 долларов в нормализованной переменной равны z = (20 - 25 долларов) / 4 доллара = -5/4 = -1,25 и
30 долларов в нормализованной переменной равны z = (30 - 25 долларов) / 4 доллара = +5/4 = +1,25.
а) 20 долларов США равняются -1,25 в нормализованной переменной, но в таблице нет отрицательных значений, поэтому мы определяем значение +1,25, которое дает значение 0,8944.
Если из этого значения вычесть 0,5, результатом будет область между 0 и 1,25, которая, кстати, идентична (по симметрии) области между -1,25 и 0. Результат вычитания составляет 0,8944 - 0,5 = 0,3944, что соответствует диапазону от -1,25 до 0.
Но представляет интерес область от -∞ до -1,25, которая будет 0,5 - 0,3944 = 0,1056. Таким образом, можно сделать вывод, что вероятность того, что цена акции ниже 20 долларов, составляет 10,56%.
б) 30 долларов в типизированной переменной z равно 1,25. Для этого значения в таблице указано число 0,8944, которое соответствует области от -∞ до +1,25. Область между +1,25 и + ∞ равна (1 - 0,8944) = 0,1056. Другими словами, вероятность того, что акция стоит более 30 долларов, составляет 10,56%.
c) Вероятность того, что действие будет стоить от 20 до 30 долларов, будет рассчитана следующим образом:
100% -10,56% - 10,56% = 78,88%
Ссылки
- Статистика и вероятность. Нормальное распределение. Получено с: projectdescartes.org
- GeoGebra. Классическая геогебра, исчисление вероятностей. Восстановлено с geogebra.org
- MathWorks. Гауссово распределение. Получено с: es.mathworks.com
- Менденхолл, В. 1981. Статистика для управления и экономики. Третий. издание. Grupo Редакционное Ибероамерика.
- Stat Trek. Изучите статистику. Распределение Пуассона. Получено с: stattrek.com,
- Триола, м. 2012. Элементарная статистика. 11. Издание Pearson Education.
- Университет Виго. Основные непрерывные распределения. Получено с: anapg.webs.uvigo.es
- Wikipedia. Нормальное распределение. Получено с: es.wikipedia.org
