- Сгруппированные данные
- пример
- Три основных показателя центральной тенденции
- 1- Среднее арифметическое
- 2- Средний
- 3- Мода
- Ссылки
В меры центральной тенденции сгруппированных данных используются в статистике для описания определенных поведения группы поставляемых данных, например, какое значение они близки, что среднее значение данных , собранных, среди других.
При получении большого количества данных полезно сгруппировать их, чтобы иметь лучший порядок из них и, таким образом, иметь возможность вычислить определенные меры центральной тенденции.

Среди наиболее широко используемых показателей центральной тенденции - среднее арифметическое, медиана и мода. Эти числа говорят об определенных качествах данных, собранных в определенном эксперименте.
Чтобы использовать эти меры, вам сначала нужно знать, как сгруппировать набор данных.
Сгруппированные данные
Чтобы сгруппировать данные, вы должны сначала вычислить диапазон данных, который получается вычитанием самого высокого значения за вычетом самого низкого значения данных.
Затем выбирается число «k» - количество классов, в которых мы хотим сгруппировать данные.
Диапазон делится на «k» для получения амплитуды группируемых классов. Это число C = R / k.
Наконец, начинается группировка, для которой выбирается число меньше наименьшего значения полученных данных.
Это число будет нижней границей первого класса. К этому добавляется C. Полученное значение будет верхним пределом первого класса.
Затем к этому значению добавляется C и получается верхний предел второго класса. Таким образом, мы переходим к получению верхней границы последнего класса.
После того, как данные сгруппированы, можно рассчитать среднее, медианное значение и моду.
Чтобы проиллюстрировать, как вычисляются среднее арифметическое, медиана и мода, мы рассмотрим пример.
пример

Следовательно, при группировании данных будет получена таблица, подобная следующей:

Три основных показателя центральной тенденции
Теперь перейдем к вычислению среднего арифметического, медианы и моды. Приведенный выше пример будет использован для иллюстрации этой процедуры.
1- Среднее арифметическое
Среднее арифметическое состоит из умножения каждой частоты на среднее значение интервала. Затем все эти результаты складываются и, наконец, делятся на общие данные.
Используя предыдущий пример, можно было бы получить, что среднее арифметическое равно:
(4 * 2 + 4 * 4 + 6 * 6 + 4 * 8) / 18 = (8 + 16 + 36 + 32) / 18 = 5,11111
Это означает, что среднее значение данных в таблице равно 5,11111.
2- Средний
Чтобы вычислить медиану набора данных, мы сначала упорядочиваем все данные от наименьшего к наибольшему. Возможны два случая:
- Если количество данных нечетное, то медиана - это данные, которые находятся прямо в центре.
- Если количество данных четное, то медиана - это среднее значение двух данных, находящихся в центре.
Когда дело доходит до сгруппированных данных, расчет медианы выполняется следующим образом:
- Рассчитывается N / 2, где N - общие данные.
- Выполняется поиск первого интервала, в котором накопленная частота (сумма частот) больше N / 2, и выбирается нижняя граница этого интервала, называемая Li.
Медиана рассчитывается по следующей формуле:
Me = Li + (Ls-Li) * (N / 2 - накопленная частота до Li) / частота [Li, Ls)
Ls - верхняя граница указанного выше интервала.
Если используется предыдущая таблица данных, N / 2 = 18/2 = 9. Суммарные частоты равны 4, 8, 14 и 18 (по одной для каждой строки таблицы).
Следовательно, необходимо выбрать третий интервал, поскольку накопленная частота больше N / 2 = 9.
Итак, Li = 5 и Ls = 7. Применяя формулу, описанную выше, вы должны:
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 ≈ 5,3333.
3- Мода
Режим - это значение, которое имеет самую высокую частоту среди всех сгруппированных данных; то есть это значение, которое чаще всего повторяется в исходном наборе данных.
Если у вас очень большой объем данных, для расчета режима сгруппированных данных используется следующая формула:
Mo = Li + (Ls-Li) * (частота Li - Частота L (i-1)) / ((частота Li - Частота L (i-1)) + (частота Li - Частота L ( я + 1)))
Интервал [Li, Ls) - это интервал, в котором находится самая высокая частота. Для примера, сделанного в этой статье, режим задается следующим образом:
Мо = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Другая формула, которая используется для получения приблизительного значения режима, следующая:
Mo = Li + (Ls-Li) * (частота L (i + 1)) / (частота L (i-1) + частота L (i + 1)).
С помощью этой формулы счета выглядят следующим образом:
Мо = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Ссылки
- Беллхаус, Д.Р. (2011). Абрахам Де Муавр: Подготовка основы для классической вероятности и ее приложений. CRC Press.
- Cifuentes, JF (2002). Введение в теорию вероятностей. Национальный университет Колумбии.
- Дастон, Л. (1995). Классическая вероятность в эпоху Просвещения. Издательство Принстонского университета.
- Ларсон, HJ (1978). Введение в теорию вероятностей и статистический вывод. От редакции Лимуса.
- Мартель, П.Дж., и Вегас, Ф.Дж. (1996). Вероятность и математическая статистика: приложения в клинической практике и управлении здоровьем. Издания Диаса де Сантоса.
- Васкес, А.Л., и Ортис, Ф.Дж. (2005). Статистические методы измерения, описания и контроля изменчивости. Издание Университета Кантабрии.
- Васкес, С. Г. (2009). Пособие по математике для поступления в университет. Редакция Centro de Estudios Ramon Areces SA.
