Класс марка , известная также как средняя точка, это значение в центре класса, который представляет все значения , которые находятся в этой категории. По сути, метка класса используется для расчета определенных параметров, таких как среднее арифметическое или стандартное отклонение.
Таким образом, отметка класса - это середина любого интервала. Это значение также очень полезно для определения дисперсии набора данных, уже сгруппированных в классы, что, в свою очередь, позволяет нам понять, как далеко от центра расположены эти определенные данные.

Распределение частоты
Чтобы понять, что такое классный знак, необходима концепция частотного распределения. Учитывая набор данных, частотное распределение представляет собой таблицу, которая делит данные на ряд категорий, называемых классами.
В этой таблице показано количество элементов, принадлежащих каждому классу; последний известен как частота.
В этой таблице приносится в жертву часть информации, которую мы получаем из данных, поскольку вместо того, чтобы иметь индивидуальное значение каждого элемента, мы знаем только, что он принадлежит к этому классу.
С другой стороны, мы получаем лучшее понимание набора данных, поскольку таким образом легче оценить установленные закономерности, что облегчает манипулирование указанными данными.
Сколько классов учитывать?
Чтобы выполнить частотное распределение, мы должны сначала определить количество классов, которые мы хотим выбрать, и выбрать их пределы классов.
Выбор количества классов должен быть удобным, учитывая, что небольшое количество классов может скрыть информацию о данных, которые мы хотим изучить, а очень большое может генерировать слишком много деталей, которые не обязательно будут полезны.
Факторов, которые мы должны принять во внимание при выборе количества классов, несколько, но среди них два выделяются: во-первых, необходимо учитывать, сколько данных мы должны учитывать; второй - знать, насколько велик диапазон распределения (то есть разница между наибольшим и наименьшим наблюдением).
После того, как классы уже определены, мы приступаем к подсчету, сколько данных существует в каждом классе. Это число называется частотой занятий и обозначается fi.
Как мы уже говорили ранее, мы имеем, что частотное распределение теряет информацию, которая поступает индивидуально из каждых данных или наблюдения. По этой причине ищется значение, представляющее весь класс, к которому оно принадлежит; это значение - знак класса.
Как это получается?
Знак класса - это основная ценность, которую представляет класс. Он получается сложением границ интервала и делением этого значения на два. Мы могли бы выразить это математически следующим образом:
x i = (нижний предел + верхний предел) / 2.
В этом выражении x i обозначает знак i-го класса.
пример
Учитывая следующий набор данных, дайте репрезентативное частотное распределение и получите соответствующую оценку класса.

Поскольку данные с наибольшим числовым значением - 391, а наименьшим - 221, мы имеем диапазон 391-221 = 170.
Мы выберем 5 классов одинакового размера. Один из способов выбора классов следующий:

Обратите внимание, что все данные находятся в классе, они не пересекаются и имеют одинаковое значение. Другой способ выбора классов - рассматривать данные как часть непрерывной переменной, которая может принимать любое реальное значение. В этом случае мы можем рассматривать классы вида:
205-245, 245-285, 285-325, 325-365, 365-405
Однако такой способ группировки данных может вызвать некоторую неоднозначность с границами. Например, в случае 245 возникает вопрос: к какому классу он принадлежит, первому или второму?
Чтобы избежать этой путаницы, сделано соглашение о конечных точках. Таким образом, первый класс будет интервалом (205 245), второй (245 285) и т. Д.

После того, как классы определены, мы приступаем к вычислению частоты, и у нас есть следующая таблица:

После получения частотного распределения данных переходим к нахождению отметок классов каждого интервала. По сути, мы должны:
х 1 = (205+ 245) / 2 = 225
х 2 = (245+ 285) / 2 = 265
х 3 = (285+ 325) / 2 = 305
х 4 = (325+ 365) / 2 = 345
х 5 = (365+ 405) / 2 = 385
Мы можем представить это следующим графиком:

Для чего это?
Как упоминалось ранее, метка класса очень функциональна, чтобы найти среднее арифметическое и дисперсию группы данных, которые уже были сгруппированы в разные классы.
Мы можем определить среднее арифметическое как сумму наблюдений, полученных в разных размерах выборки. С физической точки зрения его интерпретация подобна точке равновесия набора данных.
Идентификация всего набора данных одним числом может быть рискованным, поэтому необходимо также учитывать разницу между этой точкой безубыточности и фактическими данными. Эти значения известны как отклонение от среднего арифметического, и с их помощью мы стремимся определить, насколько изменяется среднее арифметическое данных.
Наиболее распространенный способ найти это значение - по дисперсии, которая представляет собой среднее квадратов отклонений от среднего арифметического.
Для вычисления среднего арифметического и дисперсии набора данных, сгруппированных в класс, мы используем следующие формулы соответственно:

В этих выражениях x i - это отметка i-го класса, f i представляет соответствующую частоту, а k - количество классов, в которых были сгруппированы данные.
пример
Используя данные, приведенные в предыдущем примере, мы можем немного расширить данные таблицы частотного распределения. Вы получите следующее:

Затем, подставляя данные в формулу, мы получаем среднее арифметическое значение:

Его дисперсия и стандартное отклонение:

Из этого можно сделать вывод, что исходные данные имеют среднее арифметическое 306,6 и стандартное отклонение 39,56.
Ссылки
- Фернандес Ф. Сантьяго, Кордова Л. Алехандро, Кордеро С. Хосе М. Описательная статистика. Редакция Esic.
 - Джонсон Ричард А. Миллер и Фройнд Вероятность и государственные деятели для инженеров. Pearson Education.
 - Миллер И. и Фройнд Дж. Вероятность и государственные деятели для инженеров. REVERT.
 - Сарабия А. Хосе Мария, Паскуаль Марта. Базовый курс статистики для компаний
 - Ллинас С. Умберто, Рохас А. Карлос Описательная статистика и распределения вероятностей, Universidad del Norte От редакции
 
