- Что есть на гистограмме?
- Для чего нужна гистограмма?
- Типы и примеры гистограмм
- Горизонтальные гистограммы
- Кластерные гистограммы
- Гистограмма с накоплением
- Гистограмма
- Ссылки
Гистограмму , которая также называется гистограмма, является способ представления данных, значений или частоты, которые связаны друг с другом, используя вертикальные или горизонтальные полосы. Их длина пропорциональна величине, которую они представляют.
Гистограммы очень полезны не только потому, что они позволяют сразу увидеть тенденции изменения переменных, но и потому, что их легко построить и интерпретировать.

Рис. 1. Столбиковая диаграмма, показывающая соотношение между доходом от продажи определенного продукта и месяцем. Источник: Pixabay.
Например, у нас есть график выше, который показывает прибыль магазина от продажи определенного продукта в течение первых 6 месяцев года. Тенденция восходящая, на что указывает стрелка.
Что есть на гистограмме?
Чтобы график был полезным, он должен иметь:
- Заголовок: очень важно, чтобы на видном месте был заголовок, который кратко описывает то, что сравнивается.
- Дискретные категории на одной из осей : которые в примере соответствуют месяцам в году, представлены непосредственно их названиями на горизонтальной оси. Обратите внимание, что для категорий нет шкалы, а ширина всех полос одинакова.
Кроме того, полосы разделены, указывая на то, что категории дискретны. Это означает, что они не имеют бесконечных значений в определенном конечном интервале.
- Числовая величина на другой оси : в примере они соответствуют доходам в месяц для продаж, указанных в долларах США, и они расположены на вертикальной оси. Это еще один очень важный момент, так как единицы измерения необходимо указывать тщательно. Также по вертикальной оси есть шкала, которая в данном случае идет от 1000 до 1000 долларов.
- Правильный размер : графика должна быть удобной для просмотра, очень мелкая графика плохо читается.
Для чего нужна гистограмма?
Гистограммы позволяют быстро визуализировать тенденции и поведение.
Их очень легко сделать как вручную, что больше не стилизовано, так и в электронных таблицах типа Excel и в специализированном программном обеспечении. С ними вы можете сравнивать многие типы данных: номинальные или числовые.
Номинальные данные носят информативный характер, например, месяцы в году, дни, семейное положение, цвета кожи, страна рождения, имена участников различных профессий и многое другое.
Числовые данные можно каким-либо образом упорядочить, классифицировать, сгруппировать или квантовать. При необходимости также допускаются отрицательные значения, и в этом случае полоса будет ниже горизонтальной оси.
Типы и примеры гистограмм
В примере, приведенном в начале, был показан один из наиболее часто используемых типов гистограмм, например, вертикальные полосы.
Однако гистограммы более универсальны, поэтому их можно создавать другими способами, следуя изложенным основным принципам.
Например, полосы могут быть горизонтальными, и даже несколько категорий могут быть представлены одновременно. Ниже приведены несколько примеров.
Горизонтальные гистограммы
На графиках этого типа горизонтальная длина полосы указывает величину представленной категории. Желательно, чтобы номинальные имена данных были слишком длинными, чтобы помещать их внизу вертикальной полосы.
Они также подходят, когда числа большие, если столбцов больше 10, или если доступного пространства просто недостаточно для создания вертикальной столбчатой диаграммы.
Далее у нас есть хороший пример на этом графике процентов электроэнергии, полученной с помощью энергии ветра в 15 штатах США, которые обычно используют этот источник энергии.

Рисунок 2. Пример горизонтальной гистограммы. Источник: Wikimedia Commons.
На этот раз шкала находится на горизонтальной оси, но также отдельные проценты были помещены непосредственно на каждую полосу, чтобы облегчить анализ.
Также наблюдается, что полоски начинаются с самых длинных, а затем уменьшаются.
Это подходящий способ представления данных, поскольку вы почти всегда хотите выделить наибольшее значение с одной стороны и наименьшее - с другой, хотя данные не всегда подходят для этого.
В этом примере штат с самым высоким процентом электроэнергии, вырабатываемой ветровой энергией, - это Южная Дакота, а самый низкий - в Монтане, что закрывает график.
Кластерные гистограммы
Когда есть несколько категорий для сравнения с определенной числовой величиной, нет проблем с назначением полосы для каждой категории, которая обычно отличается определенным цветом или оттенком. Таким образом представлены подмножества категории.
На этом графике вам нужно добавить ключ, чтобы быстро распознать, какая полоса назначена определенной категории. Этот ключ должен находиться на видном месте, которое может находиться внутри самого графика или под горизонтальной осью.
Сгруппированные гистограммы могут отображаться вертикально или горизонтально, в зависимости от требований к пространству.
Однако следует проявлять осторожность, чтобы не включать слишком много подгрупп или подкатегорий, потому что в противном случае анализ становится трудным и первоначальная цель, заключающаяся в предоставлении информации, теряется.

Рисунок 3. Группированная гистограмма. Источник: Wikimedia Commons.
Гистограмма с накоплением
Подгруппы также представлены на этом типе диаграммы, но вместо отдельных столбцов используется один и тот же столбец. Подгруппа помещается поверх другой, если полоса вертикальная, или рядом с ней, если полоса горизонтальна.
Высота или длина полосы - это числовое значение, присвоенное всей категории, а вклад каждой подкатегории указывается над сегментированной полосой либо в абсолютных значениях, либо в процентах.
Гистограммы с накоплением очень полезны для сравнения влияния каждой подгруппы на общую сумму для категории. Однако иногда значения каждой подгруппы не указываются, и наблюдатель должен найти их, используя градуированную шкалу на соответствующей оси. Иногда это может быть сложно.
Как и в предыдущем примере, не рекомендуется чрезмерно сегментировать полосу, поскольку это сбивает читателя с толку. Рекомендуемый максимум - 5 подгрупп.
Вот пример с двумя переменными и гипотетическими данными.

Рисунок 4. Гистограмма с накоплением. Источник: Wikimedia Commons. Innesw / CC BY-SA (https://creativecommons.org/licenses/by-sa/3.0)
Гистограмма
Наконец, у нас есть гистограмма, представление, в котором также используются столбцы и широко используется в описательной статистике. Они очень полезны, потому что показывают способ распределения населения.
В простой гистограмме частоты расположены на вертикальной оси, а на горизонтальной оси отложены значения или диапазон значений, которые принимает переменная. Высота полосы - это частота, о которой идет речь, а ширина соответствует значению или диапазону значений переменной.
Например, диапазон значений может быть возрастным диапазоном детей, организованный следующим образом: 0-6 лет, 6-12 лет, 12-18 лет, а числовые значения, такие как средний рост, вес или другие, могут идти по вертикальной оси. ,
На гистограмме следующего рисунка было выбрано разделение популяции из 18 человек, которые прошли анализ крови на холестерин ЛПВП.
Диапазон значений холестерина составляет от 40 до 70 мг / дл, и население было разделено на 6 категорий. Самая длинная полоса для 6 человек имеет значение от 50 до 55 мг / дл холестерина ЛПВП в крови.

Рисунок 5. Гистограмма 18 человек, прошедших тест на холестерин. Источник: Wikimedia Commons.
Ссылки
- Центр знаний IBM. Определение гистограммы. Получено с: ibm.com
- НАУ. Гистограммы. Получено с: asesorias.cuautitlan2.unam.mx.
- Университет Лестера. Гистограммы. Получено с: www2.le.ac.uk.
- Wikipedia. Гистограмма. Получено с: eu.wikipedia.org.
- Wikipedia. Гистограмма. Получено с: es.wikipedia.org.
