Как нормировать гистограмму matplotlib: лучшие способы и советы 📊
Нормирование гистограммы в matplotlib может быть достигнуто с помощью метода hist(), который может принимать аргумент density=True. Этот аргумент нормализует гистограмму, приводя сумму всех столбцов к значению 1.
import matplotlib.pyplot as plt
data = [1, 2, 3, 4, 5, 5, 5, 6, 6, 7, 8, 8, 9, 9, 9]
plt.hist(data, density=True)
plt.show()
Детальный ответ
Как нормировать гистограмму matplotlib
Гистограммы являются важным инструментом визуализации данных и позволяют наглядно представить распределение значений в наборе данных. Однако иногда нам нужно нормализовать гистограмму, чтобы сравнивать различные распределения данных на одном графике. В этой статье мы рассмотрим, как выполнить нормализацию гистограммы с использованием библиотеки Matplotlib.
Для начала нам понадобится импортировать необходимые модули:
import matplotlib.pyplot as plt
import numpy as np
Создание гистограммы
Давайте предположим, что у нас есть массив данных, и мы хотим построить гистограмму, чтобы увидеть их распределение. Для этого мы используем функцию plt.hist()
:
data = np.random.randn(1000) # Случайные данные
plt.hist(data, bins=30, color='skyblue', edgecolor='blue') # Построение гистограммы
plt.xlabel('Значения')
plt.ylabel('Частота')
plt.title('Гистограмма данных')
plt.show()
Результатом выполнения этого кода будет отображение гистограммы данных со случайными значениями.
Нормализация гистограммы
Теперь давайте перейдем к нормализации гистограммы, чтобы ее значения находились в диапазоне от 0 до 1. Это позволит нам сравнивать различные распределения на одном графике.
Для нормализации гистограммы мы можем использовать параметр density=True
функции plt.hist()
:
plt.hist(data, bins=30, color='skyblue', edgecolor='blue', density=True) # Нормализация гистограммы
plt.xlabel('Значения')
plt.ylabel('Плотность')
plt.title('Нормализованная гистограмма данных')
plt.show()
Теперь наша гистограмма нормализована, и значения на оси Y представляют собой плотность распределения данных. Это позволяет сравнивать различные распределения с учетом их отношения к плотности.
Процентная нормализация гистограммы
Иногда нам может понадобиться нормализовать гистограмму таким образом, чтобы значения оси Y представляли проценты от общего числа элементов. Для этого мы можем использовать параметр weights
функции plt.hist()
и поделить значения на общее количество элементов:
count, bins, _ = plt.hist(data, bins=30, color='skyblue', edgecolor='blue', weights=np.ones(len(data)) / len(data)) # Процентная нормализация гистограммы
plt.xlabel('Значения')
plt.ylabel('Проценты')
plt.title('Процентная нормализованная гистограмма данных')
plt.show()
Теперь гистограмма представляет собой процентное отношение к общему количеству элементов, и значения на оси Y представляют проценты.
Заключение
В этой статье мы рассмотрели, как нормализовать гистограмму с использованием библиотеки Matplotlib. Мы узнали, как создать гистограмму данных и как выполнить нормализацию гистограммы для сравнения разных распределений. Мы также рассмотрели случаи нормализации по плотности и в процентах. Надеюсь, эта статья помогла вам лучше понять, как применять нормализацию гистограммы в ваших проектах с помощью Matplotlib.