Как нормировать гистограмму matplotlib: лучшие способы и советы 📊

Нормирование гистограммы в matplotlib может быть достигнуто с помощью метода hist(), который может принимать аргумент density=True. Этот аргумент нормализует гистограмму, приводя сумму всех столбцов к значению 1.

import matplotlib.pyplot as plt

data = [1, 2, 3, 4, 5, 5, 5, 6, 6, 7, 8, 8, 9, 9, 9]
plt.hist(data, density=True)
plt.show()

Детальный ответ

Как нормировать гистограмму matplotlib

Гистограммы являются важным инструментом визуализации данных и позволяют наглядно представить распределение значений в наборе данных. Однако иногда нам нужно нормализовать гистограмму, чтобы сравнивать различные распределения данных на одном графике. В этой статье мы рассмотрим, как выполнить нормализацию гистограммы с использованием библиотеки Matplotlib.

Для начала нам понадобится импортировать необходимые модули:

import matplotlib.pyplot as plt
import numpy as np

Создание гистограммы

Давайте предположим, что у нас есть массив данных, и мы хотим построить гистограмму, чтобы увидеть их распределение. Для этого мы используем функцию plt.hist():

data = np.random.randn(1000) # Случайные данные
plt.hist(data, bins=30, color='skyblue', edgecolor='blue') # Построение гистограммы
plt.xlabel('Значения')
plt.ylabel('Частота')
plt.title('Гистограмма данных')
plt.show()

Результатом выполнения этого кода будет отображение гистограммы данных со случайными значениями.

Нормализация гистограммы

Теперь давайте перейдем к нормализации гистограммы, чтобы ее значения находились в диапазоне от 0 до 1. Это позволит нам сравнивать различные распределения на одном графике.

Для нормализации гистограммы мы можем использовать параметр density=True функции plt.hist():

plt.hist(data, bins=30, color='skyblue', edgecolor='blue', density=True) # Нормализация гистограммы
plt.xlabel('Значения')
plt.ylabel('Плотность')
plt.title('Нормализованная гистограмма данных')
plt.show()

Теперь наша гистограмма нормализована, и значения на оси Y представляют собой плотность распределения данных. Это позволяет сравнивать различные распределения с учетом их отношения к плотности.

Процентная нормализация гистограммы

Иногда нам может понадобиться нормализовать гистограмму таким образом, чтобы значения оси Y представляли проценты от общего числа элементов. Для этого мы можем использовать параметр weights функции plt.hist() и поделить значения на общее количество элементов:

count, bins, _ = plt.hist(data, bins=30, color='skyblue', edgecolor='blue', weights=np.ones(len(data)) / len(data)) # Процентная нормализация гистограммы
plt.xlabel('Значения')
plt.ylabel('Проценты')
plt.title('Процентная нормализованная гистограмма данных')
plt.show()

Теперь гистограмма представляет собой процентное отношение к общему количеству элементов, и значения на оси Y представляют проценты.

Заключение

В этой статье мы рассмотрели, как нормализовать гистограмму с использованием библиотеки Matplotlib. Мы узнали, как создать гистограмму данных и как выполнить нормализацию гистограммы для сравнения разных распределений. Мы также рассмотрели случаи нормализации по плотности и в процентах. Надеюсь, эта статья помогла вам лучше понять, как применять нормализацию гистограммы в ваших проектах с помощью Matplotlib.

Видео по теме

#10. Рисуем гистограммы, столбчатые и круговые диаграммы | Matplotlib уроки

Основы Matplotlib | Построение Графиков На Python

Основы Matplotlib. Визуализация данных. Графики и диаграммы в Python

Похожие статьи:

Как нормировать гистограмму matplotlib: лучшие способы и советы 📊