🔍 Как работать с pivot table pandas: шаг за шагом руководство для новичков

Для работы с сводными таблицами в библиотеке Pandas следуйте этому шагам:

Шаг 1: Загрузите библиотеку Pandas:

import pandas as pd

Шаг 2: Создайте DataFrame, содержащий данные, на которых вы хотите построить сводную таблицу:

data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'City': ['New York', 'Los Angeles', 'Chicago'],
        'Age': [25, 30, 35]}
df = pd.DataFrame(data)

Шаг 3: Используйте метод pivot_table() для создания сводной таблицы:

pivot_table = df.pivot_table(values='Age', index='Name', columns='City')

Шаг 4: Выведите сводную таблицу:

print(pivot_table)

Эти шаги позволят вам легко работать с сводными таблицами в Pandas.

Детальный ответ

Как работать с pivot table в Pandas

В статье мы рассмотрим, как использовать функцию pivot table в библиотеке Pandas для анализа и преобразования данных. Функция pivot table позволяет нам создавать сводные таблицы и проводить агрегацию данных по определенным критериям.

Шаг 1: Импорт библиотеки Pandas

Прежде чем начать, убедитесь, что у вас установлена библиотека Pandas. Импортируем ее с помощью следующей команды:

import pandas as pd

Шаг 2: Загрузка данных

Для работы с pivot table нам понадобится набор данных. Давайте загрузим данные из файла CSV с помощью функции read_csv:

data = pd.read_csv('file.csv')

Шаг 3: Создание сводной таблицы

Теперь мы можем создать сводную таблицу с помощью функции pivot_table. Укажем столбцы, которые будут являться индексами, и столбцы, по которым будет проводиться агрегация данных. Например, давайте создадим сводную таблицу, группируя данные по столбцу "Город" и агрегируя данные по столбцу "Продажи":

pivot = pd.pivot_table(data, index='Город', values='Продажи')

Шаг 4: Добавление агрегационных функций

По умолчанию, функция pivot_table использует среднее значение (mean) для агрегации данных. Однако, мы можем указать другие агрегационные функции, такие как сумма (sum), медиана (median), минимум (min), максимум (max), и т.д. Давайте добавим функцию суммы к нашей сводной таблице:

pivot = pd.pivot_table(data, index='Город', values='Продажи', aggfunc=sum)

Шаг 5: Добавление дополнительных индексов и столбцов

Мы также можем добавить дополнительные индексы и столбцы для уточнения нашей сводной таблицы. Для этого достаточно указать соответствующие столбцы в параметрах index и columns функции pivot_table. Например, давайте добавим индекс "Год" и столбец "Категория" к нашей сводной таблице:

pivot = pd.pivot_table(data, index=['Год', 'Город'], columns='Категория', values='Продажи')

Шаг 6: Заполнение пропущенных значений

Если в наших данных есть пропущенные значения, мы можем указать, как заполнить эти пропуски с помощью параметра fill_value функции pivot_table. Например, давайте заполним пропущенные значения нулями:

pivot = pd.pivot_table(data, index='Город', values='Продажи', fill_value=0)

Шаг 7: Добавление многоуровневых заголовков

Мы также можем добавить многоуровневые заголовки к своей сводной таблице, чтобы лучше организовать данные. Для этого нам потребуется использовать функцию MultiIndex из модуля pandas:

pivot.columns = pd.MultiIndex.from_arrays([['Продажи'], pivot.columns])

Шаг 8: Сортировка данных

Если нам нужно отсортировать данные в сводной таблице, мы можем использовать функцию sort_values или sort_index. Например, давайте отсортируем данные по убыванию значения продаж:

pivot = pivot.sort_values(by=('Продажи', ''), ascending=False)

Шаг 9: Визуализация данных

Наконец, мы можем визуализировать нашу сводную таблицу с помощью графиков. Для этого мы можем использовать функции библиотеки Matplotlib или Seaborn. Например, давайте построим столбчатую диаграмму для отображения суммарных продаж по городам:

import matplotlib.pyplot as plt
import seaborn as sns

sns.barplot(x=pivot.index, y=('Продажи', ''), color='skyblue')
plt.xlabel('Город')
plt.ylabel('Продажи')
plt.title('Суммарные продажи по городам')
plt.show()

Заключение

Функция pivot table в библиотеке Pandas является мощным инструментом для анализа и преобразования данных. Она позволяет нам группировать, агрегировать и визуализировать данные в удобной форме. С помощью функции pivot_table вы можете легко и эффективно проводить сводный анализ данных. Не забывайте использовать документацию Pandas для получения дополнительной информации и примеров использования.

Видео по теме

Сводные таблицы в pandas

Pivot Table in Pandas Python | Pandas Pivot Table | Summarization using Pivot Table in Pandas Python

Фильтрация данных в Pandas | Анатолий Карпов | karpov.courses

Похожие статьи:

🔍 Как работать с pivot table pandas: шаг за шагом руководство для новичков