Что такое Pivot Table в Pandas: подробное описание и примеры использования 📊🐼

pivot table в библиотеке Pandas - это инструмент для создания структурированных таблиц, которые позволяют анализировать данные и суммировать их по разным категориям. Он позволяет сгруппировать данные по одному или нескольким столбцам и выполнить агрегацию значений по другим столбцам. Вот пример использования:
import pandas as pd

# Создаем DataFrame с данными
data = {
    'Город': ['Москва', 'Санкт-Петербург', 'Москва', 'Санкт-Петербург', 'Москва'],
    'Пол': ['М', 'Ж', 'Ж', 'Ж', 'М'],
    'Возраст': [25, 30, 35, 40, 45],
    'Зарплата': [50000, 60000, 70000, 80000, 90000]
}

df = pd.DataFrame(data)

# Создаем сводную таблицу
pivot_table = df.pivot_table(index='Город', columns='Пол', values='Зарплата', aggfunc='mean')

print(pivot_table)
В этом примере мы создаем DataFrame с информацией о городах, поле и зарплате. Затем мы используем метод `pivot_table` для создания сводной таблицы, где города являются строками, пол - столбцами, а среднее значение зарплаты - значениями. Полученная сводная таблица позволяет нам сравнивать среднюю зарплату между разными городами и полами.

Детальный ответ

Полный, подробный ответ на вопрос "что такое pivot table pandas"

В библиотеке pandas для анализа данных существует очень полезная функция под названием «pivot table», которая позволяет сгруппировать данные в таблице по заданным столбцам и применить агрегирующую функцию к этим данным. При работе с большими объемами данных, она является незаменимым инструментом для анализа и визуализации информации.

Давайте рассмотрим простой пример, чтобы лучше понять, как работает pivot table в pandas:

import pandas as pd

# Создаем пример данных
data = {
    'Город': ['Москва', 'Санкт-Петербург', 'Москва', 'Санкт-Петербург', 'Москва'],
    'Год': [2019, 2019, 2020, 2020, 2021],
    'Продажи': [1000, 2000, 1500, 2500, 1800]
}

df = pd.DataFrame(data)

# Используем pivot table
pivot_table = pd.pivot_table(df, values='Продажи', index='Город', columns='Год', aggfunc=sum)

print(pivot_table)

Результат:

Год                2019    2020    2021
Город                                 
Москва             1000.0  1500.0  1800.0
Санкт-Петербург    2000.0  2500.0   NaN

В приведенном выше примере у нас есть данные о продажах товаров в разных городах за несколько лет. Мы хотим узнать сумму продаж по годам и городам. С помощью функции pivot_table мы передаем исходный DataFrame df, указываем, что значениями должны быть столбец «Продажи», строки должны быть сгруппированы по столбцу «Город», а столбцы - по столбцу «Год». Мы также указываем, что для агрегации данных нужно использовать сумму.

Как видно из результата, функция pivot_table создает новую таблицу, в которой значения сгруппированы по годам и городам. Отсутствующие значения обозначены как NaN.

Функция pivot_table также предоставляет дополнительные возможности для настройки результатов. Мы можем указать несколько столбцов для группировки, использовать разные агрегирующие функции, применять фильтры и многое другое. Более подробную информацию о различных параметрах функции можно найти в документации pandas.

Таким образом, функция pivot_table в библиотеке pandas является мощным инструментом для анализа данных и создания сводных таблиц. Она позволяет увидеть общую картину и сделать выводы на основе сгруппированных данных.

Видео по теме

Сводные таблицы в pandas

Pivot Tables | Pandas

Pandas Part 15 - Pandas Pivot Table

Похожие статьи:

🔍 Как узнать тип данных в колонке pandas: руководство

🔍 Как вычитать даты в pandas: исчерпывающий гид и простые трюки

Что такое Pivot Table в Pandas: подробное описание и примеры использования 📊🐼