Что такое Pivot Table в Pandas: подробное описание и примеры использования 📊🐼
import pandas as pd
# Создаем DataFrame с данными
data = {
'Город': ['Москва', 'Санкт-Петербург', 'Москва', 'Санкт-Петербург', 'Москва'],
'Пол': ['М', 'Ж', 'Ж', 'Ж', 'М'],
'Возраст': [25, 30, 35, 40, 45],
'Зарплата': [50000, 60000, 70000, 80000, 90000]
}
df = pd.DataFrame(data)
# Создаем сводную таблицу
pivot_table = df.pivot_table(index='Город', columns='Пол', values='Зарплата', aggfunc='mean')
print(pivot_table)
В этом примере мы создаем DataFrame с информацией о городах, поле и зарплате. Затем мы используем метод `pivot_table` для создания сводной таблицы, где города являются строками, пол - столбцами, а среднее значение зарплаты - значениями. Полученная сводная таблица позволяет нам сравнивать среднюю зарплату между разными городами и полами.Детальный ответ
Полный, подробный ответ на вопрос "что такое pivot table pandas"
В библиотеке pandas для анализа данных существует очень полезная функция под названием «pivot table», которая позволяет сгруппировать данные в таблице по заданным столбцам и применить агрегирующую функцию к этим данным. При работе с большими объемами данных, она является незаменимым инструментом для анализа и визуализации информации.
Давайте рассмотрим простой пример, чтобы лучше понять, как работает pivot table в pandas:
import pandas as pd
# Создаем пример данных
data = {
'Город': ['Москва', 'Санкт-Петербург', 'Москва', 'Санкт-Петербург', 'Москва'],
'Год': [2019, 2019, 2020, 2020, 2021],
'Продажи': [1000, 2000, 1500, 2500, 1800]
}
df = pd.DataFrame(data)
# Используем pivot table
pivot_table = pd.pivot_table(df, values='Продажи', index='Город', columns='Год', aggfunc=sum)
print(pivot_table)
Результат:
Год 2019 2020 2021
Город
Москва 1000.0 1500.0 1800.0
Санкт-Петербург 2000.0 2500.0 NaN
В приведенном выше примере у нас есть данные о продажах товаров в разных городах за несколько лет. Мы хотим узнать сумму продаж по годам и городам. С помощью функции pivot_table мы передаем исходный DataFrame df, указываем, что значениями должны быть столбец «Продажи», строки должны быть сгруппированы по столбцу «Город», а столбцы - по столбцу «Год». Мы также указываем, что для агрегации данных нужно использовать сумму.
Как видно из результата, функция pivot_table создает новую таблицу, в которой значения сгруппированы по годам и городам. Отсутствующие значения обозначены как NaN.
Функция pivot_table также предоставляет дополнительные возможности для настройки результатов. Мы можем указать несколько столбцов для группировки, использовать разные агрегирующие функции, применять фильтры и многое другое. Более подробную информацию о различных параметрах функции можно найти в документации pandas.
Таким образом, функция pivot_table в библиотеке pandas является мощным инструментом для анализа данных и создания сводных таблиц. Она позволяет увидеть общую картину и сделать выводы на основе сгруппированных данных.