pandas: какие функции можно использовать в aggfunc для pivot table?

В функцию aggfunc в pandas для создания сводной таблицы можно передавать различные агрегирующие функции:

1. sum - сумма значений в столбце.

df.pivot_table(index='column_name', values='column_to_aggregate', aggfunc='sum')

2. mean - среднее значение в столбце.

df.pivot_table(index='column_name', values='column_to_aggregate', aggfunc='mean')

3. count - количество непустых значений в столбце.

df.pivot_table(index='column_name', values='column_to_aggregate', aggfunc='count')

4. max - максимальное значение в столбце.

df.pivot_table(index='column_name', values='column_to_aggregate', aggfunc='max')

5. min - минимальное значение в столбце.

df.pivot_table(index='column_name', values='column_to_aggregate', aggfunc='min')

6. median - медиана значений в столбце.

df.pivot_table(index='column_name', values='column_to_aggregate', aggfunc='median')

7. std - стандартное отклонение значений в столбце.

df.pivot_table(index='column_name', values='column_to_aggregate', aggfunc='std')

8. var - дисперсия значений в столбце.

df.pivot_table(index='column_name', values='column_to_aggregate', aggfunc='var')

9. first - первое значение в столбце.

df.pivot_table(index='column_name', values='column_to_aggregate', aggfunc='first')

10. last - последнее значение в столбце.

df.pivot_table(index='column_name', values='column_to_aggregate', aggfunc='last')

Детальный ответ

Функции, которые можно использовать в aggfunc для сводных таблиц в Pandas

Сводные таблицы являются мощным инструментом для анализа и агрегации данных. В Pandas можно использовать различные функции в aggfunc, чтобы вычислить значения для сводной таблицы. Давайте рассмотрим некоторые из них.

1. Сумма (Sum)

Функция sum используется для вычисления суммы значений в столбцах сводной таблицы. Она применяется, когда нам нужно найти сумму числовых значений.


import pandas as pd

# Создание сводной таблицы с использованием функции sum
pivot_table = pd.pivot_table(data, values='Value', index='Index', columns='Column', aggfunc=sum)

2. Среднее (Mean)

Функция mean используется для вычисления среднего значения в столбцах сводной таблицы. Она полезна, когда мы хотим найти среднее значение числовых данных.


import pandas as pd

# Создание сводной таблицы с использованием функции mean
pivot_table = pd.pivot_table(data, values='Value', index='Index', columns='Column', aggfunc='mean')

3. Количество (Count)

Функция count используется для подсчета количества значений в столбцах сводной таблицы. Она применяется, когда мы хотим узнать общее количество значений в каждой группе или категории.


import pandas as pd

# Создание сводной таблицы с использованием функции count
pivot_table = pd.pivot_table(data, values='Value', index='Index', columns='Column', aggfunc='count')

4. Минимум (Min)

Функция min используется для нахождения минимального значения в столбцах сводной таблицы. Она полезна, когда мы хотим найти наименьшее значение из числовых данных.


import pandas as pd

# Создание сводной таблицы с использованием функции min
pivot_table = pd.pivot_table(data, values='Value', index='Index', columns='Column', aggfunc='min')

5. Максимум (Max)

Функция max используется для нахождения максимального значения в столбцах сводной таблицы. Она применяется, когда мы хотим найти наибольшее значение из числовых данных.


import pandas as pd

# Создание сводной таблицы с использованием функции max
pivot_table = pd.pivot_table(data, values='Value', index='Index', columns='Column', aggfunc='max')

6. Медиана (Median)

Функция median используется для нахождения медианного значения в столбцах сводной таблицы. Она полезна для выявления центральной тенденции в числовых данных.


import pandas as pd

# Создание сводной таблицы с использованием функции median
pivot_table = pd.pivot_table(data, values='Value', index='Index', columns='Column', aggfunc='median')

7. Стандартное отклонение (Standard Deviation)

Функция std используется для вычисления стандартного отклонения значений в столбцах сводной таблицы. Она позволяет оценить разброс данных.


import pandas as pd

# Создание сводной таблицы с использованием функции std
pivot_table = pd.pivot_table(data, values='Value', index='Index', columns='Column', aggfunc='std')

8. Вариация (Variance)

Функция var используется для вычисления дисперсии значений в столбцах сводной таблицы. Она позволяет измерить изменчивость данных.


import pandas as pd

# Создание сводной таблицы с использованием функции var
pivot_table = pd.pivot_table(data, values='Value', index='Index', columns='Column', aggfunc='var')

Это лишь некоторые из функций, которые можно использовать в aggfunc для сводных таблиц в Pandas. Вы можете выбрать подходящую функцию в зависимости от аналитических требований вашего проекта. Удачи в работе со сводными таблицами!

Видео по теме

Сводные таблицы в pandas

PYTHON : Python Pandas : pivot table with aggfunc = count unique distinct

pd.pivot_table, pd.groupby, pd.crosstab | Группировки | БИБЛИОТЕКА PANDAS 4 | МАШИННОЕ ОБУЧЕНИЕ

Похожие статьи:

pandas: какие функции можно использовать в aggfunc для pivot table?