Как отсортировать данные с использованием Pandas? 🚀 7 простых шагов!

Для сортировки данных в библиотеке Pandas можно использовать метод sort_values(). Этот метод позволяет отсортировать данные по одному или нескольким столбцам.

Пример сортировки данных по столбцу 'имя':

import pandas as pd

# Создание DataFrame
data = {'имя': ['Анна', 'Борис', 'Карина'],
        'возраст': [25, 30, 28],
        'зарплата': [50000, 70000, 60000]}

df = pd.DataFrame(data)

# Сортировка по столбцу 'имя'
df_sorted = df.sort_values('имя')

print(df_sorted)

Результат:

     имя  возраст  зарплата
0   Анна       25     50000
1  Борис       30     70000
2  Карина      28     60000

Детальный ответ

Как отсортировать pandas

Сортировка данных является важной задачей в анализе данных с использованием библиотеки pandas. Сортировка помогает нам организовать данные в нужном порядке, чтобы проанализировать их или представить более удобно. В этой статье мы рассмотрим различные способы сортировки данных в pandas.

Сортировка по значениям в столбце

Один из самых распространенных способов сортировки данных - это сортировка по значениям в определенном столбце. Для этого мы можем использовать метод sort_values(). Давайте рассмотрим пример:


import pandas as pd

# Создание DataFrame
data = {'Имя': ['Анна', 'Мария', 'Иван', 'Олег'],
        'Возраст': [25, 32, 18, 40],
        'Зарплата': [50000, 70000, 40000, 60000]}

df = pd.DataFrame(data)

# Сортировка по столбцу 'Возраст' в порядке возрастания
df_sorted = df.sort_values('Возраст')

print(df_sorted)
    

В результате выполнения кода мы получаем отсортированный DataFrame по столбцу 'Возраст' в порядке возрастания:


    Имя  Возраст  Зарплата
2   Иван       18     40000
0   Анна       25     50000
1  Мария       32     70000
3   Олег       40     60000
    

Сортировка в порядке убывания

Чтобы отсортировать данные в порядке убывания, нам нужно передать аргумент ascending=False в метод sort_values(). Продолжим с предыдущим примером:


# Сортировка по столбцу 'Возраст' в порядке убывания
df_sorted_descending = df.sort_values('Возраст', ascending=False)

print(df_sorted_descending)
    

Теперь DataFrame будет отсортирован по столбцу 'Возраст' в порядке убывания:


    Имя  Возраст  Зарплата
3   Олег       40     60000
1  Мария       32     70000
0   Анна       25     50000
2  Иван       18     40000
    

Сортировка по нескольким столбцам

В pandas также можно сортировать данные по нескольким столбцам. Для этого мы должны передать список столбцов в метод sort_values(). Рассмотрим пример:


# Сортировка по столбцу 'Возраст' в порядке возрастания и затем по столбцу 'Зарплата' в порядке убывания
df_sorted_multiple = df.sort_values(['Возраст', 'Зарплата'], ascending=[True, False])

print(df_sorted_multiple)
    

Результат сортировки будет следующим:


    Имя  Возраст  Зарплата
2  Иван       18     40000
0  Анна       25     50000
1  Мария       32     70000
3  Олег       40     60000
    

Сортировка по индексу

Как альтернативу сортировке по значениям столбцов, мы также можем отсортировать данные по индексу с помощью метода sort_index(). Пример:


# Сортировка по индексу
df_sorted_index = df.sort_index()

print(df_sorted_index)
    

Результат сортировки по индексу будет таким же, как при создании исходного DataFrame:


    Имя  Возраст  Зарплата
0  Анна       25     50000
1  Мария       32     70000
2  Иван       18     40000
3  Олег       40     60000
    

Заключение

В этой статье мы рассмотрели различные способы сортировки данных в pandas. Мы узнали, как отсортировать данные по значениям в определенном столбце, как изменить порядок сортировки на убывающий и как сортировать по нескольким столбцам. Также мы рассмотрели сортировку по индексу.

Видео по теме

Как отсортировать файл в Python Pandas Dataframe?

Фильтрация данных в Pandas | Анатолий Карпов | karpov.courses

Pandas - разбор всех основных возможностей на реальном датасете

Похожие статьи:

Как отсортировать данные с использованием Pandas? 🚀 7 простых шагов!