Как разделить pandas dataframe: руководство по шагам 🐼💻
Как разделить pandas dataframe?
Вы можете использовать метод split() вместе со спецификацией оси, по которой нужно разделить датафрейм. Ниже приведен пример:
import pandas as pd
# Создание датафрейма
df = pd.DataFrame({'Имя': ['Анна', 'Боб', 'Карл'],
'Возраст': [25, 30, 35],
'Город': ['Москва', 'Санкт-Петербург', 'Киев']})
# Разделение по оси 1 (столбцы)
df_split = df.split(axis=1)
print(df_split)
Вышеуказанный код разделит датафрейм по столбцам. Вы можете также использовать axis=0 для разделения по строкам.
Детальный ответ
Как разделить фрейм данных Pandas
Фрейм данных Pandas (Pandas DataFrame) – это мощная структура данных, которая позволяет работать с табличными данными. Иногда нам может потребоваться разделить этот фрейм данных на несколько частей с целью выполнения определенных операций или упрощения анализа данных. В этой статье мы рассмотрим несколько способов разделения фрейма данных Pandas.
Метод iloc
Метод iloc используется для разделения фрейма данных Pandas на основе позиций строк и столбцов. Мы можем указать диапазоны позиций строк и столбцов, чтобы выбрать только нужные части фрейма данных. Вот пример:
import pandas as pd
# Создаем фрейм данных
data = {'Name': ['John', 'Jane', 'Mike', 'Emily', 'David'],
'Age': [25, 30, 35, 40, 45],
'City': ['New York', 'London', 'Paris', 'Tokyo', 'Sydney']}
df = pd.DataFrame(data)
# Разделяем фрейм данных на основе позиций строк и столбцов
subset = df.iloc[1:3, 0:2]
print(subset)
В этом примере мы разделили фрейм данных и выбрали строки с позициями от 1 до 2 и столбцы с позициями от 0 до 1. Результатом будет новый фрейм данных, содержащий только выбранные строки и столбцы.
Метод loc
Метод loc позволяет разделить фрейм данных Pandas на основе меток строк и столбцов. Мы можем указать метки строк и столбцов, чтобы выбрать только нужные части фрейма данных. Вот пример:
import pandas as pd
# Создаем фрейм данных
data = {'Name': ['John', 'Jane', 'Mike', 'Emily', 'David'],
'Age': [25, 30, 35, 40, 45],
'City': ['New York', 'London', 'Paris', 'Tokyo', 'Sydney']}
df = pd.DataFrame(data)
# Разделяем фрейм данных на основе меток строк и столбцов
subset = df.loc[:, 'Name':'Age']
print(subset)
В этом примере мы разделили фрейм данных и выбрали все строки и столбцы с метками от 'Name' до 'Age'. Результатом будет новый фрейм данных, содержащий только выбранные столбцы.
Условное разделение
Мы также можем разделить фрейм данных на основе определенного условия. Например, мы можем разделить фрейм данных на две части – одну, содержащую строки, где возраст больше 30, и другую – строки, где возраст меньше или равен 30. Вот пример:
import pandas as pd
# Создаем фрейм данных
data = {'Name': ['John', 'Jane', 'Mike', 'Emily', 'David'],
'Age': [25, 30, 35, 40, 45],
'City': ['New York', 'London', 'Paris', 'Tokyo', 'Sydney']}
df = pd.DataFrame(data)
# Разделяем фрейм данных на основе условия
subset1 = df[df['Age'] > 30]
subset2 = df[df['Age'] <= 30]
print("Старше 30:")
print(subset1)
print("Младше или равно 30:")
print(subset2)
В этом примере мы использовали условие df['Age'] > 30 для разделения фрейма данных на две части. Результатом будет два новых фрейма данных – один с людьми, возраст которых больше 30, и другой с людьми, возраст которых меньше или равен 30.
Разделение по значению
Если мы хотим разделить фрейм данных на основе конкретного значения в столбце, мы можем использовать методы equals() или isin(). Например, мы можем разделить фрейм данных на две части – одну, содержащую строки с городом 'New York', и другую – строки с другими городами. Вот пример:
import pandas as pd
# Создаем фрейм данных
data = {'Name': ['John', 'Jane', 'Mike', 'Emily', 'David'],
'Age': [25, 30, 35, 40, 45],
'City': ['New York', 'London', 'Paris', 'Tokyo', 'Sydney']}
df = pd.DataFrame(data)
# Разделяем фрейм данных на основе значения столбца
subset1 = df[df['City'].equals('New York')]
subset2 = df[~df['City'].equals('New York')]
print("Город New York:")
print(subset1)
print("Другие города:")
print(subset2)
В этом примере мы использовали методы equals() и isin() для разделения фрейма данных на две части на основе значения столбца 'City'. Результатом будет два новых фрейма данных – один с людьми из города 'New York' и другой с людьми из других городов.
Вывод
Разделение фрейма данных Pandas может быть полезным инструментом при работе с табличными данными. Мы рассмотрели несколько способов разделения фрейма данных – с использованием методов iloc, loc, условного разделения и разделения по значению. При помощи этих методов вы можете выбирать только нужные части фрейма данных, упрощая анализ и выполнение операций над данными.