Как добавить столбец в dataframe pandas: простой способ с использованием эмодзи и подробные инструкции
Для добавления столбца в DataFrame в библиотеке pandas, вы можете использовать метод assign() или обратиться к столбцу, как к атрибуту объекта DataFrame.
import pandas as pd
# Создание DataFrame
df = pd.DataFrame({'Имя': ['Алексей', 'Екатерина', 'Сергей'],
'Возраст': [25, 28, 32]})
# Использование метода assign()
df_with_new_column = df.assign(Работа=['Инженер', 'Учитель', 'Дизайнер'])
# Или обращение к столбцу, как к атрибуту
df['Зарплата'] = [50000, 60000, 70000]
В результате, вы получите DataFrame с новым столбцом.
Детальный ответ
Как добавить столбец в датафрейм с помощью библиотеки Pandas
Иногда при работе с таблицами, нам может понадобиться добавить новый столбец для хранения дополнительных данных или вычисленных значений. Библиотека Pandas предоставляет нам простые и эффективные способы добавления столбцов в датафреймы.
1. Создание нового столбца с помощью присваивания значений
Простейший способ добавления нового столбца - это присваивание значений через индексацию. Для этого мы можем использовать существующий столбец или выражение, а затем присвоить результат новому столбцу. Вот пример:
import pandas as pd
# Создаем датафрейм
df = pd.DataFrame({'Name': ['John', 'Alice', 'Bob'],
'Age': [25, 30, 35]})
# Добавляем новый столбец
df['Salary'] = [50000, 60000, 70000]
print(df)
В данном примере мы создаем датафрейм с двумя столбцами - "Name" и "Age". Затем мы создаем новый столбец "Salary" и присваиваем ему значения `[50000, 60000, 70000]`. В результате мы получаем следующую таблицу:
Name Age Salary
0 John 25 50000
1 Alice 30 60000
2 Bob 35 70000
2. Добавление столбца на основе других столбцов
Еще один распространенный сценарий - это добавление столбца на основе значений других столбцов. Можно использовать арифметические операции или функции библиотеки Pandas для вычисления новых значений для столбца. Рассмотрим пример:
# Создаем датафрейм
df = pd.DataFrame({'Name': ['John', 'Alice', 'Bob'],
'Age': [25, 30, 35]})
# Добавляем новый столбец
df['YearOfBirth'] = 2022 - df['Age']
print(df)
В этом примере мы создаем новый столбец "YearOfBirth" на основе столбца "Age". Мы вычитаем значения столбца "Age" из 2022 и присваиваем результат новому столбцу. Получаем следующую таблицу:
Name Age YearOfBirth
0 John 25 1997
1 Alice 30 1992
2 Bob 35 1987
3. Добавление столбца с помощью функции apply
Если нам требуется более сложная логика для вычисления значений нового столбца, мы можем использовать функцию `apply`. Функция `apply` принимает в качестве аргумента функцию, которая будет применяться к каждой строке или столбцу датафрейма. Ниже приведен пример:
# Создаем датафрейм
df = pd.DataFrame({'Name': ['John', 'Alice', 'Bob'],
'Age': [25, 30, 35]})
# Функция для вычисления квадрата возраста
def calculate_square(age):
return age ** 2
# Добавляем новый столбец с помощью функции apply
df['AgeSquared'] = df['Age'].apply(calculate_square)
print(df)
В примере выше мы создаем новый столбец "AgeSquared" с помощью функции `calculate_square`, которая вычисляет квадрат возраста. Результат применения функции к столбцу "Age" присваивается новому столбцу "AgeSquared". В результате получается следующая таблица:
Name Age AgeSquared
0 John 25 625
1 Alice 30 900
2 Bob 35 1225
Вот несколько способов добавления столбцов в датафрейм с помощью библиотеки Pandas. Вы можете использовать эти методы для решения разнообразных задач и работать с данными более эффективно.