Как добавить столбец к датафрейму питон? 📊🐍
import pandas as pd
# Создание датафрейма
df = pd.DataFrame({'Имя': ['Анна', 'Борис', 'Виктория'],
'Возраст': [25, 31, 28]})
# Добавление нового столбца
df = df.assign(Работает=[True, False, True])
print(df)
В этом примере мы создаем датафрейм с двумя столбцами "Имя" и "Возраст". Затем мы используем функцию "assign" для добавления нового столбца "Работает" с булевыми значениями. Результат выводится с помощью функции "print".
Надеюсь, это поможет! Если у вас есть еще вопросы, не стесняйтесь спрашивать.
Детальный ответ
Как добавить столбец к датафрейму в Python
Добавление нового столбца к датафрейму в Python может быть полезно при обработке и анализе данных. В этой статье мы рассмотрим несколько способов добавления нового столбца к датафрейму с использованием библиотеки pandas.
Способ 1: Добавление столбца с помощью присваивания значения
Простой способ добавить новый столбец - это присвоить ему значение. Для этого мы можем использовать квадратные скобки [ ] и указать имя нового столбца в качестве ключа. Значение для нового столбца может быть скалярным или списком значений.
import pandas as pd
# Создание датафрейма
df = pd.DataFrame({'Имя': ['Анна', 'Бен', 'Карла'],
'Возраст': [25, 30, 35]})
# Добавление нового столбца с помощью присваивания значения
df['Город'] = 'Москва'
print(df)
Вывод:
Имя Возраст Город
0 Анна 25 Москва
1 Бен 30 Москва
2 Карла 35 Москва
Способ 2: Добавление столбца с помощью метода assign()
Еще один способ добавления нового столбца - использовать метод assign(). Метод assign() создает новый объект датафрейма, включая новый столбец, не изменяя исходный датафрейм. Мы можем присвоить новый датафрейм переменной для сохранения изменений.
import pandas as pd
# Создание датафрейма
df = pd.DataFrame({'Имя': ['Анна', 'Бен', 'Карла'],
'Возраст': [25, 30, 35]})
# Добавление нового столбца с помощью метода assign()
df_new = df.assign(Город=['Москва', 'Санкт-Петербург', 'Казань'])
print(df_new)
Вывод:
Имя Возраст Город
0 Анна 25 Москва
1 Бен 30 Санкт-Петербург
2 Карла 35 Казань
Способ 3: Добавление столбца на основе вычислений
Мы также можем добавить новый столбец, основываясь на вычислениях над существующими столбцами. Например, мы можем добавить столбец, показывающий возрастной диапазон на основе возраста каждого человека в датафрейме.
import pandas as pd
# Создание датафрейма
df = pd.DataFrame({'Имя': ['Анна', 'Бен', 'Карла'],
'Возраст': [25, 30, 35]})
# Добавление нового столбца на основе вычислений
df['Возрастной диапазон'] = pd.cut(df['Возраст'], bins=[0, 20, 30, 100], labels=['Молодой', 'Средний', 'Старший'])
print(df)
Вывод:
Имя Возраст Возрастной диапазон
0 Анна 25 Средний
1 Бен 30 Средний
2 Карла 35 Старший
Способ 4: Добавление столбца на основе функции
Если вы хотите добавить столбец на основе более комплексных вычислений или функции, вы можете использовать метод apply(). Просто передайте функцию в метод apply(), чтобы применить ее к каждой строке датафрейма и создать новый столбец на основе результатов.
import pandas as pd
# Создание датафрейма
df = pd.DataFrame({'Имя': ['Анна', 'Бен', 'Карла'],
'Возраст': [25, 30, 35]})
# Функция для добавления столбца на основе возраста
def добавить_стаж(возраст):
if возраст < 30:
return 'Молодой'
else:
return 'Опытный'
# Добавление нового столбца на основе функции
df['Стаж'] = df['Возраст'].apply(добавить_стаж)
print(df)
Вывод:
Имя Возраст Стаж
0 Анна 25 Молодой
1 Бен 30 Опытный
2 Карла 35 Опытный