Как изменить тип данных в Python DataFrame: легкий способ с помощью примеров 🐍
import pandas as pd
# Создание DataFrame
df = pd.DataFrame({'column_name': [1.0, 2.0, 3.0]})
# Изменение типа столбца на int
df['column_name'] = df['column_name'].astype(int)
В этом примере мы сначала создаем DataFrame с колонкой 'column_name', содержащей значения с плавающей запятой. Затем мы используем метод .astype(int), чтобы изменить тип столбца на целочисленный.
Детальный ответ
Как изменить тип данных в Python DataFrame
Python DataFrame - это удобный инструмент для работы с табличными данными. Иногда может возникнуть необходимость изменить типы данных в столбцах DataFrame. В этой статье мы рассмотрим несколько способов изменения типа данных.
1. Метод astype()
Первый способ изменить тип данных в DataFrame - использовать метод astype()
. Этот метод позволяет привести значения столбца к определенному типу данных.
import pandas as pd
# Создаем DataFrame
data = {'Имя': ['Анна', 'Борис', 'Катя'],
'Возраст': ['25', '30', '35']}
df = pd.DataFrame(data)
# Изменяем тип данных столбца Возраст на int
df['Возраст'] = df['Возраст'].astype(int)
print(df.dtypes)
В этом примере мы создаем DataFrame с двумя столбцами - "Имя" и "Возраст", где значения столбца "Возраст" заданы в виде строк. Затем мы используем astype(int)
, чтобы привести значения столбца "Возраст" к типу данных int. В результате мы получаем столбец "Возраст" с типом данных int.
2. Функция to_numeric()
Еще один способ изменить тип данных в DataFrame - использовать функцию to_numeric()
. Эта функция позволяет преобразовать значения столбца в числовой тип данных.
import pandas as pd
# Создаем DataFrame
data = {'Имя': ['Анна', 'Борис', 'Катя'],
'Рейтинг': ['4.5', '3.2', '2.8']}
df = pd.DataFrame(data)
# Изменяем тип данных столбца Рейтинг на float
df['Рейтинг'] = pd.to_numeric(df['Рейтинг'], downcast='float')
print(df.dtypes)
В этом примере мы создаем DataFrame с двумя столбцами - "Имя" и "Рейтинг", где значения столбца "Рейтинг" заданы в виде строк. Затем мы используем функцию to_numeric()
и указываем параметр downcast='float'
, чтобы привести значения столбца "Рейтинг" к типу данных float. В результате мы получаем столбец "Рейтинг" с типом данных float.
3. Метод apply()
Третий способ изменить тип данных в DataFrame - использовать метод apply()
совместно с функцией преобразования.
import pandas as pd
# Создаем DataFrame
data = {'Имя': ['Анна', 'Борис', 'Катя'],
'Рост': ['165', '175', '180']}
df = pd.DataFrame(data)
# Изменяем тип данных столбца Рост на int
df['Рост'] = df['Рост'].apply(int)
print(df.dtypes)
В этом примере мы создаем DataFrame с двумя столбцами - "Имя" и "Рост", где значения столбца "Рост" заданы в виде строк. Затем мы используем метод apply()
с функцией int
, чтобы привести значения столбца "Рост" к типу данных int. В результате мы получаем столбец "Рост" с типом данных int.
Заключение
Изменение типов данных в Python DataFrame позволяет правильно интерпретировать значения и проводить различные операции над данными. Мы рассмотрели три способа изменения типа данных - с использованием метода astype()
, функции to_numeric()
и метода apply()
. Выберите подходящий способ в зависимости от данной задачи и требований к типам данных.