Как выбрать числовые столбцы в Pandas? 🔢
Чтобы выбрать числовые столбцы в pandas, вы можете использовать метод select_dtypes
. Этот метод позволяет выбирать столбцы с определенным типом данных. В данном случае, вы можете использовать значение 'number'
в качестве аргумента.
import pandas as pd
# Создаем DataFrame для примера
data = {
'имя': ['John', 'Anna', 'Peter'],
'возраст': [25, 30, 35],
'рост': [170.5, 165.2, 180.7],
'зарплата': [50000, 60000, 70000]
}
df = pd.DataFrame(data)
# Выбираем числовые столбцы
numeric_columns = df.select_dtypes('number')
print(numeric_columns)
Выполнение этого кода выведет только числовые столбцы из DataFrame.
Детальный ответ
Как выбрать числовые столбцы в Pandas
При работе с данными в библиотеке Pandas важно уметь выбирать нужные столбцы для анализа. Особенно часто возникает потребность в выборе только числовых столбцов для проведения статистических расчетов или визуализации данных.
В Pandas для выбора столбцов можно использовать операторы доступа к данным [], loc и iloc. Рассмотрим каждый из них.
1. Оператор доступа []
Оператор доступа [] позволяет выбирать столбцы по их названию или меткам. Для выбора числовых столбцов можно использовать различные методы:
import pandas as pd
# Создание DataFrame с данными
data = {'Имя': ['Алексей', 'Мария', 'Иван'],
'Возраст': [25, 32, 28],
'Рост': [175, 160, 180],
'Вес': [70, 55, 85]}
df = pd.DataFrame(data)
# Выбор числовых столбцов
numeric_columns = df.select_dtypes(include='number')
print(numeric_columns)
В данном примере мы создали DataFrame с данными, в котором есть столбцы 'Имя', 'Возраст', 'Рост' и 'Вес'. Метод select_dtypes с параметром include='number' выберет только числовые столбцы (в данном случае 'Возраст', 'Рост' и 'Вес').
2. Метод loc
Метод loc позволяет выбирать столбцы по их названию или меткам. Чтобы выбрать числовые столбцы, можно использовать следующий код:
# Выбор числовых столбцов с помощью метода loc
numeric_columns = df.loc[:, df.dtypes != 'object']
print(numeric_columns)
В этом примере мы используем метод loc для выбора всех столбцов (:) и фильтруем только числовые столбцы с помощью условия df.dtypes != 'object'.
3. Метод iloc
Метод iloc позволяет выбирать столбцы по их числовому индексу. Чтобы выбрать числовые столбцы, можно воспользоваться следующим кодом:
# Выбор числовых столбцов с помощью метода iloc
numeric_columns = df.iloc[:, df.dtypes != 'object']
print(numeric_columns)
Аналогично методу loc, мы используем метод iloc для выбора всех столбцов (:) и фильтруем только числовые столбцы с помощью условия df.dtypes != 'object'.
4. Комбинированный способ
Если вам нужно выбрать несколько конкретных числовых столбцов, можно комбинировать различные методы доступа. Например:
# Выбор конкретных числовых столбцов
numeric_columns = df[['Возраст', 'Рост', 'Вес']]
print(numeric_columns)
В приведенном примере мы используем оператор доступа [] и передаем список названий нужных столбцов для выбора.
Заключение
В этой статье мы рассмотрели различные способы выбора числовых столбцов в Pandas. Оператор доступа [], методы loc и iloc позволяют легко выбирать нужные столбцы с использованием различных критериев. Используйте эти методы в своих проектах для более эффективного анализа данных.