Как выбрать числовые столбцы в Pandas? 🔢

Чтобы выбрать числовые столбцы в pandas, вы можете использовать метод select_dtypes. Этот метод позволяет выбирать столбцы с определенным типом данных. В данном случае, вы можете использовать значение 'number' в качестве аргумента.

import pandas as pd

# Создаем DataFrame для примера
data = {
    'имя': ['John', 'Anna', 'Peter'],
    'возраст': [25, 30, 35],
    'рост': [170.5, 165.2, 180.7],
    'зарплата': [50000, 60000, 70000]
}

df = pd.DataFrame(data)

# Выбираем числовые столбцы
numeric_columns = df.select_dtypes('number')
print(numeric_columns)

Выполнение этого кода выведет только числовые столбцы из DataFrame.

Детальный ответ

Как выбрать числовые столбцы в Pandas

При работе с данными в библиотеке Pandas важно уметь выбирать нужные столбцы для анализа. Особенно часто возникает потребность в выборе только числовых столбцов для проведения статистических расчетов или визуализации данных.

В Pandas для выбора столбцов можно использовать операторы доступа к данным [], loc и iloc. Рассмотрим каждый из них.

1. Оператор доступа []

Оператор доступа [] позволяет выбирать столбцы по их названию или меткам. Для выбора числовых столбцов можно использовать различные методы:

import pandas as pd

# Создание DataFrame с данными
data = {'Имя': ['Алексей', 'Мария', 'Иван'],
        'Возраст': [25, 32, 28],
        'Рост': [175, 160, 180],
        'Вес': [70, 55, 85]}

df = pd.DataFrame(data)

# Выбор числовых столбцов
numeric_columns = df.select_dtypes(include='number')
print(numeric_columns)

В данном примере мы создали DataFrame с данными, в котором есть столбцы 'Имя', 'Возраст', 'Рост' и 'Вес'. Метод select_dtypes с параметром include='number' выберет только числовые столбцы (в данном случае 'Возраст', 'Рост' и 'Вес').

2. Метод loc

Метод loc позволяет выбирать столбцы по их названию или меткам. Чтобы выбрать числовые столбцы, можно использовать следующий код:

# Выбор числовых столбцов с помощью метода loc
numeric_columns = df.loc[:, df.dtypes != 'object']
print(numeric_columns)

В этом примере мы используем метод loc для выбора всех столбцов (:) и фильтруем только числовые столбцы с помощью условия df.dtypes != 'object'.

3. Метод iloc

Метод iloc позволяет выбирать столбцы по их числовому индексу. Чтобы выбрать числовые столбцы, можно воспользоваться следующим кодом:

# Выбор числовых столбцов с помощью метода iloc
numeric_columns = df.iloc[:, df.dtypes != 'object']
print(numeric_columns)

Аналогично методу loc, мы используем метод iloc для выбора всех столбцов (:) и фильтруем только числовые столбцы с помощью условия df.dtypes != 'object'.

4. Комбинированный способ

Если вам нужно выбрать несколько конкретных числовых столбцов, можно комбинировать различные методы доступа. Например:

# Выбор конкретных числовых столбцов
numeric_columns = df[['Возраст', 'Рост', 'Вес']]
print(numeric_columns)

В приведенном примере мы используем оператор доступа [] и передаем список названий нужных столбцов для выбора.

Заключение

В этой статье мы рассмотрели различные способы выбора числовых столбцов в Pandas. Оператор доступа [], методы loc и iloc позволяют легко выбирать нужные столбцы с использованием различных критериев. Используйте эти методы в своих проектах для более эффективного анализа данных.

Видео по теме

Pandas Базовый №3. Отбор строк и столбцов, Размерность, Импорт CSV

Pandas Базовый №4. Операции со столбцами DataFrame

Фильтрация данных в Pandas | Анатолий Карпов | karpov.courses

Похожие статьи:

Как выбрать числовые столбцы в Pandas? 🔢

Как добавить новый столбец в pandas dataframe? 📊💡