Как извлечь столбцы из таблицы данных в pandas

Чтобы извлечь столбцы из DataFrame в Pandas, вы можете использовать операторы доступа по столбцам или методы фильтрации.

Если вы хотите извлечь один столбец, вы можете использовать оператор доступа по столбцу с помощью квадратных скобок и имени столбца:

df['имя_столбца']

Если вам нужно извлечь несколько столбцов, вы можете передать список имен столбцов в квадратные скобки:

df[['столбец_1', 'столбец_2']]

Вы также можете использовать метод .loc для доступа к столбцам по имени:

df.loc[:, 'имя_столбца']

Если вы хотите выбрать столбцы по их позиции, вы можете использовать метод .iloc и передать индексы столбцов:

df.iloc[:, [0, 2]]

Обратите внимание, что индексация начинается с 0.

Детальный ответ

Как извлечь столбцы из DataFrame в библиотеке Pandas

В библиотеке Pandas, которая является одной из самых популярных библиотек для анализа данных в Python, существует множество способов для извлечения столбцов из DataFrame. В этой статье мы подробно рассмотрим несколько таких способов вместе с примерами кода.

1) Использование оператора доступа к столбцам

Простейший способ извлечь столбец из DataFrame - использовать оператор доступа к столбцам ([]). Для этого указывается имя столбца, к которому вы хотите получить доступ.


import pandas as pd

# Создаем DataFrame
data = {
    'Name': ['John', 'Emma', 'Mike'],
    'Age': [25, 28, 32],
    'City': ['New York', 'London', 'Paris']
}

df = pd.DataFrame(data)

# Извлекаем столбец 'Name'
name_column = df['Name']

print(name_column)
    

В этом примере мы создаем DataFrame с тремя столбцами ('Name', 'Age', 'City'). Затем мы используем оператор доступа к столбцам ([]), чтобы извлечь столбец 'Name'. Результатом будет Series, содержащий значения из столбца 'Name'.

2) Использование метода loc

Метод loc позволяет извлекать столбцы (и строки) из DataFrame, используя их имена.


import pandas as pd

# Создаем DataFrame
data = {
    'Name': ['John', 'Emma', 'Mike'],
    'Age': [25, 28, 32],
    'City': ['New York', 'London', 'Paris']
}

df = pd.DataFrame(data)

# Извлекаем столбец 'Age'
age_column = df.loc[:, 'Age']

print(age_column)
    

В этом примере мы используем метод loc с указанием двоеточия (:) в первой позиции, чтобы указать, что нам нужны все строки. Затем мы указываем имя столбца 'Age', к которому хотим получить доступ. Результатом будет Series, содержащий значения из столбца 'Age'.

3) Использование метода iloc

Метод iloc позволяет извлекать столбцы (и строки) из DataFrame, используя их позиции.


import pandas as pd

# Создаем DataFrame
data = {
    'Name': ['John', 'Emma', 'Mike'],
    'Age': [25, 28, 32],
    'City': ['New York', 'London', 'Paris']
}

df = pd.DataFrame(data)

# Извлекаем первый столбец
first_column = df.iloc[:, 0]

print(first_column)
    

В этом примере мы используем метод iloc с указанием двоеточия (:) в первой позиции, чтобы указать, что нам нужны все строки. Затем мы указываем позицию столбца (отсчет начинается с 0), который хотим извлечь. В данном случае мы извлекаем первый столбец 'Name'. Результатом будет Series, содержащий значения из первого столбца.

4) Использование метода filter

Метод filter позволяет извлекать столбцы из DataFrame, исходя из их имени. Мы можем указывать условия для отбора нужных столбцов.


import pandas as pd

# Создаем DataFrame
data = {
    'Name': ['John', 'Emma', 'Mike'],
    'Age': [25, 28, 32],
    'City': ['New York', 'London', 'Paris']
}

df = pd.DataFrame(data)

# Извлекаем столбцы, содержащие 'e' в имени
e_columns = df.filter(like='e')

print(e_columns)
    

В этом примере мы используем метод filter с параметром like, чтобы указать, что нам нужны столбцы, содержащие 'e' в имени. Результатом будет DataFrame, содержащий все столбцы, которые соответствуют заданному условию.

5) Использование оператора loc в сочетании с условием

Мы также можем использовать оператор loc в сочетании с условием для извлечения столбцов, удовлетворяющих определенным условиям.


import pandas as pd

# Создаем DataFrame
data = {
    'Name': ['John', 'Emma', 'Mike'],
    'Age': [25, 28, 32],
    'City': ['New York', 'London', 'Paris']
}

df = pd.DataFrame(data)

# Извлекаем столбец 'Name' для строк, где возраст больше 25
name_column = df.loc[df['Age'] > 25, 'Name']

print(name_column)
    

В этом примере мы используем оператор loc, чтобы указать условие (df['Age'] > 25) для выбора строк, удовлетворяющих данному условию. Затем мы указываем столбец 'Name', к которому хотим получить доступ. Результатом будет Series, содержащий значения столбца 'Name' для строк, где возраст больше 25.

6) Использование метода get

Метод get позволяет извлекать столбцы из DataFrame, используя их имя. В случае, если столбец не существует, метод возвращает значение по умолчанию.


import pandas as pd

# Создаем DataFrame
data = {
    'Name': ['John', 'Emma', 'Mike'],
    'Age': [25, 28, 32],
    'City': ['New York', 'London', 'Paris']
}

df = pd.DataFrame(data)

# Извлекаем столбец 'Surname' с значением по умолчанию 'Unknown'
surname_column = df.get('Surname', default='Unknown')

print(surname_column)
    

В этом примере мы используем метод get с указанием имени столбца 'Surname' и значением по умолчанию 'Unknown'. Если столбец 'Surname' существует, метод возвращает его значения. В противном случае, он возвращает значение по умолчанию 'Unknown'.

7) Использование метода select_dtypes

Метод select_dtypes позволяет извлекать столбцы по их типу данных.


import pandas as pd

# Создаем DataFrame
data = {
    'Name': ['John', 'Emma', 'Mike'],
    'Age': [25, 28, 32],
    'Height': [175, 163, 180],
    'Weight': [70, 55, 75]
}

df = pd.DataFrame(data)

# Извлекаем столбцы типа int
int_columns = df.select_dtypes(include='int')

print(int_columns)
    

В этом примере мы используем метод select_dtypes с параметром include, чтобы указать тип данных 'int'. Результатом будет DataFrame, содержащий все столбцы типа int.

Вывод

В этой статье мы рассмотрели несколько способов извлечения столбцов из DataFrame в библиотеке Pandas. Мы использовали оператор доступа к столбцам ([]), методы loc, iloc, filter, а также методы get и select_dtypes. Каждый из этих способов имеет свои особенности и применение.

Важно понимать, что извлечение столбцов из DataFrame - это всего лишь одна из многих операций, которые можно выполнять с помощью библиотеки Pandas. Более подробную информацию о других операциях и функциях вы можете найти в официальной документации библиотеки.

Видео по теме

Columns Operation in Python # How to extract required columns from Dataset

How to Remove a Column From a Data Frame in Pandas (Python)

Extract columns from Pandas DataFrame (Python)

Похожие статьи:

📚 Как читать файл Excel в pandas: пошаговое руководство

Как извлечь столбцы из таблицы данных в pandas

Как добавить строку в dataframe pandas? 🐼