Как удалить строчки в pandas: простые шаги и подсказки 💻🗑️

Чтобы удалить строки в библиотеке pandas, вы можете использовать метод drop().

import pandas as pd

# Создание DataFrame
data = {'Name': ['John', 'Emma', 'Alex'],
        'Age': [25, 28, 30],
        'City': ['Moscow', 'London', 'New York']}

df = pd.DataFrame(data)

# Удаление строк с индексами 0 и 2
df = df.drop([0, 2])

print(df)

В этом примере, метод drop() используется для удаления строк с индексами 0 и 2 в DataFrame 'df'.

Детальный ответ

Привет, студенты!

Сегодня мы поговорим о том, как удалить строки в библиотеке Pandas. Мы рассмотрим несколько методов, чтобы вы могли выбрать наиболее подходящий для своих нужд.

Метод drop()

Первый метод, о котором мы поговорим - это метод drop(). Он позволяет удалить строки по индексу или условию.

import pandas as pd

# Создаем DataFrame
data = {'Имя': ['Алексей', 'Мария', 'Иван', 'Екатерина'],
        'Возраст': [25, 30, 35, 40],
        'Город': ['Москва', 'Петербург', 'Екатеринбург', 'Казань']}

df = pd.DataFrame(data)

# Удаляем строки по индексу
df.drop(1, inplace=True)  # Удаляем строку с индексом 1

# Удаляем строки по условию
df.drop(df[df['Город'] == 'Москва'].index, inplace=True)  # Удаляем строки, в которых значение столбца 'Город' равно 'Москва'

print(df)

Метод drop() имеет параметр inplace=True, который указывает, что изменения следует применить к исходному DataFrame. Если вы не укажете inplace=True, то будет создан новый DataFrame без удаленных строк.

Метод dropna()

Если в вашем DataFrame есть строки с пропущенными значениями, то вы можете удалить эти строки с помощью метода dropna().

import pandas as pd
import numpy as np

# Создаем DataFrame с пропущенными значениями
data = {'Имя': ['Алексей', 'Мария', np.nan, 'Екатерина'],
        'Возраст': [25, 30, 35, np.nan],
        'Город': ['Москва', 'Петербург', np.nan, 'Казань']}

df = pd.DataFrame(data)

# Удаляем строки с пропущенными значениями
df.dropna(inplace=True)

print(df)

В результате выполнения этого кода, все строки с хотя бы одним пропущенным значением будут удалены.

Метод query()

Если вам нужно удалить строки согласно определенному условию, вы можете использовать метод query().

import pandas as pd

# Создаем DataFrame
data = {'Имя': ['Алексей', 'Мария', 'Иван', 'Екатерина'],
        'Возраст': [25, 30, 35, 40],
        'Город': ['Москва', 'Петербург', 'Екатеринбург', 'Казань']}

df = pd.DataFrame(data)

# Удаляем строки, где возраст больше 30
df = df.query('Возраст <= 30')

print(df)

В данном примере мы используем метод query() для удаления строк, где возраст больше 30. Результатом будет DataFrame, содержащий только строки, которые удовлетворяют условию.

Метод loc[]

Наконец, вам доступен метод loc[], позволяющий удалить строки по индексу или условию. Он предоставляет более гибкий способ удаления строк.

import pandas as pd

# Создаем DataFrame
data = {'Имя': ['Алексей', 'Мария', 'Иван', 'Екатерина'],
        'Возраст': [25, 30, 35, 40],
        'Город': ['Москва', 'Петербург', 'Екатеринбург', 'Казань']}

df = pd.DataFrame(data)

# Удаляем строки по индексу
df = df.loc[df.index != 1]  # Удаляем строку с индексом 1

# Удаляем строки по условию
df = df.loc[df['Город'] != 'Москва']  # Удаляем строки, в которых значение столбца 'Город' равно 'Москва'

print(df)

Метод loc[] позволяет указывать условия для удаления строк и изменять DataFrame сразу же.

И это все, что нужно знать о том, как удалить строки в библиотеке Pandas. В данной статье мы рассмотрели методы drop(), dropna(), query() и loc[], каждый из которых может быть использован в зависимости от вашей конкретной задачи.

Надеюсь, эта информация окажется полезной для вас! Удачи в изучении Pandas!

Видео по теме

Датафреймы pandas. Удаление строк

Pandas Базовый №5. Операции со строками

Pandas Базовый №4. Операции со столбцами DataFrame

Похожие статьи:

Как удалить строчки в pandas: простые шаги и подсказки 💻🗑️