🐼 Панды: Как удалить строки с пустыми значениями

Чтобы удалить строки с пустыми значениями в pandas, вы можете использовать метод dropna(). Этот метод удаляет все строки, содержащие хотя бы одно пустое значение.

import pandas as pd

# Создаем DataFrame
data = {'Имя': ['Анна', 'Петр', 'Иван', 'Мария'],
        'Возраст': [23, None, 30, 45],
        'Город': ['Москва', 'Санкт-Петербург', None, 'Казань']}

df = pd.DataFrame(data)

# Удаляем строки с пустыми значениями
df.dropna(inplace=True)

print(df)

В результате выполнения кода вы получите DataFrame без строк, содержащих пустые значения:

     Имя  Возраст             Город
0  Анна     23.0            Москва
3  Мария    45.0            Казань

Детальный ответ

pandas: как удалить строки с пустыми значениями

Очистка данных является важной задачей в анализе данных. Очень часто в данных встречаются пропущенные или пустые значения. Pandas - это мощная библиотека для работы с данными в Python, и она предоставляет удобные функции для удаления строк с пустыми значениями.

Для начала давайте импортируем библиотеку pandas:


import pandas as pd

Далее нам нужно создать DataFrame с нашими данными. DataFrame - это таблица с метками столбцов и строками, которую предоставляет библиотека pandas:


data = {'Имя': ['Алексей', 'Иван', 'Мария', 'Елена'],
        'Возраст': [25, 30, None, 28],
        'Email': ['alexey@example.com', None, 'maria@example.com', 'elena@example.com']}
df = pd.DataFrame(data)
print(df)

Вывод:

      Имя  Возраст                Email
0  Алексей     25.0    alexey@example.com
1     Иван     30.0                 None
2    Мария      NaN    maria@example.com
3    Елена     28.0  elena@example.com

Как видите, наш DataFrame содержит строки с пустыми значениями в столбцах "Возраст" и "Email". Чтобы удалить строки с пустыми значениями, мы можем использовать метод dropna() библиотеки pandas.


df = df.dropna()
print(df)

Вывод:

      Имя  Возраст                Email
0  Алексей     25.0    alexey@example.com
3    Елена     28.0  elena@example.com

Теперь мы удалили строки с пустыми значениями и получили новый DataFrame без этих строк.

Удаление строк с пустыми значениями в определенных столбцах

В некоторых случаях вам может потребоваться удалить строки с пустыми значениями только в определенных столбцах. Для этого вы можете указать имена столбцов в методе dropna().


df = df.dropna(subset=['Email'])
print(df)

Вывод:

      Имя  Возраст                Email
0  Алексей     25.0    alexey@example.com
2    Мария      NaN    maria@example.com
3    Елена     28.0  elena@example.com

Как видите, теперь мы удалили строки с пустыми значениями только в столбце "Email", а строки с пустыми значениями в столбце "Возраст" остались.

Замена пустых значений

Кроме удаления строк с пустыми значениями, pandas также предоставляет возможность заменять пустые значения на заданное значение с помощью метода fillna().

Давайте заменим пустые значения в столбце "Возраст" на среднее значение этого столбца:


average_age = df['Возраст'].mean()
df['Возраст'] = df['Возраст'].fillna(average_age)
print(df)

Вывод:

      Имя  Возраст                Email
0  Алексей     25.0    alexey@example.com
2    Мария     26.5    maria@example.com
3    Елена     28.0  elena@example.com

Теперь пустые значения в столбце "Возраст" были заменены на среднее значение этого столбца.

В этой статье мы рассмотрели, как удалить строки с пустыми значениями с помощью библиотеки pandas. Мы также узнали, как удалять строки с пустыми значениями только в определенных столбцах и как заменять пустые значения на заданное значение. С использованием этих методов вы сможете очистить и обработать данные для дальнейшего анализа.

Видео по теме

Датафреймы pandas. Удаление строк

Удаление пустых строк и столбцов в Excel

Pandas Базовый №5. Операции со строками

Похожие статьи:

Как работает Agg Pandas? 🐼

🐼 Панды: Как удалить строки с пустыми значениями