🐼 Как проверить nan в pandas: простой способ

Чтобы проверить наличие значения NaN (Not a Number) в объекте pandas, вы можете использовать метод isnull(). Этот метод вернет DataFrame или Series того же размера с логическими значениями - True для ячеек, содержащих NaN, и False - для остальных.


import pandas as pd

# Создание DataFrame с NaN значениями
data = {'A': [1, 2, None, 4, 5],
        'B': [None, 2, 3, None, 5]}
df = pd.DataFrame(data)

# Проверка наличия NaN значений
result = df.isnull()
print(result)

Детальный ответ

Как проверить NaN в библиотеке pandas

В библиотеке pandas, NaN (Not a Number) используется для представления отсутствующих или некорректных значений в данных. Проверка наличия NaN в столбцах или строках фрейма данных является важной задачей при анализе данных. В этой статье мы рассмотрим несколько способов проверки на NaN с использованием библиотеки pandas.

1. Метод isna()

Метод isna() используется для проверки, содержит ли каждый элемент фрейма данных NaN или нет. Он возвращает фрейм данных той же формы, что и исходный, с булевскими значениями, где True означает наличие NaN, а False - отсутствие NaN.

import pandas as pd

# Создание примера фрейма данных
data = {'A': [1, 2, float('nan'), 4],
        'B': [5, float('nan'), 7, 8],
        'C': [float('nan'), 10, 11, 12]}
df = pd.DataFrame(data)

# Проверка наличия NaN
result = df.isna()
print(result)

Результат выполнения кода:

A B C 0 False False True 1 False True False 2 True False False 3 False False False

В этом примере, первый столбец содержит NaN в третьей строке, второй столбец содержит NaN во второй строке, и третий столбец содержит NaN в первой строке. Таким образом, результирующий фрейм данных содержит True в соответствующих позициях.

2. Метод isnull()

Метод isnull() является синонимом метода isna() и выполняет ту же функцию - проверку наличия NaN в фрейме данных. Он также возвращает фрейм данных с булевскими значениями.

3. Метод notna()

Метод notna() выполняет обратную функцию методам isna() и isnull(). Он возвращает фрейм данных с булевскими значениями, где True обозначает отсутствие NaN, а False - наличие NaN.

4. Метод isnan()

Метод isnan() является аналогичным методу isna(), но может использоваться только с одним столбцом (последовательностью). Он возвращает булевское значение, указывающее, содержит ли последовательность NaN или нет. Если последовательность содержит хотя бы один NaN, возвращается True, иначе - False.

import pandas as pd

# Создание примера столбца данных
data = [1, 2, float('nan'), 4]
s = pd.Series(data)

# Проверка наличия NaN
result = pd.isna(s)
print(result)

Результат выполнения кода:

0 False 1 False 2 True 3 False dtype: bool

В этом примере, третий элемент последовательности содержит NaN, поэтому результатом является True для этого элемента.

5. Метод dropna()

Если вам нужно удалить строки или столбцы, содержащие NaN, вместо проверки наличия NaN, вы можете использовать метод dropna(). Он удаляет строки или столбцы с хотя бы одним NaN значением из фрейма данных. Метод dropna() возвращает новый фрейм данных без NaN значений.

import pandas as pd

# Создание примера фрейма данных
data = {'A': [1, 2, float('nan'), 4],
        'B': [float('nan'), 6, 7, 8],
        'C': [9, 10, 11, 12]}
df = pd.DataFrame(data)

# Удаление строк с NaN
result = df.dropna()
print(result)

Результат выполнения кода:

A B C 2 3 4.0 5

В этом примере, вторая строка содержит NaN во втором столбце, поэтому она удаляется из исходного фрейма данных.

Это были некоторые способы проверки наличия NaN в библиотеке pandas. Проверка наличия NaN может быть полезной при фильтрации данных и выполнении других операций с данными. Работа с NaN - важный аспект работы с данными, и понимание методов для его проверки поможет вам справиться с этой задачей.

Видео по теме

ПРАКТИКА Pandas | NaN, Null | Работа с пропусками в Pandas | МАШИННОЕ ОБУЧЕНИЕ

Check For Null Values NaN In Dataframe Python Pandas

Датафреймы pandas. Пропуски данных

Похожие статьи:

🐼 Как проверить nan в pandas: простой способ